《数据挖掘》实验教学大纲
课程名称:
| 数据挖掘
|
|
|
课程编号:
| 408402
| 436415
|
|
适用专业:
| 计算机科学与技术
| 软件工程
|
|
总 学 分:
| 3
| 3
|
|
总 学 时:
| 48
| 48
|
|
其中实验学时
| 12
| 12
|
|
一、实验课程性质、目的与任务
《数据挖掘》课程实验与《数据挖掘》理论课程密切结合,是以理解数据挖掘技术原理为主的四年制本科计算机专业学生的实验课程。所涉及的计算机知识面较广,具有较强的综合性。通过本门课程的学习,学生应掌握数据挖掘的基本概念,了解数据挖掘的定义和功能以及实现数据挖掘的主要步骤和具体实现方法,初步掌握数据挖掘的算法。使同学们在学习本课程后,能实现简单的数据挖掘算法编程,了解实现数据挖掘的具体操作。为进一步研究学习和从事实践技术工作奠定基础。
通过本实验课程,应达到以下几个教学目的:
1. 掌握一种数据挖掘软件。
2. 理解关联规则挖掘的方法和原理
3. 理解分类和预测的方法和原理
4. 理解聚类分析的方法和原理。
二、实验教学基本要求
要求掌握最基本的数据挖掘方法,如:Apriori挖掘、决策树分类、因子分析、聚类分析、神经网络等。
上机实验要求:
1、准备好上机所需的数据;
2、上机设计进行数据挖掘的过程;
3、上机结束后,应整理出实验报告,实验报告应包括以下内容:实验项目名称;挖掘过程;挖掘结果;对挖掘结果作出分析。
三、实验项目与类型:
序号
| 实验项目
| 学时
| 实验性质
| 备注
|
验证
| 综合
| 设计
| 研究
探索
| 必做
| 选做
|
1
| 基本操作
| 2
| √
|
|
|
| √
|
|
2
| 关联规则挖掘
| 2
| √
|
|
|
| √
|
|
3
| 分类:决策树
| 2
| √
|
|
|
| √
|
|
4
| 因子分析
| 2
| √
|
|
|
| √
|
|
5
| 聚类分析
| 2
| √
|
|
|
| √
|
|
6
| 神经网络
| 2
| √
|
|
|
| √
|
|
| 合计
| 12
| 6
|
|
|
| 6
|
|
四、实验教学内容
实验1 基本操作 2学时
实验目的
1、理解对大型的、复杂的和信息丰富的数据集进行分析的必要性;
2、明确数据挖掘过程的目标和首要任务;
3、描述数据挖掘技术的起源;
4、了解数据挖掘软件Spss-clementine的基本功能。
实验仪器及材料
1、计算机;
2、Spss-Clementine数据挖掘软件。
实验原理
1、Spss-clementine数据挖掘的工作原理。
实验内容
1、数据挖掘概述;
2、数据挖掘的起源;
3、数据挖掘的过程;
4、数据挖掘软件Spss-Clementine的基本功能和操作。
实验2 关联规则挖掘 2学时
实验目的
1、解释关联规则技术的建模特性。
2、分析大型数据库的基本特性。
3、描述Apriori算法,并通过示例来解释算法的所有步骤。
4、通过案例了解关联分析的流程。
实验仪器及材料
1、计算机;
2、Spss-Clementine数据挖掘软件。
实验原理
1、关联规则挖掘的工作原理。
实验内容
1、购物篮分析
2、APRIORI算法
3、案例分析
实验3 分类:决策树 2学时
实验目的
1、分析解决分类问题的基于逻辑的方法的特性。
2、描述决策树和决策规则在最终分类模型中的表述之间的区别。
3、通过案例了解决策树技术的实际应用。
实验仪器及材料
1、计算机;
2、Spss-Clementine数据挖掘软件。
实验原理
1、分类决策树的工作原理。
实验内容
1、决策树
2、C4.5算法:生成一个决策树
3、决策树案例
实验4 因子分析 2学时
实验目的
1、概述因子分析。
2、了解数据挖掘中的因子分析技术。
3、通过案例讲解掌握因子分析的实际操作流程。
实验仪器及材料
1、计算机;
2、Spss-Clementine数据挖掘软件。
实验原理
1、因子分析的工作原理。
实验内容
1、读入数据
2、设置字段属性
3、对数据进行因子分析
4、显示经过因子分析后的数据表
实验5 聚类分析 2学时
实验目的
1、了解类有不同表示法和相似度的不同量度标准。
2、用相似度的单链接或全链接度量标准实现凝聚算法。
3、推导分区聚类的K-平均法并分析其复杂性。
4、通过案例讲解掌握聚类分析。
实验仪器及材料
1、计算机;
2、Spss-Clementine数据挖掘软件。
实验原理
1、聚类分析的工作原理。
实验内容
1、读入数据
2、为数据设置字段格式
3、生成聚类分析数据流
4、图形化输出各个类的组成情况
5、将模型的结果结点连入数据流
6、设置图形输出结点
实验6 神经网络 2学时
实验目的
1、认识神经网络的基本组成以及它们的属性和功能。
2、描述神经网络通常执行的学习任务,如模式关联、模式识别、估计、控制以及过滤
3、了解神经网络的基本流程。
4、通过案例掌握神经网络操作技术。
实验仪器及材料
1、计算机;
2、Spss-Clementine数据挖掘软件。
实验原理
1、神经网络的工作原理。
实验内容
1、读入数据
2、计算促销前后销售额的变化率
3、为数据设置字段格式
4、神经网络学习过程
5、为训练网络建立评估模型
6、模型预测
五、考核方法
1.教师对学生实验过程完成情况进行详细登记,记入实验成绩中。
2.学生完成实验后按要求撰写实验报告,根据实验报告确定每次实验的等级。
3.实验成绩按20%比例计入课程期评总成绩中。
六、实验指导书及主要参考书目
[1] 《数据挖掘原理与应用——SQL Server 2005数据库》,Zhaohui Tang著,清华大学出版社
[2]《数据挖掘》课程实验教学指导书,李春林,河北经贸大学.
大纲撰写人:彭剑
大纲审阅人:袁辉勇
2012.6