一、开课单位:理学院 课程中文名称:数据挖掘
课程编号:S010069【由各学院编号】课程英文名称:Data Mining
大纲审定人:郑瑞坤 大纲编写人:吴颖丹
二、课程类别:[√]必修课 [ ]选修课
三、总学时:48 学分数:3
开课学期:2020-2021 第一学期 考核方式:考查
四、授课对象:2020应用统计
五、预备知识要求:概率论与数理统计
六、教材及参考书目(讲义):
统计学习方法(第二版),李航,清华大学出版社,2012
七、课程简介:
数据挖掘技术是应用统计的专业课程,本课程以数据挖掘为主要内容,讲述实现数据挖掘的各主要功能、挖掘算法和应用,并通过对实际数据的分析更加深入地理解常用的数据挖掘模型。掌握大型数据挖掘软件的使用,培养学生数据分析和处理的能力。
八、教学目标:
本课程主要学习的内容包括数据预处理、关联分析、分类与预测、聚类分析等内容。
通过本课程的学习,要求研究生掌握数据挖掘的基本理论和方法,为学习后继课程开展科学研究、进行生产实践打好基础。
九、教学内容、教学方式及学时分配:
周次 |
学时 |
教学内容(包括理论讲授、研讨、威尼斯87978797实践等) |
教学方式(线下、线上等) |
6 |
4 |
第一章 统计学习方法论 |
线下 |
7 |
4 |
第二章 感知机 |
线下 |
8 |
4 |
第三章 K近邻法 |
线下 |
9 |
4 |
第五章 决策树 |
线下 |
10 |
4 |
第六章 logistic回归和最大熵模型 |
线下 |
11 |
4 |
第七章 支持向量机 |
线下 |
12 |
8 |
第八章 提升方法 实例讲解与实践 |
线下 |
13 |
8 |
第十四章 聚类分析 实例讲解与实践 |
线下 |
14 |
4 |
第十五章 主成分分析 |
线下 |
15 |
4 |
总结复习与展开 |
线下 |
合计 |
48 |
|
|
其中:理论课课时: 研讨课课时: 威尼斯87978797实践环节课时: |