课程代码:121063A Course Code:121063A
课程名称:数据挖掘与统计应用 Course Name:Data Mining and Application
学时:48=32+16 Periods:48=32+16
学分:3 Credits:3
考核方式:考查 Assessment:Examination
先修课程:统计学、计算机基础 Preparatory Courses:Statistics, Basic for
Computer
《数据挖掘与统计应用》课程是统计学专业和数学专业(金融数学方向)学生的专业必修课之一。该课程是针对统计学院所有专业本科学生开设的,其特点是不以数学理论和推导为主,而是在学生了解数据挖掘的基本概念和基本理论的基础上,介绍典型数据挖掘方法的基本思路和算法,教会学生能够利用数据挖掘软件分析实际数据。本课程主要以国际通用权威数据挖掘软件为主要教学工具,以实际工作中的数据进行实训教学。达到的教学目标是:增强学生实际动手解决问题的能力,学会利用数据挖掘软件处理实际数据。
本课程的主要内容包括两大部分:一是数据挖掘算法部分,包含联机数据分析与数据仓库、数据预处理、探索性数据分析、变量选择以及关联、聚类、分类、异常值侦测、时序等经典数据挖掘算法等。其理论部分只介绍这些方法的基本思路与算法,授课的重点在于每一种挖掘算法,包括:每种算法的基本思路、应用前提、算法评判标准、软件的实现及输出结果的理解和解释,并能给出结论;二是数据挖掘软件的应用——主要讲述一种数据挖掘软件并结合实际数据进行分析。
This course deals with the advanced study of intelligent data mining tools that are used to mine patterns in very large databases. The focus is on theoretical, mathematical and statistical foundations of data mining as well as the applications of data mining to various business applications. Including: decision tree, ensemble methods, graphical models for discovering knowledge, fast mining of association rules, inductive and deductive reasoning for data mining, and mathematical foundations of data mining. Data mining applications in finance, economics and business will be emphasized.