大数据管理与应用人才培养方案

1. 人才培养目标

“大数据管理与应用”专业,培养掌握管理学基本理论,熟悉现代信息管理技术与方法,善于利用商务数据去定量化分析,并能最终实现智能化商业决策的综合型人才。在专业知识方向,侧重于大数据环境下商务数据的相关应用处理,与当前社会企业需求现实结合更为紧密,因此对学生相关新数据分析工具和方法的掌握要求较高,并适应海量数据计算的实际应用要求;在专业方向定位上,大数据管理与应用侧重于数据处理这一专门领域,撇除了传统信息管理与信息系统专业中信息系统分析与设计和其他信息处理类课程,如信息咨询、信息资源管理等,相反,在数据处理方向,对数据获取、数据整理、数据存储、数据分析与挖掘和数据可视化等商务数据处理五大关键环节专门进行深入研究和应用探索。

1.1 就业岗位与就业范围

序号

主要就业岗位

岗位主要工作任务

1

数据分析师

1、基于业务需求,规划分析思路,完成从数据提取、数据清洗、数据分析和报告产出的整个流程,为业务问题原因排查及解决方案提供数据支撑;

2、在深入理解业务基础上,结合业务目标和问题,构建分析模型,为数据化运营提供系统化的解决方案;

3、主动分析并研究业务数据,基于数据分析结果,为管理层和业务部门提供商业策略分析和业务优化建议;

4、基于业务分析经验,将分析结果进行可视化输出。

2

商业智能分析师

1、负责数据分析与挖掘模型的需求分析、建模;   

2、运用BI工具,根据场景需求,投递BI数据需求,研发可视化界面;  

3、熟悉ETL数据处理流程以及ETL的调度流程;   

4、参与数据平台日常监控维护;

3

数据产品经理 

1、根据实际业务需求开发数据产品项目;

2、主导大数据产品项目规划与管理;

3、为其他项目组提供大数据技术指导及分析手段支持。

1.2 培养规格要求

本专业是一门涉及管理学、统计学、计算机科学等多领域的交叉学科。大学本科四年期间,本专业学生主要学习管理学、应用数学、统计学、计算机科学的基本理论和基本知识,打好坚实的数学基础,受到系统而扎实的计算机编程训练,具备较强的数据分析和信息处理能力,能在大数据科学与工程技术领域从事数据分析管理、系统设计开发、大数据处理应用、科学研究等方面的工作,具备综合运用所学知识分析和解决实际问题的能力。

本专业强调培养具有多学科交叉能力的大数据人才。该专业重点培养具有以下三方面素质的人才:一是理论性的,主要是对数据科学中模型的理解和运用;二是实践性的,主要是处理实际数据的能力。三是应用性的,主要是利用大数据的方法解决具体行业应用问题的能力。

本专业主要学习常用机器学习编程语言(推荐R语言)、大数据导论、数据库应用技术、Excel数据获取与处理、大数据安全管理、数据采集与网络爬虫、数据分析与可视化、商务智能、数据挖掘、社会网络分析、文本挖掘技术与应用、互联网金融,具备大数据分析与挖掘的实际工作能力,具有创新意识及进一步发展专业技能的良好基础。

本专业毕业生应获得以下几方面的知识和技能:

1.具有比较扎实的计算机基本理论与技术、数据挖掘的常用算法;

2.掌握当前使用最广泛的数据挖掘编程语言R语言;

3.熟悉商务智能和社会网络分析技术,并具有严密的逻辑分析能力;

4.具备数据的处理、抽取、清洗、转换等能力;

5.掌握机器学习、文本挖掘、数据可视化等技术与应用;

6.逻辑思维能力强,具备较强的文档编写和良好的沟通表达能力。

2 大数据管理与应用专业课程设置

2.1 主干课程(示例课程以R语言为主线,也可以Python替换相关课程)

1.大数据导论

课程能力目标:掌握数据采集、网络爬虫、数据清洗和分析的方法及常用工具,具备能胜任数据清洗、数据存储、数据分析与挖掘的基本技能。

课程主要内容:大数据相关的基础概念,大数据的国内外发展状况、技术架构以及大数据分析的基础知识,数据采集、网络爬虫,数据分析、挖掘的流程、方法、工具等。

2.大数据安全管理

课程能力目标:掌握大数据安全的关键技术和应用实践。

课程主要内容:各领域面临的大数据安全威胁和需求;大数据安全的科学内涵和技术研究方向;大数据安全的关键技术和应用实践;大数据安全的产业动态、法律法规、标准研究;大数据安全的发展趋势。

3.大数据数学基础(R语言描述)

课程能力目标:掌握数据微积分、统计学、线性代数、数值计算、应用多元统计分析等数学基础知识。

课程主要内容:微积分基础,包括极限、导数、微分、不定积分与定积分及其应用;线性代数基础,包括行列式、矩阵的运算、特征分解、奇异值分解;统计学基础,包括数据分布特征、概率论、随机变量的数字特征、参数估计、假设检验;数值计算基础,包括插值方法、函数逼近与拟合、非线性方程(组)求根;常用多元统计分析方法,包括回归分析、聚类分析、判别分析、主成分分析、因子分析和典型相关分析。所有例子都结合R语言进行求解分析。

4.Excel数据获取与处理

课程能力目标:掌握Excel在数据获取与处理中的应用。

课程主要内容:熟悉Excel工作簿、工作表、单元格;各种类型的数据的输入;美化工作表;使用Excel获取文本数据;使用Excel获取网站数据;使用Excel获取MySQL数据库中的数据;对数据进行排序;筛选数据中的关键信息;对数据进行分类汇总;制作透视表;日期和时间函数、数学函数、统计函数的应用;宏的应用。

5.R语言编程基础

课程能力目标:掌握R语言编程基础及其知识的应用。

课程主要内容:R语言的编译环境、R包的获取及加载、R包的内置数据;R的数据对象与数据读写、数据集基本处理、函数与控制流、初级绘图、高级绘图;Rattle工具的使用。

6.数据挖掘(R语言描述)

课程能力目标:掌握基于R语言的数据挖掘技术及行业应用。

课程主要内容:数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理,数据挖掘的5大类算法,包括分类与预测、聚类分析、关联规则、智能推荐和时序模式等在R语言中的使用方法,数据挖掘技术在经济管理、互联网金融、电子商务等行业的应用案例分析。

7.文本挖掘技术及应用(R语言)

课程培养目标:掌握如何发现文本的内容特征及具体实现过程。

课程主要内容:文本挖掘技术及基本原理,并通过一个案例用R语言实现其具体过程。

8.社会网络分析

课程培养目标:掌握社会网络分析的基本原理和理论

课程主要内容:社会网络分析的基本原理和理论、社会网络资料类型和收集方法、网络分析的各种技术与方法、社会网络分析的应用。

9.Power BI数据分析与可视化

课程培养目标:掌握数据分析的流程和Power BI数据分析的应用,熟悉使用Power BI解决企业实际问题的方法。

课程主要内容:Power BI的安装过程、界面、视图和窗格;使用Power BI获取数据,如Excel、Web、MySQL等数据;通过M语言对数据进行预处理的方法,如数据清洗、数据集成、数据变换和数据归约;使用DAX语言进行数据建模,建模操作包括新建表和计算列、整理表间关系、新建度量值、上下文操作和钻取操作等;使用Power BI进行分析与可视化,按照对比分析、结构分析、相关分析、描述性分析、KPI分析等方法进行分类以及介绍对应适用的可视化图表;数据分析报告的基本概念,以及展示一份数据分析报告的实例;使用Power BI对数据进行部署,包括发布数据和仪表板的创建与使用方法;实现一个完整的商务数据分析综合应用。

10.商务数据分析实战(R语言)

课程培养目标:掌握R语言数据分析的基础知识和商务领域中应用。

课程主要内容:商务领域不同方向项目的数据分析方法,具体内容包括R语言数据分析概述、商品零售购物篮分析、航空公司客户价值分析、财政收入预测分析、金融服务机构资金流量预测、P2P信用贷款风险控制、电子商务网站智能推荐服务、电商产品评论数据情感分析。