数据科学与大数据技术(理学)校企合作办学建设方案

第1章 合作背景

国家十三五规划纲要明确提成“实施国家大数据战略,推进数据资源开放共享”,为我国在大数据领域的未来发展绘制了宏伟的蓝图,开启了我国大数据发展的新时代。教育部《高等学校人工智能创新行动计划》及国务院颁布的《新一代人工智能发展规划》,责成科技司、基教司、职成司、高教司、地方各级教育行政部门大力推动人工智能、大数据等新技术在教育教学中的深入应用,推进信息技术与高等教育教学深度融合。从发布对人工智能、大数据等新技术与教育结合的指导性文件到直接扶持建设相关教学项目,为高校进行教学改革和升级教学手段和方式指明了新的方向。

大数据及人工智能产业的发展对人才提出了新的需求,大数据人工智能专业人才的培养是新一轮科技较量的基础,国内各高校在积极进行学术研究的同时,已经将大数据人工智能教育纳入培养体系。调查发现各高校在培养大数据人才培养过程中存在诸多困难:

(一)学习门槛高

数据科学是一门交叉学科,除了计算机相关知识,还需要有统计学、数学基础,以及一定业务知识。目前,各高校专门研究此领域的老师比较少,这无疑增加了学校培养学生的难度。

(二)动手机会少

要进行大数据分析,首先必须有充足的高质量数据和对应的实验设备。然而,多数高校缺少企业项目实战案例和可以用于研究的商业数据,使得学生难以做到学以致用。

(三)人才培养与大数据产业发展脱节

在互联网、政府、金融、电力等各行各业的公司部署都在向大数据全面转型,大数据相关人才十分亟需,大数据专业毕业生作为服务地方产业化、产业数字化发展的重要力量,如果学生们缺乏对多产业的了解,不仅会导致他们在工作中沟通困难,还很难发挥自身专业技能。大数据人才培养应与地方大数据产业建立互动,更具有针对性培养,以需求为导向建立有效的人才引进和培养机制,培养学生满足“零距离”上岗的能力。

第2章 合作模式

2.1 合作办学模式

一、企方在合作中主要承担的分工

(1)将领先的大数据行业品牌及其完整课程体系、教材体系引入学院,负责核心课程的教授,并投入专业教师团队和学院一同进行大数据与传统专业的融合课程、实训案例、教学资源库打造建设等;

(2)承担大数据实验教学平台建设及费用;

(3)承担实验项目案例集、实验数据集建设;

(4)传统专业改造建设实验班课程设计;

(5)承担6到8门核心课程教学任务及实训;

(6)承担学生认知实习及毕业实习;

(7)双师型教师队伍培养建设;

(8)招生支持,协助学院对招生团队进行培训、辅助招生工作;

(9)学生就业指导及企业对接。

二、校方在合作中主要承担的分工

(1)向教育主管部门申请开设大数据专业申请,在正式获得批复前,可将现有相关专业改造成大数据专业相关方向。相关申请及专业和改造工作可由公司协助进行。

(2)招生工作:提供合作专业(或专业方向)招生指标、联合招生宣传。

(3)基础设施建设:提供教学和办公场地、水电、基本教学设备(电脑、网络等);提供基础网络环境、基础形象装修等基础设施。

(4)公共课教学:负责大学英语、大学数学、思政等公共课教学;负责专业基础课教学等课程。

(5)公共服务:学生日常管理等公共服务。

三、收费

根据校企共建专业的实际需求,双方协商相关费用情况。

四、认证考试

学生在三年或四年的专业学习接近尾声时,公司可在学生自愿报名的情况下,组织学生参加证书考试。

2.2 专业共建模式

共同建设大数据实验室,建设一流大数据实验案例、实验数据集、实验指导手册。

一、公司建设内容

(1)大数据实验室解决方案建设支持:协助高校建立符合市场、企业需求的大数据实验室解决方案。

(2)大数据实验师资培训:定期或不定期举行大数据实验师资培训。

(3)大数据协同创新应用中心建设:不定期进行大数据技术发展应用研讨;可承接国家或省市级科研课题;可以承接大数据相关项目等。

(4)双师建设:提供高校教师培训以及企业挂职锻炼,参与项目开发,帮助学校打造双师型教师队伍。

(5)毕业实习:由企业提供实习项目,学院组织,主要通过线上和线下混合模式完成实习并提交实习报告。

(6)就业支持体系,提供公司生态圈上下游企业资源等企业资源为学生就业进行指导支持。

二、合作院校建设内容及收获

(1)大数据实验室建设:负责大数据实验室建设的场地、软硬件等投入。

(2)院校收获:品牌授权、大数据专业办学实力增强,有利于招生竞争与专业良性发展。

三、费用

大数据实验室建设费用根据学院计划人数由双方商定,相关参数详情请参见第6章实验室建设详细报价单。

第3章 数据科学与大数据技术学科建设目标

3.1 理论与实践相结合

实践教学是在一定理论指导下,通过引导学习者的实践活动,从而传承实践知识,形成技能,发展实践能力,提高综合素质的教学活动。目前,高校教学体系的设置由于诸多限制因素,偏向过多的理论教学,往往出现课程设置与企业实际应用切合度不高,学生无法把理论转化为实践应用技能。课程内容设置方面看是繁多又各自为“政”,课程冗余、缺漏、体系不健全。

泰迪科技根据高校实践教学中的痛点,首次提出“鱼骨教学法”的概念。以企业真实需求为导向,学生学习技能仅仅围绕企业实际应用需求,将学生掌握的理论知识,通过企业案例的形式进行衔接,达到知行合一,以用促学的目的。

                                               1.png

图表 1 鱼骨教学法

3.2 培养符合社会需求的应用型人才为导向

符合社会及企业需求的高端大数据人才培养是大数据挖掘学科建设培养的重要目标。当今社会已经进入了大数据的时代,大数据的应用正在逐步从互联网、金融扩展到教育、政务、交通物流、医疗健康等各大社会和经济领域,,深刻影响中国未来社会和经济的发展进程。IDC预计,全球大数据技术及服务市场2016年收入将达238亿美元。据麦肯锡预测,预计到2020年,美国的大数据可创造3800亿到6900亿美元的价值。大数据产业目前还处在非常初级的阶段,未来具有极大的发展潜力。对人才培养也提出了更高的要求,既要考虑当下社会的实际需求,又要前瞻性的学习一些新理论与技术,在这样的思想指导下才能培养符合社会需求的应用型人才。

3.3 围绕数据科学与大数据技术闭环全面提升学生素质

大数据学科建设应该以数据挖掘技术为核心,紧紧围绕大数据挖掘闭环的流程进行教学,才能够使学生从宏观上理解大数据挖掘避免一叶障目弊端。高校现有的大数据挖掘课程集中在已经有的数据基础上如何进行建模分析、调整参数使得模型的结果更加准确。但是,完整的大数据挖掘教学体系却是一个容易被忽视的部分。

泰迪大数据挖掘学科建设围绕大数据挖掘的整个流程,从数据采集、数据迁移、数据挖掘、专题应用及数据可视化覆盖完整的数据挖掘流程,涵盖企业应用中的各个环节,并且可以提供相应的实验教学软件及配套教学资源。

 

3.4 打造数据科学与大数据技术一站式教学服务平台

一站式教学服务平台的概念是在深刻理解高校学科建设及存在的若干问题上提出。围绕着学科建设的各个方面,从专业开设、课程设置、师资培养、教学资源、实验环境、学生实训实习及就业创业等环节,提供完整的产品体系,满足高校学科建设及人才培养不同阶段的需要。

²  提供教学软件,从数据采集、数据迁移、数据挖掘、实践数据开发实训等;

²  提供教学资源,包括教材、PPT、数据、代码、视频、行业案例库、泰迪云课堂等;

²  提供实教学服务,包括实践型师资培养、学生校内实训、校外实训、创新创业辅导等。

第4章 数据科学与大数据技术学科建设思路

4.1 人才培养模式

泰迪大数据学科建设人才培养模式紧跟时代发展需求,即考虑基础的知识传授和技能教学,又前瞻性的考虑时代趋势。依托泰迪科技企业的专业优势,从市场实际需求与高校理论方面教学相结合,围绕数据挖掘流程各个环节展开国际标准化教学内容。以培育社会企业需要的人才为核心,结合企业相应的案例教学,让学生掌握解决问题是方法,增强学生的实践能力。

4.2 专业设置

数据科学与大数据技术主要培养大数据科学与工程领域的复合型高级技术人才。毕业生具有信息科学、管理科学和数据科学基础知识与基本技能,掌握数据科学与技术所需要的计算机、网络、数据编码、数据处理等相关学科的基本理论和基本知识,熟练掌握大数据采集、存储、处理与分析、传输与应用等技术,具备大数据工程项目的系统集成能力、应用软件设计和开发能力,具有一定的大数据科学研究能力及数据科学家岗位的基本能力与素质。毕业后能从事各行业大数据分析、处理、服务、开发和利用工作,大数据系统集成与管理维护等各方面工作,亦可从事大数据研究、咨询、教育培训工作。

4.3 课程设置

课程体系架构仍依基础课、专业核心课和选修课三个模块来设计,但在课程内容上有所更新。融入国际化课程内容及英文授课环节,增设数据治理、数据库、商业人工智能、统计机器学习、可视分析、商业模式等核心课程,帮助学生掌握所需要的技术及业务理解能力。选修课主要是为了拓展学生的综合能力和素养,或满足学生的兴趣爱好等,开设社交网络分析、文本分析等相对专业的数据分析课程。在基础理论学习之后,会安排一些广泛应用场景的实用技术如深度学习、图像处理、强化学习课程。结合泰迪自身优势,在实践领域进行深化,采用案例式教学内容。把泰迪的10个行业,超过50多个的案例,有选择有针对性的进行教学,满足不同院校的特色教学需求。

 

4.4 教学资源库

数据学科建设离不开相关的教学资源,丰富多样的教学资源才能满足不同高校的专业特色建设。目前部分高校实践教学资源相对单一、匮乏更偏重于理论资源。优秀的教学资源应该是理论与实践相结合,涉及不同行业如:智能电网、电子商务、移动电信、医疗健康、金融保险等,并提供配套教材、行业案例库、数据、代码、教学PPT、教学视频等资源才能满足教学需求。

4.5 师资培养及教学服务

各院校数据挖掘学科建设首当其冲的困难就是缺少具有高水技术与国际视野的任课老师,也正是由于大数据挖掘作为一个新兴专业教师水平参差不齐,导致院校学科的发展水平和教学水平受到制约。专业的师资团队应该满足具有较高的理论水准同时也具备企业工作经历,不仅有研究机构理论的专家,还要行业机构的实践专家。泰迪讲师团队均具备硕士以上学历,兼具高校和企业工作经历,具有丰富的大型企业数据挖掘应用与咨询经验。

 

4.6 大数据实验室

大数据实验室建设是学科建设落地的重要一环,是人才培养、教学科研的重要场所。泰迪大数据实验室建设将各专业的方向设置与课程设置、教学科研、学生实践及配套教学资源实现完整融合。在功能上围绕大数据挖掘整体流程,贯穿数据采集、数据存储、数据迁移、数据融合、数据挖掘、数据可视化的各个环节的相关教学软件及配套教学资源实现一站式教学服务平台。

第5章 数据科学与大数据技术(理学)人才培养解决方案

5.1 人才培养目标

“数据科学与大数据技术”专业,培养德、智、体、美全面发展,掌握数据科学的基础知识、理论、及技术,包括面向大数据应用的数学、统计,计算机等学科基础知识,数据建模、高效分析与处理, 统计学推断的基本理论、基本方法和基本技能。对自然科学和社会科学等应用领域中大数据的了解,具有较强的专业能力和良好外语运用能力,能胜任数据分析与挖掘算法研究和大数据系统开发的研究型和技术型人才。

5.1.1 就业岗位与就业范围

序号

主要就业岗位

岗位主要工作任务

1

数据采集/爬虫工程师

1、根据业务规划的要求,对各类数据进行收集、整理、录入;

2、负责采集策略设计与优化,提升网页抓取的效率和质量,解决验证码破解、信息精准抽取等技术难题;

3、负责对抓取数据进行日常跟踪,监控爬虫系统运行状态,保证数据准确性。

2

数据挖掘工程师

1、基于业务数据,运用数据分析和数据挖掘的理论和方法,建立业务模型;

2、基于所建立的业务模型,分析和挖掘数据和业务背后的规律;

3、建立策略效果评估机制和监控体系,持续对模型和算法做出合理地调整或改进。

3

算法

工程师

1、根据项目、产品和分析、模型需求,完成数据研究、建模工作;

2、应用完备的统计学/数据挖掘/机器学习等理论知识,对海量异构数据进行融合挖掘;

3、跟踪前沿的算法理论,并且将优秀的算法应用到业务场景中,通过技术创新提升业务价值。

5.1.2 培养规格要求

本专业是一门涉及应用数学、统计学、计算机科学等多领域的交叉学科。大学本科四年期间,本专业学生主要学习应用数学、统计学、计算机科学的基本理论和基本知识,打好坚实的数学基础,受到系统而扎实的计算机编程训练,具备较强的数据分析和信息处理能力,能在大数据科学与工程技术领域从事数据分析管理、系统设计开发、大数据处理应用、科学研究等方面的工作,具备综合运用所学知识分析和解决实际问题的能力。

本专业强调培养具有多学科交叉能力的大数据人才。该专业重点培养具有以下三方面素质的人才:一是理论性的,主要是对数据科学中模型的理解和运用;二是实践性的,主要是处理实际数据的能力。三是应用性的,主要是利用大数据的方法解决具体行业应用问题的能力。

本专业主要学习常用机器学习编程语言(推荐Python语言)、数据库应用技术、Java编程、Java面向对象程序设计、Linux操作系统、分布式数据采集及数据可视化、数据挖掘、智能推荐技术与应用、文本挖掘技术与应用、深度学习技术与应用,具备大数据算法开发与数据挖掘的实际工作能力,具有创新意识及进一步发展专业技能的良好基础。

本专业毕业生应获得以下几方面的知识和技能:

1.具有比较扎实的计算机基本理论与技术、数据挖掘的常用算法;

2.掌握当前使用最广泛的数据挖掘编程语言R或Python;

3.熟悉SQL的计算与存储过程调优,并具有严密的逻辑分析能力;

4.具备数据的处理、抽取、清洗、转换等能力;

5.掌握智能推荐、文本挖掘、深度学习等技术与应用;

6.逻辑思维能力强,具备较强的文档编写和良好的沟通表达能力。

 

5.2 数据科学与大数据技术专业课程设置

5.2.1 主干课程

1.大数据技术基础

课程能力目标:掌握数据采集、网络爬虫、数据清洗和分析的方法及常用工具,具备能胜任数据清洗、数据存储、数据分析与挖掘的基本技能。

课程主要内容:大数据技术与应用相关的基础概念,大数据的国内外发展状况、技术架构以及大数据分析的基础知识,数据采集、网络爬虫,数据分析、挖掘的流程、方法、工具等。

2.数据库应用技术

课程能力目标:掌握MySQL/ORACLE等数据库管理和维护的各种技术,从而达到数据库工程师专业水平。

课程主要内容:MySQL/ORACLE等的基础知识、体系结构、数据库日常维护和操作的相关内容;存储引擎的相关内容,系统优化。

3.Python编程基础

课程能力目标:掌握Python语言编程及数据可视化。

课程主要内容:Python开发环境的搭建、Python基础入门、函数、面向对象编程、实用模块和图表绘制,Python面向对象编程。

4.大数据数学基础(基于Python语言描述)

课程能力目标:结合Python语言,掌握数据科学领域广泛运用的数据微积分、统计学、线性代数、数值计算、应用多元统计分析等数学基础知识。

课程主要内容:微积分基础,包括极限、导数、微分、不定积分与定积分;统计学基础,包括数据分布特征、概率论、参数估计、假设检验;线性代数基础,包括行列式、矩阵的运算、特征分解、奇异值分解;数值计算基础,包括插值方法、函数逼近与拟合、非线性方程(组)求根;常用的多元统计分析方法,包括回归分析、判别分析、聚类分析、主成分分析、因子分析和典型相关分析,所有例子都结合Python进行求解分析。

5.Python数据分析与应用

课程能力目标:掌握用Python进行科学计算、可视化绘图、数据处理,分析与建模。

课程主要内容:数据分析的基本概念和流程; Python数据分析的常用库,涵盖NumPy数值运算基础,Matplotlib绘图基本知识,pandas统计分析,pandas数据预处理,以及使用scikit-learn库构建模型;企业综合案例数据分析。

6.Python网络爬虫技术

课程能力目标:掌握Python爬取网络数据的不同场景及方法,如在静态网页、动态网页、登录后才能访问的网页、PC客户端、APP等爬取任务。

课程主要内容:爬虫与反爬虫的基本概念、Python爬虫环境的配置;爬虫过程中涉及到的网页前端基础;静态网页、动态网页爬取数据的过程;对于登录后才能访问的网页进行模拟登录的方法;爬取PC客户端、APP的数据的方法;使用Scrapy爬虫框架爬取数据的过程。

7.数据挖掘(Python语言)

课程能力目标:掌握基于Python语言的数据挖掘技术及应用。

课程主要内容:数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理,数据挖掘的5大类算法,包括分类与预测、聚类分析、关联规则、智能推荐和时序模式等在Python语言中的使用方法,数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用案例分析。

8.智能推荐技术与应用(Python语言)

课程培养目标:熟练掌握基于Python语言的智能推荐技术,并通过企业案例体验具体应用场景。

课程主要内容:掌握基于人口统计学的推荐、基于内容的推荐、基于关联规则的推荐、基于协同过滤的推荐等常用推荐方法,结合具体案例,用Python语言完成实现智能推荐过程。

9.文本挖掘技术与应用(Python语言)

课程培养目标:掌握如何发现文本的内容特征及具体实现过程。

课程主要内容:文本挖掘技术及基本原理,并通过一个案例用Python语言实现其具体过程。

10.深度学习技术与应用(Python语言)

课程培养目标:掌握深度学习技术的基本原理及应用场景。

课程主要内容:深度学习技术的基本原理,并通过一个案例用Python语言实现其具体过程。