“互联网+”大数据项目实习方案

2019-07-16 泰迪智能科技 2090
分享到:

一、“互联网+”实习背景

2014年2月7日习近平总书记在中央网络安全和信息化领导小组第一次会议上指出:“信息化和经济全球化相互促进,互联网已经融入社会生活方方面面,深刻改变了人们的生产和生活方式。”李克强总理在2015年《政府工作报告》中推出“互联网+”的概念,要求制定“互联网+”行动计划。现在“互联网+”已经渗透到社会的方方面面。

高校实践教学是一个包含政府、高校、企业实践单位的生态体系,是衔接学生在校学习与步入社会两个阶段的重要桥梁。一个好的实习机会,会帮助学生将各种专业知识逐步转化为解决问题的能力,同时也教会他们适应与校园氛围大不相同的职场环境。不过,绝大部分同学都找不到这样理想的实习机会。

首先,实习需求比较集中在一线城市,很多地区有需求的企业屈指可数,很多同学需要奔波到外地实习,伴随出现的是高额住宿费用和校外安全隐患。其次,在实习中往往很难接触到企业真实问题与核心数据,实习质量严重“缩水”,学生迈入职场时仍是十分迷惘。

在“互联网+”时代,泰迪科技在“互联网+”项目实习、“虚拟第三学期”学生实训、“互联网+”创新创业实践等方面,构建起跨界深度融合、连接高校的“互联网+实习生态体系”。

二、“互联网+”实习意义

1、弥补学生毕业后从事大数据相关企业工作经验

此次实习以企业真实项目为场景,充分感受真实的大数据挖掘过程及其所需要的技能和知识点。在实习过程中,围绕大数据挖掘的整个流程,从数据采集、数据迁移、数据挖掘、专题应用及数据可视化完整大数据挖掘流程,将课堂上所学到的理论知识应用到实践中,使其具备大数据挖掘相关企业开发项目的准入门槛,为毕业后就业奠定扎实的技能基础。

2、实习成果经验转换

本次实习优质的成果可以转换成创新创业的项目池,实习成果可以存储为教学档案,为以后专业的优化,人才培养定位,课程设置,提供良好的支撑系统材料,老师可将此次实习过程所总结的经验吸收进往后教学过程中,或者成立大数据与人工智能项目工作室,促进学生在大数据挖掘及数学建模,人工智能方面的可持续发展。

3、为学生的择业和就业提供帮助

近年来大数据分析挖掘岗位十分希缺,各企业纷纷成立大数据项目技术团队,但苦于招聘不到合适的人才,一个很重要的原因就是毕业生不具备大数据分析挖掘的实践能力。本次实习提供的企业级数据挖掘项目,能为学生选择数据挖掘岗位就业方向需注备的技能知识提供参考。在实习过程当中,能快速掌握大数据挖掘技术的知识技能,以弥补自己的知识不足,另外就是在实习过程当中,企业工程师和企业技术人员会以自身的从业经历,进行大数据岗位的就业指导,帮助学生实习之后能快速进入到就业前的工作状态,能对自己职业生涯有一个清晰的定位。

三、“互联网+”实习预期效果

1、本次项目实习重点是让学生巩固已学到的大数据挖掘理论知识,对数据采集,数据处理,数据分析与挖掘,数据可视化等技能知识有一个全面的了解和实践。

2、本次项目实习能让学生对大数据目前的就业形式和前景有个清晰的认知,学生在就业之前,能对毕业后薪酬待遇,社会福利,工作制度,职位升迁,企业文化,都有一定了解,并且能帮助学生快速的实现自己定位和规划,对口自己所学的专业,实现专业与工作的无缝对接。

3、本次项目实习是让学生对大数据企业项目开发整体流程有全新的认知,让学生的思维能力在实习过程当中能发挥到极致,培养学生的企业工程思维能力和开发动手能力,让学生知道自己的不足,并通过项目实践快速弥补。

4、本次项目实习是集中式的实习,对培养学生的团队协助能力,培养学生的忧患意识,让学生在就业之前能体验到团队协助作战能力,团队沟通能力,能对以后快速应对同事之间的沟通,上司和下属之间的协同工作都能起到很好的作用。

5、经过本次项目实习,学生须按项目目标及要求完成指定任务,如数据采集、数据探索、数据清洗、数据预处理、构建模型、模型性能评价等。项目实习的具体交付内容包括:文档、汇报PPT、代码、可视化结果、相关数据等,如下所示:

四、对口就业岗位

序号

岗位

主要工作要求

1

数据采集/爬虫工程师

1、根据业务规划的要求,对各类数据进行收集、整理、录入;

2、负责采集策略设计与优化,提升网页抓取的效率和质量,解决验证码破解、信息精准抽取等技术难题;

3、负责对抓取数据进行日常跟踪,监控爬虫系统运行状态,保证数据准确性。

2

数据挖掘工程师

1、基于业务数据,运用数据分析和数据挖掘的理论和方法,建立业务模型;

2、基于所建立的业务模型,分析和挖掘数据和业务背后的规律;

3、建立策略效果评估机制和监控体系,持续对模型和算法做出合理地调整或改进。

3

算法工程师

1、根据项目、产品和分析、模型需求,完成数据研究、建模工作;

2、应用完备的统计学/数据挖掘/机器学习等理论知识,对海量异构数据进行融合挖掘;

3、跟踪前沿的算法理论,并且将优秀的算法应用到业务场景中,通过技术创新提升业务价值。

4

大数据分析工程师

1、负责大数据平台技术框架的选型与集成,负责搭建hadoop集群;

2、基于大数据平台的数据产品与服务的规划、设计与开发;

3、在线和离线海量数据分析平台的开发。

五、实习项目安排

项目实习共一个月,分四个阶段,项目实习时间:8:30-12:00   14:00—17:00

第一阶段1天时间,实习项目启动。主要内容:

1) 在学校组织召开启动动员大会,介绍实习项目组织形式;

2) 企业工程师对实习项目的背景、实现过程及所需的知识技能,对本次项目实习的意义,实习的考核进行讲解;

3) 进行项目分组(3人一个小组,指定一名小组长,方便项目协同及联络);

4) 学生从企业提供的项目池中选择适合自己的项目。项目池内收纳了不同难易程度的实习项目,项目涉及行业包括但不限于:新零售、互联网、金融保险、交通运输等。根据选择项目不同,进入不同的QQ交流社群。

5) 指导实习学生下载实习环境和相关资源包并完成本地环境搭建。

第二阶段约15天时间,根据学生所选实习项目,企业提供一个企业实战项目和相关视频课程供学生自学。学生在本地实习环境中,在企业技术人员的指导下,完成类似项目学习和实践,使学生具备实习项目所需的前置知识技能,并了解企业数据挖掘项目开发的整个流程。学生也可通过泰迪云课堂,免费学习大数据相关方面的分析技术和工具,如R语言/Python、TensorFlow及相关项目案例等。本次项目实习,要求学生每天撰写实习日志,并当天提交至本次项目企业班主任,实习日志严格按照提供的模板进行撰写,不能弄虚作假,实习日志将作为实习成绩考核的重要依据。

第三阶段约13天时间,以项目小组合作完成实习项目为主,在本阶段开始,学生通过前阶段企业实战项目和相关视频课程的学习,在企业技术人员的指导下,完成实习项目的开发。学生在实习过程中遇到的问题,可以进行远程咨询,企业工程师进行答疑。实习项目以小组形式独立完成,在整个实习过程当中,小组成员不仅提高了自身的技能,也提高了团队协同能力,也让学生在实习过程当中锻炼人际交往关系,增进同学之间的感情,实习日志和第二阶段一样,学生每天撰写实习日志,提交给本次项目企业班主任,为后续考核提供材料支撑。

第四阶段1天时间,实习项目总结,主要工作:

1) 在企业或学校现场,校企双方领导出席项目总结会,对本次项目实习过程存在的问题及经验进行总结。校企双方就本次项目实习进行交流,广泛吸取学生的意见和老师的反馈。

2) 为实习学生颁发企业实习证明和CBDA大数据挖掘工程师证书(初级),并为优秀学生颁发优秀实习生证书,(注:根据学生个人自愿,并经考核合格后,可以获得由工业和信息化部教育与考试中心颁发“高级大数据分析师”专项技术证书,证书可登录国家工信部考试中心官网查询,全国通用,该证书可作为学生求职、定级的参考。)

3) 优秀实习学生团队介绍实习心得。

4) 企业工程师现场对大数据就业、市场前景、薪酬待遇、职业生涯定位,以及学生就业心态的疏导进行讲座和答疑。

六、实习过程监控机制

1)项目实习联合教学团队

学生所在高校的老师+泰迪科技师资,共同监督学生完成实习项目。

Ø  所在地高校老师组织学生集体实习。(1名学校班主任+1名学生助理)

Ø  企业导师监控线上学习数据,把控学习进度。(1名企业班主任+2名技术人员)

2)项目进度监控

跟进学生项目处理进度,确保学生开展路线方向正确。

Ø  项目开展过程中,定期完成项目任务,根据完成情况,导师形成评价反馈。

Ø  根据学生实习情况,整理出现的问题,组织统一答疑,避免问题重复出现。

3)学生能力监控

关注学生对知识的应用程度,帮助学生最大限度发挥实力。

Ø  在开展项目前,对学生进行摸底考试,确保学生有能力解决项目任务。

Ø  项目开展过程中,根据任务的完成情况,评定学生的技能应用能力,提供能力强化方案。

七、实习项目

本次实习项目为新零售-无人智能售货机商务数据分析:通过对某区域自动售货机的销售数据进行商务数据分析,帮助经营者了解客户需求,掌握商品需求量,给出合理的营销方案,项目实习时间为两个星期。

1) 实现工具:Python3

2) 前置知识:Python编程基础、MySQL数据库基础、Python数据分析基础

3) 项目核心:数据可视化、售货机画像、销量预测、营销策略

4) 掌握技能:全面实践商务数据分析流程包括数据处理、数据探索、数据建模等;使用Python语言作为工具亲手实现数据的Python可视化效果绘制;体验基础的五边形像技能;对商品销量进行预测

5) 学习收益:获得企业实习证明;获得CBDA大数据分析工程师证书(初级,优秀者可获中级);丰富个人GitHub,项目论文、代码片段上传到GitHub存档。面试时,可直接向面试官展示自已的项目经验;提供个人简历优化推荐服——为优秀结业生引荐大数据公司

6) 项目内容

任务1:数据预处理与分析

1.1根据实际项目需求对数据进行预处理

1.2计算每台售货机每个月平均交易额和日均订单量

任务2:数据可视化

2.1掌握Python可视化基础,了解可视化含义

2.2 对任务1处理后的数据进行可视化分析,并给出分析结论

任务3:售货机画像的探索

3.1 根据热销商品绘制5台售货机画像

3.2 根据画像及分析制定合适的营销策略

任务4:销量预测

4.1预测售货机三个月内热销前10的商品未来一个月的销量

4.2根据预测值,给出5台售货机未来一个月货品的补充计划

7) 项目流程

j 加入项目群:班主任随时跟进,问题实习解答

k 学习前置知识:提供项目所需知识的在线课程,快速掌握项目前置技能

l 项目实践:获取项目需求,动手做项目,并提交项目报告

m 项目验收:对项目成果进行验收,指导改进项目成果

n 项目存档:指导学生将项目成果上传至个人GitHub

o 答疑服务:常规群内答疑+视频集中答疑

八、实习评分规则

学员姓名

实习报告的规范性、合理性(40分)

建模完整性、分析清晰性、方法有效性(30分)

模型创新点(10分)

实习纪律、在线学习时长(20分)

总分

学员A 






学员B 






学员C 






 

九、实习证明和证书

根据学员自愿,可以自行选择以下技术证书(一般为初级,优秀者中级,仍需要考核,有额外证书费用)。


 

 十、实习地点 

学生:主要在学校内或由学校指定的实习场地。

  企业工程师:除第一天和最后一天到学校现场外,其余时间远程在线指导和答疑。