2021年第六期_全国高校大数据与人工智能师资研修班

2021-11-02 泰迪智能科技 431
分享到:

主办单位:

泰迪杯数据挖掘挑战赛组委会
承办单位:广东泰迪智能科技股份有限公司
协办单位:人民邮电出版社有限公司

北京泰迪云智信息技术研究院


互联网、大数据、云计算、人工智能等现代信息技术深刻改变着人类的生产、生活、学习乃至思维方式,深刻展示了世界发展的前景。目前各院校的大数据和人工智能专业教师匮乏、相关落地动手实战应用能力欠缺、授课过程中相关行业实战案例项目缺失等,为加快建设大数据、人工智能相关专业教师队伍,推动各院校建立大数据人才培训体系和评价体系,特推出全国高校大数据与人工智能师资研修班。每年在全国范围内滚动开展八期,截止目前已在全国巡回举办50余场,参训教师近6000人次。2021年第六期全国高校大数据与人工智能实战研修将开设四大专题方向,分别是:专题一 商务数据分析实战;专题二 Python网络爬虫与数据处理实战;专题三 Python数据分析与挖掘实战;专题四 基于人工智能推荐系统应用实战。本期研修班以线上云课堂形式举办,现将有关安排通知如下:

一、课程特色

1、本研修班课程全程强调动手实操,内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解企业级案例,真正的让学员把所学内容和工作实际有效结合、更好地进行教育教学工作。

2、核心课程部分由讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。视频制作精良,讲师真人出镜,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。

3、课程设有答疑交流讨论群,培训期间助教全程辅助教学,每天提供10小时的实时在线答疑辅导,并进行答疑文档汇总,帮助学员更好地总结学习。

4、本课程配套有基础知识内容,即使零基础学员也能找到适合自己的学习内容和节奏,快速掌握课程知识和技能。

5、所有课程相关源代码、数据、PPT、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持六个月内免费回看,以便复习和参考。

6、全面实践大数据/人工智能项目流程,包括数据采集、数据存储管理、数据探索、数据处理、特征工程、数据建模等课程,提供知识讲解,助力夯实理论基础,掌握核心技术。

7、参加线上课程学习的学员,如后续本人参加线下课程继续深造,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程)。

二、课程安排

专题一  商务数据分析实战学习时间: 11月20日 - 11月29日,共计80学时
证书颁发:高级大数据分析师费用:1980元(报名费、学习费、资料费、证书费等)

课程模块:Excel数据分析基础与实战、Power BI数据分析与可视化

实战案例:新零售无人智能售货机可视化项目、疫情期间湘鄂省区物流数据分析、学生校园卡消费行为分析、水果卖场销售检测可视化

详见附件一 商务数据分析实战课程大纲

专题二 Python网络爬虫与数据处理实战学习时间: 11月21日 - 11月28日,共计64学时
证书颁发:高级大数据技术应用职业技术费用:1980元(报名费、学习费、资料费、证书费等)

课程模块:Python编程基础Python数据分析与应用;Python网络爬虫:概述与静态网页采集、动态网页采集与模拟登陆、Scrapy爬虫、数据采集与处理实战-《红海行动》B站弹幕采集与分析

案例实战:全国汽车销量可视化、农产品信息采集与可视化分析

详见附件二 Python网络爬虫与数据处理实战课程大纲

专题三 Python数据挖掘与机器学习实战学习时间: 11月20日 - 11月29日,共计80学时
证书颁发:高级机器学习工程师费用:1980元(报名费、学习费、资料费、证书费等)

课程模块:Python编程基础Python数据分析与应用、数据挖掘/机器学习算法原理与实现

案例实战:水产养殖水质智能识别、运营商流失用户分析与预测、百货商场用户画像描绘与价值分析

综合实战:天猫用户重复购买预测

详见附件三 Python数据挖掘与机器学习实战课程大纲

专题四 基于人工智能的推荐系统应用实战学习时间: 11月21日 - 11月30日,共计80学时
证书颁发:高级机器学习工程师费用:2480元(报名费、学习费、资料费、证书费等)

课程模块:Python编程基础Python数据分析与应用、机器学习算法原理与实现、智能推荐算法、BP神经网络与TensorFlow2实战、TensorFlow2深度学习原理及实战

综合案例:O2O优惠券使用预测、大数据法律服务智能推荐、广电大数据营销推荐、基于深度学习的推荐系统受众性别预测。

详见附件四 基于人工智能推荐系统应用实战课程大纲

三、师资介绍

冯国灿-1.jpg

冯国灿  博士,中山大学数学学院教授,博士生导师。泰迪杯数据挖掘挑战赛组委会委员,中国工业与应用数学会常务理事,广东省工业与应用数学学会理事长,2000-2002英国格莱莫根大学数字图像实验室和布拉德福大学数字媒体实验室做博士后研究员。主要从事模式识别、计算机视觉研究,参加主持包括国家自然科学基金等科学基金20多项,发表学术论文100余篇,入选2014-2019爱斯唯尔计算机科学中国高被引学者排行榜。

张敏.jpg张敏  广东泰迪智能科技股份有限公司、培训总监,从事用户数据分析和数据挖掘工作六年,具有丰富得大数据挖掘理论及实践培训经验,对数据具有较高的敏感度,根据数据对其进行全面得统计分析。精通Python、R语言、Matlab等多种数据挖掘工具。擅长市场发展情况监控、精确营销方面得数据挖掘工作。有为南方电网、珠江数码等大型企业长期提供实施服务得经验,主导了电子商务网站用户行为分析及网页智能推荐服务、中医证型关联规则挖掘、电信业务话单量预测、航空公司客户价值分析等多个项目。2017年"泰迪杯数据挖掘挑战赛教练员培训"主讲讲师,2018年广东省Python与深度学习技术师资培训班主讲讲师、2018年第一/三/五期全国高校大数据核心技术与应用师资研修班主讲讲师、2019年第一/二/三期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北、湖南省、甘肃省电力系统培训班主讲讲师,先后负责过西安理工大学、广东工业大学、广西师范学院、广西科技大学、闽江学院、广东石油化工学院、上海健康医学院等高校实训课程及德生科技等企业内训和数据挖掘就业班的课程。组织、参与编写图书《Python编程基础》、《Python数据分析与应用》、《R语言编程基础》等。
律波-1.jpg律波 广东泰迪智能科技股份有限公司高级数据分析工程师,应用统计学硕士,有较强的统计学、数学、数据挖掘理论功底;精通R、Python、Power BI、Excel等数据挖掘分析工具,具有丰富的培训和项目经验,擅长从数据中发掘规律,对数据具有较高的敏感度,逻辑思维能力强,擅长数据可视化,机器学习、深度学习等算法原理的实现,如神经网络、SVM、决策树、贝叶斯等;负责"珠江数码大数据营销推荐应用"项目,完成标签库的构建及产品推荐模型;负责"京东电商产品评论情感分析"项目,完成了评论数据情感评价模型、LDA主题模型的构建;通过项目案例的转换;负责多个本科类院校数据分析软件培训和毕业生数据分析培训,先后负责广西科技大学、闽江学院、广东石油化工、韩山师范学院、广西师范大学等数据分析软件培训及实训等。多次负责"泰迪杯"数据挖掘大赛题目的构思和实现、赛前培训。大数据专业系列图书编写委员会成员,负责《R语言与数据挖掘》、《Python实训案例》、《Excel可视化案例》等书籍编写工作。
杨惠.jpg杨惠  广东泰迪智能科技股份有限公司高级数据分析师,从事人工智能工作多年,擅长计算机视觉和自然语言处理,熟悉常用深度学习算法原理及应用,如神经网络、SVM、强化学习等算法;精通TensorFlow、Python、MATLAB等常用数据挖掘处理工具。具有丰富的实践项目经验。如"智能聊天客服"项目,"车牌智能识别"项目,"京东电商产品评论情感分析"项目,"珠江数码大数据营销推荐应用"项目;"电子商务网站智能推荐服务"项目;"基于Seq2Seq注意力模型实现聊天机器人"项目。具备丰富的培训经验,曾为多家企业、院校服务过专业培训工作。如PPV商业培训、泰迪大数据师资培训、珠海城职院数据分析培训;2018年第一/三/五期全国高校大数据核心技术与应用师资研修班主讲讲师,2019年第一/三/五期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北省电力系统培训班主讲讲师。大数据专业系列图书编写委员会成员,负责《Python数据分析与应用》、《R语言编程基础》、《TensorFlow2深度学习实战》、《深度学习与计算机视觉实战》等书籍编写工作。
陈四德-1.jpg陈四德  广东泰迪智能科技股份有限公司高级数据分析师,统计学专业,对数据统计分析和数据挖掘领域均有较强的理解和理论基础;有造价行业、游戏行业背景和丰富的项目经验,精通行业内的各种指标分析,擅于从多维度分析数据,逻辑性强;擅长Python、R语言、MySQL数据库等工具,能熟练对数据进行数据处理和分析,掌握常用的数据挖掘算法如分类、聚类等,以及深度学习TensorFlow的使用。负责“网站会员流失预测”项目,完成数据处理,模型构建;负责“平台BI埋点数据入库及数据分析”项目,完成数据盘点、数据指标整理和把控;负责“游戏数据分析”项目,完成产出游戏生态日报、客户价值分群结果、用户流失的预警、用户画像指标的完善和维护,项目经验丰富。负责过西安交大城市学院、福建农林大学、国培师资培训、韩山师范学院数据分析就业班、湖南科技职业技术学院、武汉科技大学、广东机电职业技术学院国培、柳州城市职业技术学院第一届大数据职业技能竞赛指导、吉林大学珠海学院等培训项目,授课经验丰富。负责过“泰迪杯”数据挖掘挑战赛出题及赛题指导。

四、证书颁发

学员经在线培训并考试合格后,可以获得本期培训对应专题职业技术证书。

五、报名须知与联系方式

1、报名材料:报名申请表、身份证复印件、两寸近期正面免冠彩色半身证件照电子版(要求:白色背景底,14-20K大小的.JPG格式)。

2、本次由广东泰迪智能科技股份有限公司收取费用并开具发票。

3、本期研修班两专题及以上联报者可享受九折优惠。

4、报名联系方式

联系人:曾老师

电话:13246821827

微信:antonia602501

邮箱:zengaizhi@tipdm.com


全国高校大数据与人工智能师资研修班报名申请表

单位名称
部门/院系
通讯地址
发票抬头
发票内容:
纳税号
电子发票
接收邮箱:
联系人
电话:邮箱:
以下表格中要求提供的信息为申报职业技术证书使用,请真实完整填写
姓  名性别职务毕业院校最高学历手机号电子邮箱专题选择
























































费用

支付方式

1、电汇到指定账户
2、扫码支付(报名后联系工作人员索要支付码)
3、付款时请注明”大数据研修班+单位名称或姓名“字样,方便查账备案
账户信息账户名:广东泰迪智能科技股份有限公司
开户行:中国工商银行广州花城支行
账户号:3602 0285 0920 1663 221
备  注请将报名表发送至邮箱:zengaizhi@tipdm.com

联系人:曾老师   电话:13246821827    微信:antonia602501

附件一 商务数据分析实战

核心课程篇
时间课程内容
学习平台
第一课 Excel数据分析基础与实战

11月20日

18:30 - 22:00

1.1 认识数据分析

1.2 认识Excel 2016

2.1 获取文本数据

2.2 从数据库获取数据

3.1 排序

3.2 筛选

3.3 分类汇总

4.1 认识公式和函数

4.2 数组公式

4.3 日期和时间函数

4.4 数学函数

4.5 统计函数

4.6 文本函数

4.7 逻辑函数

5.1 透视表的创建和修改

5.2 透视表的操作

5.3 透视图的操作

泰迪云课堂

操作演练

个人PC
在线答疑微信群

11月21日

18:30 - 22:00

6.1 对比分析

6.2 趋势分析

6.3 饼图

6.4 散点图

6.5 雷达图

7.1 案例背景

7.2 数据预处理

8 商品销售分析

9 库存分析

10 用户分析

11 分析报告

泰迪云课堂

操作演练

个人PC
在线答疑微信群
第二课 Power BI数据分析与可视化

11月22日

18:30 - 22:00

1 数据分析与可视化概述

1.1 认识数据分析(Power BI)

1.2 常用数据可视化软件

1.3 认识Power BI

2 数据获取

2.1 获取数据的方式

2.2 数据获取

3 M语言数据建模与处理

3.1 编辑器和M语言

3.2 获取网络分页数据

3.3 清洗数据

3.4 数据集成

3.5 规约数据

泰迪云课堂

操作演练

个人PC
在线答疑微信群

11月23日

18:30 - 22:00

4 DAX语言数据处理

4.1 DAX语言

4.2 DAX语言处理标间关系

4.3 DAX函数使用实例

4.4 数据查询操作

5 数据分析可视化

5.1 可视化

5.2 认识对比分析

5.3 对比分析图表绘制操作

泰迪云课堂
操作演练个人PC
在线答疑微信群

11月24日

18:30 - 22:00

5.4 认识结构分析

5.5 结构分析可视化操作

5.6 相关分析

5.7 相关分析可视化操作

5.8 描述性分析

5.9 描述性分析可视化操作

5.10 KPI图标分析

5.11 KPI分析可视化操作

6 数据分析报表

6.1 认识Power BI报表

6.2 完整的分析报表:会员数据分析

6.3 完整分析报表的操作

7 Power BI移动版数据部署

7.1 移动版发布一份分析报表

7.2 仪表板的使用

泰迪云课堂
操作演练个人PC
在线答疑微信群
第三课 新零售无人智能售货机可视化项目

11月25日

18:30 - 22:00

1 了解某公司自动售货机现状

1.1 分析某公司自动售货机现状

1.2 认识自动售货机案例分析的步骤与流程

2 数据获取、预处理与建模

2.1 清洗数据

2.2 规约数据

2.3 数据建模

3 数据分析及可视化

3.1 销售分析及可视化

3.2 库存分析及可视化

3.3 用户分析及可视化

4 数据部署

4.1 整理销售分析报表

4.2 整理库存分析和用户分析报表

4.3 发布自动售后机案例报表

5 便利店销售业绩分析

泰迪云课堂
操作演练个人PC
在线答疑微信群
第四课 实战案例:疫情期间湘鄂省区物流数据分析

11月26日

18: 30 - 22:00

1 背景及分析目标

2 数据加载与预处理

3.1 两省结算方式比较

3.2 两省总利润比较

3.3 两省运输方式比较

3.4 两省利润趋势分析

3.5 两省送回小包装数量趋势分析

3.6 两省货物性质比较

3.7 两省折后金额趋势分析

3.8 湖北医疗物资数量分析

3.9 图表整理

4 小结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第五课 实战案例:学生校园卡消费行为分析

11月27日

18:30 - 22:00

1 案例背景与目标

1.1 案例背景解读

1.2 挖掘目标分析

2 数据预处理

2.1 预处理:读取数据和异常值

2.2 预处理:缺失值

2.3 预处理:重复值与合并数据

3 数据分析

3.1 食堂消费数据分析

3.2 学生消费行为分析

4 小结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第六课 实战案例:水果卖场销售检测可视化

11月28日

18:30 - 22:00

1 案例背景和目标

2 数据预处理

3 水果卖场销售数据分析

3.1 水果卖场销售图

4 水果产品销售分析

4.1 水果产品销售柱状图

5 小结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第七课 在线考试

11月29日

19:00 - 21:00

高级数据分析师职业技术证书在线考试泰迪云课堂


附件二 Python网络爬虫与数据处理实战课程大纲

基础篇(报名成功后即可开始学习)
时间课程内容
学习平台
正式培训前

Python编程基础

1 准备工作

2 列表操作

3 程序流程控制语句

4 字符串操作

4.1 字符串及其索引&切片

4.2 字符串的常见方法

4.3 字典的创建及索引

4.5 字典推导式

5 Python文件读取操作

5.1 Python读取文件

5.2 练习3:统计小说中的单词频次

6 函数

6.1 Python函数自定义

6.2 练习4:自定义求序列偶数个数的函数

7 面向对象与模块

7.1 Python方法与函数对比介绍

7.2 Python面向对象示例

7.3 Python模块使用

7.4 第三方库的安装与调用

8 注意事项

8.1 Python工作路径说明

8.2 模块命令及存放路径的注意事项

8.3 结语

泰迪云课堂
正式培训前

Python数据分析与应用

1 Python数据分析概述

1.1 认识数据分析

1.2 熟悉Python数据分析的工具

1.3 安装Anaconda与掌握Jupyter Notebook常用功能

2 NumPy数值计算基础

2.1 掌握NumPy数值计算基础

2.1.1 NumPy简介

2.1.2 数组创建及基础属性

2.1.3 初识数组的特点

2.1.4 创建常用数组

2.1.5 数组数据类型

2.1.6 生成随机数

2.1.7 一维数组的索引

2.1.8 逻辑型索引

2.1.9 多维数组的索引

2.1.10 求解距离矩阵

2.1.11 变化数组shape

2.2 掌握NumPy矩阵与通用函数

2.2.1 NumPy矩阵介绍

2.2.2 NumPy通用函数介绍

2.2.3 通用函数的广播机制

2.3 利用NumPy进行统计分析

2.3.1 NumPy读写二进制文件

2.3.2 NumPy读写txt文件

2.3.3 利用NumPy对数据进行简单统计分析

3 Pandas统计分析基础

3.1 Pandas简介

3.2 读写不同数据源的数据

3.2.1 Pandas读取文本数据

3.2.2 存储数据框

3.2.3 Pandas读取excel文件

3.2.4 将数据框存储为excel文件

3.3 数据框与数据框元素

3.3.1 构建数据框

3.3.2 查看数据框的常用属性

3.3.3 按行列顺序访问数据框中的元素

3.3.4 按行列名称访问数据框中的元素

3.3.5 修改数据框中的元素

3.3.6 删除数据框中的元素

3.3.7 描述分析数据框中的元素

泰迪云课堂
核心课程篇
时间课程内容
学习平台
第一课 Python网络爬虫:概述与静态网页采集

11月21日

18:30 - 22:00

1 Python爬虫环境与爬虫简介

1.1 认识爬虫

1.1.1 常见网上冲浪过程

1.1.2 爬虫的概念

1.1.3 爬虫合法性

1.2 认识反爬虫

1.3 配置Python爬虫环境

2 网页前端基础

2.1 认识网络信息传输过程

2.1.1 网络传输模型

2.1.2 网络信息传输过程

2.2 认识HTTP

2.2.1 认识HTTP

2.2.2 熟悉Cookie

3 简单静态网页爬取

3.1 认识静态网页

3.2 实现HTTP请求

3.2.1 创建工程

3.2.2 生成HTTP请求

3.2.3 完善HTTP请求

3.3 解析网页

3.3.1 为什么要解析网页

3.3.2 初识Xpath

3.3.3 Xpath相对路径及属性查找

3.3.4 使用BeatifulSoup解析网页

3.3.5 网页解析小结

3.4 存储数据

3.4.1 认识chrom开发者工具

3.4.2 任务演练:爬取并存储泰迪科技官网首页数据

泰迪云课堂

操作演练

个人PC
在线答疑微信群
第二课 Python网络爬虫:动态网页采集与模拟登陆

11月22日

18:30 - 22:00

4 认识动态网页

4.1 认识动态网页

4.2 逆向分析爬取动态网页

4.2.1 通过网页源码追踪目标数据文件地址

4.2.2 通过开发者工具追踪目标数据文件地址

4.2.3 爬取数据并进行保存

4.3 使用Selenium库爬取动态网页

4.3.1 搭建Selenium环境

4.3.2 利用Selenium获取网页数据

4.3.3 利用Selenium控制点击操作

5 模拟登录

5.1 使用表单登录方法实现模拟登录

5.1.1 模拟登录的过程

5.1.2 查找提交入口和表单数据

5.1.3 提交表单完成模拟登录

5.1.4 使用表单登录的注意事项

5.2 使用Cookie登录方法实现模拟登录

5.3 使用Selenium模拟登录

泰迪云课堂
操作演练个人PC
在线答疑微信群
第三课 Python网络爬虫:Scrapy爬虫

11月23日

18:30 - 22:00

6 Scrapy爬虫

6.1 认识Scrapy

6.2 通过Scrapy爬取基本页面信息

6.2.1 创建项目

6.2.2 指定字段及创建spiders

6.2.3 完成spiders编写

6.2.4 运行程序保存数据

6.3 通过Scrapy抓取跳转页面数据

6.3.1 任务介绍及项目创建

6.3.2 获取所有页面的url

6.3.3 获取每个页面的新闻二次页面的url

6.3.4 提取各新闻二次页面中的目标数据

6.3.5 运行程序保存数据

7 拓展:终端协议及爬取工具介绍

泰迪云课堂
操作演练个人PC
在线答疑微信群
第四课 Python数据可视化

11月24日

18:30 - 22:00

1.1 Matplotlib绘制流程说明

1.2 添加文本和修改绘图风格

1.3 rc参数

1.4 散点图

1.5 折线图

1.6 直方图和条形图

1.7 饼图

1.8 箱线图

1.9 人口特征间分布

1.10 人口各个特征分布

2.1 Pyecharts基础介绍

2.2 Pyecharts绘制日历图

2.3 Pyecharts绘制漏斗图

2.4 Pyecharts绘制仪表图

2.5 Pyecharts绘制水球图

2.6 Pyecharts绘制关系图

2.7 Pyecharts绘制直角坐标系图表

2.8 Pyecharts绘制饼图

2.9 Pyecharts绘制雷达图

2.10 Pyecharts绘制词云图

2.11 Pyecharts绘制柱状图

2.12 Pyecharts绘制树形图

2.13 Pyecharts绘制地理图表

2.14 Pyecharts绘制3D图表

泰迪云课堂
操作演练个人PC
在线答疑微信群
第五课 数据采集与处理实战:《红海行动》B站弹幕采集与分析

11月25日

18: 30 - 22:00

1 背景及目标-B站弹幕数据采集分析

2 数据采集

2.1 定位弹幕数据文件的位置

2.2 采集弹幕数据

2.3 解析及保存弹幕数据

2.4 弹幕数据采集小结

3 数据处理与分析

3.1 对弹幕内容进行分词

3.2 去除停用词

3.3 统计词频

3.4 绘制词云图

3.5 处理弹幕发送时间数据

3.6 弹幕发布数量分布图

3.7 弹幕发布数量随日期变化图

3.8 其他图形绘制

3.9 从弹幕数量变化看影评情节特点

4 总结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第六课 数据采集与处理实战:全国汽车销量可视化

11月26日

18:30 - 22:00

1 项目背景与挖掘目标

2.1 数据加载与数据探索_汽车销售数据可视化分析

2.2.1 各车系销售情况可视化与分析

2.2.2 各车类销售情况可视化分析

2.3 不同价格区间汽车销售情况可视化分析

2.4 汽车厂商销售量的可视化分析

2.5 不同车型汽车销售量的可视化分析

2.6 汽车销量时序分析

2.7 不同城市销售量的可视化分析

2.8 不同省份销售量的可视化分析

3.1 不同厂商目标销量与实际销量的可视化分析(1)

3.2 不同厂商目标销量与实际销量的可视化分析(2)

4 小结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第七课 数据采集与处理实战:农产品信息采集与可视化分析

11月27日

18:30 - 22:00

1 项目背景与挖掘目标

2 信息爬取

2.1 获取历年省级以上审定品种网址

2.2 单页信息数据探索

2.3 单个部门数据爬取

2.4 所有信息爬取

3 数据探索与预处理

3.1 数据探索

3.2 异常值处理

3.3 重复值处理

3.4 提取审定方

3.5 提取水稻母本

4 数据分析与可视化

4.1 省级以上部门与水稻品种分析

4.1.1 分析省级以上部门审定数量

4.1.2 分析水稻品种数量

4.1.3 分析省级以上部门与水稻品种的关系

4.2 省级以上审定方分析

4.3 常用水稻母本分析

4.4 常见审定公司分析

5 总结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第七课 在线考试

11月28日

19:00 - 21:00

高级大数据技术应用职业技术证书在线考试泰迪云课堂


附件三 Python数据挖掘与机器学习实战课程大纲

基础篇(报名成功后即可开始学习)
时间课程内容
学习平台
正式培训前

Python编程基础

1 准备工作

2 列表操作

3 程序流程控制语句

4 字符串操作

4.1 字符串及其索引&切片

4.2 字符串的常见方法

4.3 字典的创建及索引

4.5 字典推导式

5 Python文件读取操作

5.1 Python读取文件

5.2 练习3:统计小说中的单词频次

6 函数

6.1 Python函数自定义

6.2 练习4:自定义求序列偶数个数的函数

7 面向对象与模块

7.1 Python方法与函数对比介绍

7.2 Python面向对象示例

7.3 Python模块使用

7.4 第三方库的安装与调用

8 注意事项

8.1 Python工作路径说明

8.2 模块命令及存放路径的注意事项

8.3 结语

泰迪云课堂
核心课程篇
时间课程内容
学习平台
第一课 Python数据分析与应用

11月20日

18:30 - 22:00

Python数据分析与应用

1 Python数据分析概述

1.1 认识数据分析

1.2 熟悉Python数据分析的工具

1.3 安装Anaconda与掌握Jupyter Notebook常用功能

2 NumPy数值计算基础

2.1 掌握NumPy数值计算基础

2.1.1 NumPy简介

2.1.2 数组创建及基础属性

2.1.3 初识数组的特点

2.1.4 创建常用数组

2.1.5 数组数据类型

2.1.6 生成随机数

2.1.7 一维数组的索引

2.1.8 逻辑型索引

2.1.9 多维数组的索引

2.1.10 求解距离矩阵

2.1.11 变化数组shape

2.2 掌握NumPy矩阵与通用函数

2.2.1 NumPy矩阵介绍

2.2.2 NumPy通用函数介绍

2.2.3 通用函数的广播机制

2.3 利用NumPy进行统计分析

2.3.1 NumPy读写二进制文件

2.3.2 NumPy读写txt文件

2.3.3 利用NumPy对数据进行简单统计分析

3 Matplotlib数据可视化基础

3.1 掌握绘图基础语法与常用参数

3.1.1 Matplotlib介绍

3.1.2 基础图形绘制

3.1.3 常用参数设置

3.2 分析特征间关系

3.2.1 绘制散点图

3.2.2 散点图参数设置

3.2.3 绘制折线图

3.3 分析特征内部数据分布与分散情况

3.3.1 绘制直方图

3.3.2 绘制饼图

3.3.3 绘制箱线图

泰迪云课堂

11月21日

18:30 - 22:00

4 Pandas统计分析基础

4.1 Pandas简介

4.2 读写不同数据源的数据

4.2.1 Pandas读取文本数据

4.2.2 存储数据框

4.2.3 Pandas读取excel文件

4.2.4 将数据框存储为excel文件

4.3 数据框与数据框元素

4.3.1 构建数据框

4.3.2 查看数据框的常用属性

4.3.3 按行列顺序访问数据框中的元素

4.3.4 按行列名称访问数据框中的元素

4.3.5 修改数据框中的元素

4.3.6 删除数据框中的元素

4.3.7 描述分析数据框中的元素

4.4 转换与处理时间序列数据

4.4.1 转换成时间类型数据

4.4.2 时间类型数据的常用操作

4.5 使用分组聚合进行组内计算

4.5.1 groupby分组操作

4.5.2 agg聚合操作

4.6 创建透视表与交叉表

4.6.1 生成透视表

4.6.2 生成交叉表

5 使用Pandas进行数据预处理

5.1 合并数据

5.1.1 表堆叠

5.1.2 主键合并

5.1.3 重叠合并

5.2 清洗数据

5.2.1 检测与处理重复值

5.2.2 检测与处理缺失值

5.2.3 检测与处理异常值

5.3 标准化数据

5.4 转换数据

5.4.1 哑变量处理

5.4.2 离散化连续型数据

泰迪云课堂
操作演练个人PC
在线答疑微信群
第二课 数据挖掘算法原理与实现

11月22日

18:30 - 22:00

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量Python实现

3 回归分析

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

4 决策树

4.1 从女生相亲到决策树

4.2 明天适合打球吗

4.3 决策树拆分属性选择

4.4 决策树算法家族

4.5 泰坦尼克号生还者预测-数据预处理

4.6 泰坦尼克号生还者预测-模型构建与预测

泰迪云课堂
操作演练个人PC
在线答疑微信群

11月23日

18:30 - 22:00

5 人工神经网络

5.1 单个神经元介绍

5.2 经典网格结构介绍

5.3 神经网络工作流程演示

5.4 如何修正网络参数-梯度下降法

5.5 网络工作原理推导

5.6 网络搭建准备

5.7 样本从输入层到隐层传输的Python实现

5.8 网络输出的Python实现

5.9 单样本网络训练的Python实现

5.10 全样本网络训练的Python实现

5.11 网络性能评价

5.12 调用sklearn实现神经网络算法

6 最近邻算法(KNN)

6.1 KNN算法介绍

6.2 KNN算法解决鸢尾花分类问题

7 朴素贝叶斯

7.1 非洲人还是北美人

7.2 为什么有“朴素”二字

7.3 拉普拉斯修正

7.4 用高斯朴素贝叶斯算法解决鸢尾花分类问题

泰迪云课堂
操作演练个人PC
在线答疑微信群

11月24日

18: 30 - 22:00

8 聚类分析

8.1 聚类分析概述

8.2 相似性度量

8.3 K-Means聚类分析算法介绍

8.4 利用K-Means算法对鸢尾花进行聚类

8.5 聚类结果的性能度量

8.6 调用sklearn实现聚类分析

9 集成学习

9.1 集成学习基本概念

9.2 并行集成算法-Bagging&RandomForest

9.3 模型评价

10 小结


操作演练个人PC
在线答疑微信群
第三课 实战案例:水产养殖水质智能识别

11月25日

18: 30 - 22:00

1 案例背景与目标

2 读取一张图片数据

3 获取图片数据的像素值矩阵

4 截取图像的有效区域

5 水质图像特征-颜色矩

6 三个颜色矩的Python实现

7 如何进行批量化数据转换

8 自定义函数获取指定路径中的所有图片名称

9 处理所有图片数据

10 数据处理代码整理

11 模型构建与性能评估

泰迪云课堂
操作演练个人PC
在线答疑微信群
第四课 实战案例:运营商流失用户分析与预测

11月26日

18:30 - 22:00

1.1 背景与目标

1.2 案例思路分析

2.1 数据探索

2.2 数据去重及删除无关属性

2.3 用户分组及标签构建

2.4 提取用户基本信息和在网时长

2.5 处理合约是否有效

2.6 处理合约计划到期时间

2.7 其余变量处理

2.8 特征拼接及缺失值处理

2.9 数据保存

3.1 特征选择介绍

3.2 皮尔逊特征选择

3.3 处理样本类别不均衡问题

4.1 模型性能评估介绍

4.2 模型构建及性能评估

泰迪云课堂
操作演练个人PC
在线答疑微信群
第五课 实战案例:百货商场用户画像描绘与价值分析

11月27日

18:30 - 22:00

1 背景与分析目标

2.1 会员信息表处理

2.2 销售流水表处理

3.1 会员年龄分析

3.2 不同年龄的消费能力

3.3 不同性别的消费情况

3.4 会员和非会员消费情况

3.5 商场会员年消费趋势

3.6 不同月份的消费趋势

3.7 每年每月的消费金额趋势

3.8 不同时刻的消费情况

4.1 用户画像介绍

4.2 会员基本信息标签

4.3 会员消费特征标签

4.4 会员商品偏好标签

4.5 生成用户画像

5.1 会员细分介绍

5.2 K-Means算法实现会员聚类

5.3 结果分析

泰迪云课堂
操作演练个人PC
在线答疑微信群
第六课 综合实战:天猫用户重复购买预测

11月28日

18:30 - 22:00


1.1 案例背景与挖掘目标

2.1 工程环境准备

2.2 缺失值处理和数据去重

2.3 数据分析探索

3.1 特征工程介绍

3.2 原始特征

3.3 用户与店铺的关系特征统计

3.3.1 用户相关特征:用户在平台的总交互次数

3.3.2 用户相关特征:用户最近一次购买距离第一次的时长

3.4.1 商家相关特征:商家被交互的数量

3.4.2 商家相关特征:商家的复购次数

3.5.1 用户和商家相关特征:用户在商家的交互次数

3.5.2 用户和商家相关特征:不同用户在不同商家购买率

3.6 离散型特征处理

4.1 建模前的数据处理

4.2 模型构建

4.3 模型训练和评估

4.4 模型应用

5 小结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第七课 在线考试

11月29日

19:00 - 21:00

高级机器学习工程师职业技术在线考试泰迪云课堂


附件四 基于人工智能推荐系统应用实战课程大纲

基础篇(报名成功后即可开始学习)
时间课程内容
学习平台
正式培训前

Python编程基础

1 准备工作

2 列表操作

3 程序流程控制语句

4 字符串操作

4.1 字符串及其索引&切片

4.2 字符串的常见方法

4.3 字典的创建及索引

4.5 字典推导式

5 Python文件读取操作

5.1 Python读取文件

5.2 练习3:统计小说中的单词频次

6 函数

6.1 Python函数自定义

6.2 练习4:自定义求序列偶数个数的函数

7 面向对象与模块

7.1 Python方法与函数对比介绍

7.2 Python面向对象示例

7.3 Python模块使用

7.4 第三方库的安装与调用

8 注意事项

8.1 Python工作路径说明

8.2 模块命名及存放路径的注意事项

8.3 结语

泰迪云课堂
正式培训前

Python数据分析与应用

1 Python数据分析概述

1.1 认识数据分析

1.2 熟悉Python数据分析的工具

1.3 安装Anaconda与掌握Jupyter Notebook常用功能

2 NumPy数值计算基础

2.1 掌握NumPy数值计算基础

2.1.1 NumPy简介

2.1.2 数组创建及基础属性

2.1.3 初识数组的特点

2.1.4 创建常用数组

2.1.5 数组数据类型

2.1.6 生成随机数

2.1.7 一维数组的索引

2.1.8 逻辑型索引

2.1.9 多维数组的索引

2.1.10 求解距离矩阵

2.1.11 变化数组shape

2.2 掌握NumPy矩阵与通用函数

2.2.1 NumPy矩阵介绍

2.2.2 NumPy通用函数介绍

2.2.3 通用函数的广播机制

2.3 利用NumPy进行统计分析

2.3.1 NumPy读写二进制文件

2.3.2 NumPy读写txt文件

2.3.3 利用NumPy对数据进行简单统计分析

3 Matplotlib数据可视化基础

3.1 掌握绘图基础语法与常用参数

3.1.1 Matplotlib介绍

3.1.2 基础图形绘制

3.1.3 常用参数设置

3.2 分析特征间关系

3.2.1 绘制散点图

3.2.2 散点图参数设置

3.2.3 绘制折线图

3.3 分析特征内部数据分布与分散情况

3.3.1 绘制直方图

3.3.2 绘制饼图

3.3.3 绘制箱线图

4 Pandas统计分析基础

4.1 Pandas简介

4.2 读写不同数据源的数据

4.2.1 Pandas读取文本数据

4.2.2 存储数据框

4.2.3 Pandas读取excel文件

4.2.4 将数据框存储为excel文件

4.3 数据框与数据框元素

4.3.1 构建数据框

4.3.2 查看数据框的常用属性

4.3.3 按行列顺序访问数据框中的元素

4.3.4 按行列名称访问数据框中的元素

4.3.5 修改数据框中的元素

4.3.6 删除数据框中的元素

4.3.7 描述分析数据框中的元素

4.4 转换与处理时间序列数据

4.4.1 转换成时间类型数据

4.4.2 时间类型数据的常用操作

4.5 使用分组聚合进行组内计算

4.5.1 groupby分组操作

4.5.2 agg聚合操作

4.6 创建透视表与交叉表

4.6.1 生成透视表

4.6.2 生成交叉表

5 使用Pandas进行数据预处理

5.1 合并数据

5.1.1 表堆叠

5.1.2 主键合并

5.1.3 重叠合并

5.2 清洗数据

5.2.1 检测与处理重复值

5.2.2 检测与处理缺失值

5.2.3 检测与处理异常值

5.3 标准化数据

5.4 转换数据

5.4.1 哑变量处理

5.4.2 离散化连续型数据

泰迪云课堂
核心课程篇
时间课程内容
学习平台
专题讲座

11月21日

18:30 - 22:00

主讲:冯国灿教授

主题内容:计算机视觉计算及其应用

泰迪云课堂
第一课 Python机器学习算法原理与实现

11月21日

18:30 - 22:00

1机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量Python实现

3 回归分析

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

4 聚类分析

4.1 聚类分析概述

4.2 相似性度量

4.3 K-Means聚类分析算法介绍

4.4 利用K-Means算法对鸢尾花进行聚类

4.5 聚类结果的性能度量

4.6 调用scikit-learn实现聚类分析

泰迪云课堂

操作演练

个人PC
在线答疑微信群
第二课 智能推荐算法

11月22日

18:30 - 22:00

1 智能推荐简介

1.1 什么是推荐系统

1.2 智能推荐的应用

2 智能推荐性能度量

2.1 离线实验评价指标

2.2 用户调查评价指标

2.3 在线实验评价指标

3 关联规则

3.1 常用关联规则算法

3.2 Apriori

3.3 FP-Growth

4 协同过滤推荐算法

4.1 基于用户的协同过滤

4.2 基于物品的协同过滤

5 经典排序算法

5.1 Ranking与用户画像

5.2 Factorization Machine模型简介

5.3 Factorization Machine模型实现

5.4 基于FM实现Ranking精排序

泰迪云课堂

操作演练

个人PC
在线答疑微信群
第三课 BP神经网络与TensorFlow2实战

11月23日

18:30 - 22:00

1 BP神经网络

1.1 单个神经元介绍

1.2 经典网络结构介绍

1.3 神经网络工作流程演示

1.4 如何修正网络参数,梯度下降

1.5 网络工作原理推导

1.6 网络搭建准备

1.7 样本从输入层到隐层传输的Python实现

1.8 网络输出的Python实现

1.9 单样本网络训练的Python实现

1.10 全样本网络训练的Python实现

1.11 网络性能评价

1.12 调用scikit-learn实现神经网络算法

2 任务1:构建一个线性模型

2.1 TensorFlow2介绍

2.2 TensorFlow2常用数据类型和操作

2.3 初始化模型

2.4 构建损失函数

2.5 模型训练及可视化

2.6 使用高阶API-Keras

3 任务2:MNIST手写数字识别

3.1 数据读取及探索

3.2 交叉熵

3.3 模型构建及训练

3.4 调用保存好的模型对新样本进行预测

泰迪云课堂
操作演练个人PC
在线答疑微信群
第四课 TensorFlow2深度学习原理与实战

11月24日

18:30 - 22:00

1.1 深度神经网络-引言

2 卷积神经网络CNN

2.1 浅层神经网络的局限

2.2 卷积操作

2.3 卷积操作的优势

2.4 池化及全连接

2.5 高维输入及多filter卷积

2.6 实现卷积操作

2.7 实现池化操作

3 循环神经网络RNN

3.1 循环神经网络简介

3.2 循环神经网络的常见结构

4 长短时记忆网络LSTM

4.1 LSTM的三个门

4.2 LSTM三个门的计算示例

4.3 利用RNN&LSTM实现mnist手写数字识别


泰迪云课堂
操作演练个人PC
在线答疑微信群
第五课 实战案例:O2O优惠券使用预测

11月25日

18:30 - 22:00

1 背景与目标

2.1 线下训练集数据介绍

2.2 向上训练集数据介绍

2.3 测试数据介绍

2.4 项目流程介绍

3.1 构建正样本

3.2 构建负样本

3.3 构建样本标签

4.1 特征构建介绍

4.2 处理Discount_rate列

4.3 特征1-折扣率

4.4 特征2-商户与用户之间的距离

泰迪云课堂
操作演练个人PC
在线答疑微信群

11月26日

18: 30 - 22:00

5.1 构建前数据准备

5.2 初级模型构建

5.3 ROC曲线与AUC值

5.4 模型性能评估

5.5 训练函数封装

5.6 模型预测

5.7 预测函数封装

6.1 特征3-优惠券流行度

6.2 特征4-用户在商家中的消费次数

6.3 如何进行特征拼接

6.4 拼接训练集的特征

6.5 拼接测试集的特征

7.1 模型训练

7.2 预测

7.3 代码整理

7.4 结果提交

泰迪云课堂
操作演练个人PC
在线答疑微信群
第六课 实战案例:大数据法律服务智能推荐

11月27日

18:30 - 22:00

1 智能推荐介绍

2 背景与挖掘目标

3.1 读取用户访问数据

3.2 统计不同类型的网页访问次数

3.3 探索101和1999类型网页的访问次数

3.4 统计用户点击次数

3.5 网页点击分析

3.6 翻页网址探索

4.1 脏数据探索

4.2 脏数据处理规则汇总

4.3 脏数据处理操作实现

4.4 翻页网址处理

5.1 协同锅炉推荐算法介绍

5.2 提取婚姻类型数据

5.3 模型构建准备工作介绍

5.4 将用户划分为训练用户和测试用户

5.5 将数据继划分为训练集和测试集

5.6 构建用户物品矩阵

5.7 自定义函数球杰卡德相似系数

5.8 模型构建-求物品相似度矩阵

6.1 模型推荐及性能评价方法介绍

6.2 构建测试用户网址浏览字典

6.3 模型推荐

6.4 模型性能评价

泰迪云课堂
操作演练个人PC
在线答疑微信群
第七课 实战案例:广电大数据营销推荐

11月28日

18:30 - 22:00

1.1 背景与目标

1.2 目标分析与解读

2 数据介绍

2.1 收视数据探索

2.2 异常数据探索

3.1 收视数据处理介绍

3.2 去除特殊线路和政企用户记录

3.3 去除直播记录中不关机顶盒的数据记录

3.4 去除累计超过3小时或小于4秒的直播记录

3.5 保存预处理后的数据

4.1 用户观看电视时长可视化

4.2 热门频道的可视化

5.1 构建标签库介绍

5.2 客户标签的计算方式

5.3 产品标签体系

5.4 客户标签体系介绍

5.5 客户标签计算

6 用户画像构建

7 协同过滤推荐

8 案例小结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第八课 综合实战:基于深度学习的推荐系统受众性别预测

11月29日

18:30 - 22:00

1 项目文件结构及编辑环境介绍

2 数据获取与探索分析答案讲解

3.1 理解用户单击流相关概念

3.2 获取用户的各单击流数据

4 对各单击流数据进行探索

5.1 对用户单击流数据进行预处理

5.2 进行词向量训练

5.3 对用户的单击流及逆行编码及padding操作

5.4 将词向量矩阵做相应排序并储存

5.5 将单击流数据转化为二维样本数据并存储

6.1 建模前数据整理

6.2 模型训练及性能评估

7.1 模型优化-并行网络结构介绍

7.2 模型优化

泰迪云课堂
操作演练个人PC
在线答疑微信群
第九课 在线考试

11月30日

19:00 - 21:00

高级人工智能应用工程师职业技术证书在线考试泰迪云课堂
拓展自学
自行安排时间

1 支持向量机

1.1 间隔与支持向量

1.2 对偶问题

1.3 核函数

1.4 软间隔与正则化

1.5 支持向量机算法的Python实现

2 生成对抗神经网络

2.1 生成对抗神经网络简介

2.2 生成对抗神经网络训练流程

2.3 生成手写数字照片-数据准备&定义生成器网络

2.4 生成手写数字照片-判别器网络结构

2.5 生成手写数字照片-网络传输及网络损失值

2.6 生成手写数字照片-模型训练及效果展示

泰迪云课堂