2021年第四期_全国高校师资培训之专题四 Python机器学习应用与实战

2021-06-08 泰迪智能科技 284
分享到:

主办单位:

泰迪杯数据挖掘挑战赛组委会
承办单位:广东泰迪智能科技股份有限公司
协办单位:人民邮电出版社有限公司

北京泰迪云智信息技术研究院


互联网、大数据、云计算、人工智能等现代信息技术深刻改变着人类的生产、生活、学习乃至思维方式,深刻展示了世界发展的前景。目前各院校的大数据和人工智能专业教师匮乏、相关落地动手实战应用能力欠缺、授课过程中相关行业实战案例项目缺失等,为加快建设大数据、人工智能相关专业教师队伍,推动各院校建立大数据人才培训体系和评价体系,特推出全国高校大数据与人工智能师资研修班。本研修班每年在全国范围内滚动开展八期,截止目前已在全国巡回举办50余场,参训教师近6000人次。2021年第四期全国高校大数据与人工智能实战研修将分别开设七个专题方向,分别是:专题一 Python金融数据分析实战;专题二 Python网络爬虫与数据处理实战;专题三 Python数据分析与挖掘实战;专题四 Python机器学习应用于实战;专题五 Hadoop+Spark大数据技术应用实战;专题六 深度学习实战(计算机视觉方向);专题七 深度学习实战(自然语言处理方向)。现将有关详细安排通知如下:

一、课程特色

1、本研修班课程全程强调动手实操,内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解企业级案例,真正的让学员把所学内容和工作实际有效结合、更好地进行教育教学工作。

2、核心课程部分由讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。视频制作精良,讲师真人出镜,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。

3、课程设有答疑交流讨论群,培训期间助教全程辅助教学,每天提供10小时的实时在线答疑辅导,并进行答疑文档汇总,帮助学员更好地总结学习。

4、本课程配套有基础知识内容,即使零基础学员也能找到适合自己的学习内容和节奏,快速掌握课程知识和技能。

5、所有课程相关源代码、数据、PPT、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持六个月内免费回看,以便复习和参考。

6、全面实践大数据/人工智能项目流程,包括数据采集、数据存储管理、数据探索、数据处理、特征工程、数据建模等课程,提供知识讲解,助力夯实理论基础,掌握核心技术。

7、参加线上课程学习的学员,如后续本人参加线下课程继续深造,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程)。

二、课程安排

专题四 Python机器学习应用与实战学习时间: 8月2日 - 8月10日,共计72学时
证书颁发:高级大数据技术应用职业技术证书费用:2480元(报名费、学习费、资料费、证书费等)

课程模块:专题讲座-计算机视觉技术及其应用、Python编程基础、Python数据科学库使用、Python机器学习实战、Python特征工程实战。

综合实战:水产养殖水质智能识别、电商智能推荐-优惠券使用预测。

文本分类案例:垃圾短信智能识别。

详见附件四 Python机器学习应用与实战课程大纲

三、师资介绍

冯国灿-1.jpg冯国灿 博士,中山大学数学学院教授,博士生导师。泰迪杯数据挖掘挑战赛组委会委员,中国工业与应用数学会常务理事,广东省工业与应用数学学会理事长,2000-2002英国格莱莫根大学数字图像实验室和布拉德福大学数字媒体实验室做博士后研究员。主要从事模式识别、计算机视觉研究,参加主持包括国家自然科学基金等科学基金20多项,发表学术论文100余篇,入选2014-2019爱思唯尔计算机科学中国高被引学者排行榜。
张敏.jpg张敏  广东泰迪智能科技股份有限公司、培训总监,从事用户数据分析和数据挖掘工作六年,具有丰富得大数据挖掘理论及实践培训经验,对数据具有较高的敏感度,根据数据对其进行全面得统计分析。精通Python、R语言、Matlab等多种数据挖掘工具。擅长市场发展情况监控、精确营销方面得数据挖掘工作。有为南方电网、珠江数码等大型企业长期提供实施服务得经验,主导了电子商务网站用户行为分析及网页智能推荐服务、中医证型关联规则挖掘、电信业务话单量预测、航空公司客户价值分析等多个项目。2017年"泰迪杯数据挖掘挑战赛教练员培训"主讲讲师,2018年广东省Python与深度学习技术师资培训班主讲讲师、2018年第一/三/五期全国高校大数据核心技术与应用师资研修班主讲讲师、2019年第一/二/三期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北、湖南省、甘肃省电力系统培训班主讲讲师,先后负责过西安理工大学、广东工业大学、广西师范学院、广西科技大学、闽江学院、广东石油化工学院、上海健康医学院等高校实训课程及德生科技等企业内训和数据挖掘就业班的课程。组织、参与编写图书《Python编程基础》、《Python数据分析与应用》、《R语言编程基础》等。
律波-1.jpg律波.jpg律波  广东泰迪智能科技股份有限公司高级数据分析工程师,应用统计学硕士,有较强的统计学、数学、数据挖掘理论功底;精通R、Python、Power BI、Excel等数据挖掘分析工具,具有丰富的培训和项目经验,擅长从数据中发掘规律,对数据具有较高的敏感度,逻辑思维能力强,擅长数据可视化,机器学习、深度学习等算法原理的实现,如神经网络、SVM、决策树、贝叶斯等;负责"珠江数码大数据营销推荐应用"项目,完成标签库的构建及产品推荐模型;负责"京东电商产品评论情感分析"项目,完成了评论数据情感评价模型、LDA主题模型的构建;通过项目案例的转换;负责多个本科类院校数据分析软件培训和毕业生数据分析培训,先后负责广西科技大学、闽江学院、广东石油化工、韩山师范学院、广西师范大学等数据分析软件培训及实训等。多次负责"泰迪杯"数据挖掘大赛题目的构思和实现、赛前培训。大数据专业系列图书编写委员会成员,负责《R语言与数据挖掘》、《Python实训案例》、《Excel可视化案例》等书籍编写工作。
杨惠.jpg杨惠  广东泰迪智能科技股份有限公司高级数据分析师,从事人工智能工作多年,擅长计算机视觉和自然语言处理,熟悉常用深度学习算法原理及应用,如神经网络、SVM、强化学习等算法;精通TensorFlow、Python、MATLAB等常用数据挖掘处理工具。具有丰富的实践项目经验。如"智能聊天客服"项目,"车牌智能识别"项目,"京东电商产品评论情感分析"项目,"珠江数码大数据营销推荐应用"项目;"电子商务网站智能推荐服务"项目;"基于Seq2Seq注意力模型实现聊天机器人"项目。具备丰富的培训经验,曾为多家企业、院校服务过专业培训工作。如PPV商业培训、泰迪大数据师资培训、珠海城职院数据分析培训;2018年第一/三/五期全国高校大数据核心技术与应用师资研修班主讲讲师,2019年第一/三/五期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北省电力系统培训班主讲讲师。大数据专业系列图书编写委员会成员,负责《Python数据分析与应用》、《R语言编程基础》、《TensorFlow2深度学习实战》、《深度学习与计算机视觉实战》等书籍编写工作。

四、证书颁发

学员经在线培训并考试合格后,可以获得本期培训对应专题职业技术证书。

五、报名须知与联系方式

1、报名材料:报名申请表、身份证复印件、两寸近期正面免冠彩色半身证件照电子版(要求:白色背景底,14-20K大小的.JPG格式)。

2、本次由广东泰迪智能科技股份有限公司收取费用并开具发票。

3、本期研修班两专题及以上联报者可享受九折优惠。

4、报名联系方式

联系人:曾老师

电话:13246821827

微信:antonia602501

邮箱:zengaizhi@tipdm.com


全国高校大数据与人工智能师资研修班报名申请表

单位名称
部门/院系
通讯地址
发票抬头
发票内容:
纳税号
电子发票
接收邮箱:
联系人
电话:邮箱:
以下表格中要求提供的信息为申报职业技术证书使用,请真实完整填写
姓  名性别职务毕业院校最高学历手机号电子邮箱专题选择
























































费用
支付方式
1、电汇到指定账户
2、扫码支付(报名后联系工作人员索要支付码)
3、付款时请注明”大数据研修班+单位名称或姓名“字样,方便查账备案
账户信息账户名:广东泰迪智能科技股份有限公司
开户行:中国工商银行广州花城支行
账户号:3602 0285 0920 1663 221
备  注请将报名表发送至邮箱:zengaizhi@tipdm.com

联系人:曾老师   电话:13246821827    微信:antonia602501

附件四 Python机器学习应用与实战课程大纲

基础篇(报名成功后即可开始学习)
时间课程内容
学习平台
正式培训前

Python编程基础

1 准备工作

2 列表操作

3 程序流程控制语句

4 字符串操作

4.1 字符串及其索引&切片

4.2 字符串的常见方法

4.3 字典的创建及索引

4.4 字典常用操作

4.5 字典推导式

5 Python文件读取操作

5.1 Python读取文件

5.2 练习3:统计小说中的单词频次

6 函数

6.1 Python函数自定义

6.2 练习4:自定义求序列偶数个数的函数

7 面向对象与模块

7.1 Python方法与函数对比介绍

7.2 Python面向对象示例

7.3 Python模块使用

7.4 第三方库的安装与调用

8 注意事项

8.1 Python工作路径说明

8.2 模块命名及存放路径的注意事项

8.3 结语

泰迪云课堂
核心课程篇
时间课程内容学习平台
专题讲座

8月2日

18:30 - 22:00

主讲:冯国灿教授

主题内容:计算机视觉技术及其应用

第一课 Python数据科学库使用

8月2日

18:30 - 22:00

1 Python数据分析概述

1.1 认识数据分析

1.2 熟悉Python数据分析的工具

1.3 安装anaconda与掌握Jupyter Notebook常用功能

2 NumPy数值计算基础

2.1 掌握NumPy数组对象

2.1.1 NumPy简介

2.1.2 数组创建及基础属性

2.1.3 初识数组的特点

2.1.4 创建常用数组

2.1.5 数组数据类型

2.1.6 生成随机数

2.1.7 一维数组的索引

2.1.8 逻辑型索引

2.1.9 多维数组的索引

2.1.10 求解距离矩阵

2.1.11 变化数组shape

2.2 掌握NumPy矩阵与通用函数

2.2.1 NumPy矩阵介绍

2.2.2 NumPy通用函数介绍

2.2.3 通用函数的广播机制

2.3 利用NumPy进行统计分析

2.3.1 NumPy读写二进制文件

2.3.2 NumPy读写txt文件

2.3.3 利用NumPy对数据进行简单统计分析

3 Pandas统计分析基础

3.1 Pandas简介

3.2 读写不同数据源的数据

3.2.1 Pandas读取文本数据

3.2.2 存储数据框

3.2.3 Pandas读取Excel文件

3.2.4 将数据框存储为Excel文件

3.3 数据框与数据框元素

3.3.1 构建数据框

3.3.2 查看数据框的常用属性

3.3.3 按行列顺序访问数据框中的元素

3.3.4 按行列名称访问数据框中的元素

3.3.5 修改数据框中的元素

3.3.6 删除数据框中的元素

3.3.7 描述分析数据框中的元素

泰迪云课堂
操作演练/作业个人PC
在线答疑微信群
第二课 Python机器学习实战

8月3日

18:30 - 22:00

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量Python实现

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

4.1 从女生相亲到决策树

4.2 明天适合打球吗?

4.3 决策树拆分属性选择

4.4 决策树算法家族

4.5 泰坦尼克号生还者预测-数据预处理

4.6 泰坦尼克号生还者预测-模型构建与预测

4.7 决策树可视化

泰迪云课堂
操作演练/作业个人PC
在线答疑微信群

8月4日

18:30 - 22:00

5.1 聚类分析概述

5.2 相似性度量

5.3 K-Means聚类分析算法介绍

5.4 利用K-Means算法对鸢尾花进行聚类

5.5 聚类结果的性能度量

5.6 调用sklearn实现聚类分析

6.1 间隔与支持向量

6.2 对偶问题

6.3 核函数

6.4 软间隔与正则化

6.5 支持向量机算法的Python实现

泰迪云课堂
操作演练/作业个人PC
在线答疑微信群
第三课 Python特征工程实现

8月5日

18:30 - 22:00

1.1 特征工程是什么

1.2 特征工程效果评估

1.3 定性还是定量

1.4 数据的4个等级介绍

1.5 数据的4个等级演示

2.1 探索性数据分析

2.2 探究不同类别样本的血糖浓度

2.3 缺失值探索

2.4 删除缺失值

2.5 构建基线模型

2.6 网格搜索优化

2.7 利用0进行缺失值填充的模型性能

2.8 利用均值进行缺失值填充的模型性能

2.9 标准化和归一化介绍

2.10 结合机器学习流水线进一步优化

2.11 数据预处理小结

3.1 特征构建引言

3.2 分类数据的填充

3.3 自定义分类数据填充器

3.4 自定义定量数据填充器

3.5 编码定类数据

3.6 编码定序变量

3.7 连续变量分箱

3.8 在流水线中封装预处理操作

3.9 拓展数值特征的模型基线

3.10 多项式特征模型性能

泰迪云课堂
操作演练/作业个人PC
在线答疑微信群

8月6日

18:30 - 22:00

4.1 特征选择介绍

4.2 数据导入及探索

4.3 基于皮尔逊相关系数的特征选择

4.4 特征选择前后模型性能比较

4.5 基于假设检验的特征选择

4.6 基于树的特征选择

4.7 特征选择后模型性能探索

4.8 基于线性模型的特征选择

4.9 小结

5.1 特征转换介绍

5.2 主成分分析(PCA)介绍

5.3 PCA工作流程实现

5.4 PCA方差分析

5.5 利用sklearn实现PCA

5.6 深入解释PCA之相关性探究

5.7 深入解释PCA之线性变换

5.8 深入解释PCA之数据分布探索

5.9 PCA小结

5.10 LDA工作流程及实现

5.11 sklearn实现LDA

5.12 LDA数据分布探索

5.13 应用特征转换

5.14 小结

泰迪云课堂

操作演练/作业

个人PC
在线答疑微信群
第四课 综合案例:水产养殖水质智能识别

8月7日

18:30 - 22:00

1.1 案例背景与目标

1.2 读取一张图片数据

1.3 获取图片数据的像素值矩阵

1.4 截取图像的有效区域

1.5 水质图像特征-颜色矩

1.6 三个颜色矩的Python实现

1.7 如何进行批量化数据转换

1.8 自定义函数获取指定路径中的所有图片名称

1.9 处理所有图片数据

1.10 数据处理代码整理

1.11 模型构建与性能评估

泰迪云课堂
操作演练/作业个人PC
在线答疑微信群
第五课 文本分类案例:垃圾短信智能识别

8月8日

18: 30 - 22:00

1 背景与目标

2 数据探索

2.1 数据读取

2.2 数据抽取

3 数据预处理

3.1 去除短信中的X序列

3.2 结巴分词

3.3 去除停用词

3.4 数据预处理函数封装

3.5 垃圾短信的词频统计

3.6 词云图绘制

4 文本向量的表示

4.1 文本数据的向量化表达

4.2 获取训练样本的tf-idf权值向量

4.3 获取测试样本的tf-idf权值向量

5 模型训练及评价

6 小结

泰迪云课堂
操作演练/作业个人PC
在线答疑微信群
第六课 综合实战:电商智能推荐-优惠券使用预测

8月9日

18:30 - 22:00

1 背景与目标

2 数据说明

2.1 线下训练集数据介绍

2.2 线上训练集数据介绍

2.3 测试数据介绍

2.4 项目流程介绍

3 数据预处理

3.1 构建正样本

3.2 构建负样本

3.3 构建样本标签

4 特征构建

4.1 特征构建介绍

4.2 处理Discount_rate列

4.3 特征1-折扣率

4.4 特征2-商户与用户之间的距离

5 模型训练

5.1 建模前数据准备

5.2 初级模型构建

5.3 ROC曲线与AUC值

5.4 模型性能评估

5.5 训练函数封装

5.6 模型预测

5.7 预测函数封装

6 特征完善

6.1 特征3-优惠券流行度

6.2 特征4-用户在商家中的消费次数

6.3 如何进行特征拼接

6.4 拼接训练集的特征3&4

6.5 拼接测试集的特征3&4

泰迪云课堂
操作演练/作业个人PC
在线答疑微信群
第七课 在线考试

8月10日

高级大数据技术应用职业技术证书在线考试泰迪云课堂