2021年第一期全国高校大数据与人工智能师资研修班邀请函

2020-12-08 泰迪智能科技 1825
分享到:
主办单位:泰迪杯数据挖掘挑战赛组委会
承办单位:
广东泰迪智能科技股份有限公司


当今世界,科技进步日新月异,互联网、云计算、大数据等现代信息技术深刻改变着人类的思维、生产、生活、学习方式,深刻展示了世界发展的前景。针对目前高校在人工智能专业建设过程中出现的师资不足、相关落地动手实战应用能力欠缺、授课过程中相关行业实战案例项目缺失等问题,进一步提升教学能力和科研能力,泰迪杯数据挖掘挑战赛组委会将联合推出全国高校大数据与人工智能师资研修班,每年在全国范围内滚动开展八期师资课程,截止目前已在全国巡回举办30余场,参训教师近3000人次,2021年第一期全国高校大数据与人工智能师资研修班将开设四大课题方向:“网络爬虫与数据处理、数据分析与挖掘实战、计算机视觉实战、自然语言处理实战”,本次研修班采用线上以云课堂形式举办,现将有关详细安排通知如下:


专题一  网络爬虫与数据处理

一、课程介绍

人工智能时代的来临,随着互联网数据越来越开放,越来越丰富。基于大数据来做的事也越来越多。数据分析服务、互联网金融、数据建模、医疗病例分析、自然语言处理、信息聚类,这些都是大数据的应用场景,而大数据的来源都是利用网络爬虫来实现。

本次培训采用“云课堂线上精讲+专家技术在线答疑指导+学员群内实操答疑+助教指导”结合的方式,包含前置基础课程学习阶段和核心课程学习阶段。讲解数据采集常用手段、数据清洗、数据可视化和项目代码实战,梳理技术框架。

二、课程目标级收获

1、通过学习本次课程,可以完整地学习数据获取、清洗、统计、分析、可视化等数据处理周期的主要技术,也可以培养计算思维、数据思维及采用程序设计方法解决计算问题的实战能力。

2、本课程配套有基础知识内容,可使零基础学员快速入门,带领学员迅速掌握Python编程,了解网络爬虫的基本概念及相关实现,讲解常见的爬虫套路并利用相关实战帮助学员提高数据采集能力,避免没有数据可分析的尴尬。

3、核心课程部分由讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解具体应用,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。

4、全面实战数据分析流程,包括数据采集、数据处理、数据探索、数据可视化等课程提供知识讲解,注重案例实战,提供在线答疑等服务,助力夯实理论基础,掌握核心技术,全面提升专业授课能力。

5、无论是前置学习篇,还是案例集训篇,相关代码、源数据、PPT、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持回看(支持六个月内免费回看),以便复习和参考。

6、参加线上课程学习的学员,如后续本人参加线下课程继续深造,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程)

三、课程大纲

基础篇 (报名成功后即可开始学习
时间课程内容学习平台
正式培训前

Python编程基

1 准备工作

2 列表操作

3 程序流程控制语句

4 字符串操作

4.1 字符串及其索引&切片

4.2 字符串的常见方法

4.3 字典的创建及索引

4.4 字典常用操作

4.5 字典推导式

5 Python文件读取操作

5.1 Python读取文件

5.2 练习3:统计小说中的单词频次

6 函数

6.1 Python函数自定义

6.2 练习4:自定义求序列偶数个数的函数

7 面向对象与模块

7.1 Python方法与函数对比介绍

7.2 Python面向对象示例

7.3 Python模块使用

7.4 第三方库的安装与调用

8 注意事项

8.1 Python工作路径说明

8.2 模块命令及存放路径的注意事项

8.3 结语

泰迪云课堂
核心课程篇
时间课程内容学习平台
专题讲座

1月19日

18:00 - 19:00

主讲:冯国灿教授

主题内容:计算机视觉技术及其应用

泰迪云课堂
第一课 Python数据处理与可视化

1月19日

19:00 - 21:30

1 Python数据分析概述

1.1 认识数据分析

1.2 熟悉Python数据分析的工具

1.3 安装Python3的Anaconda发行版

1.4 掌握Jupyter Notebook常用功能

2 NumPy数值计算基础

2.1 认识NumPy数组对象ndarray

2.2 认识NumPy矩阵与通用函数

2.3 利用NumPy进行统计分析

3 Matplotlib数据可视化基础

3.1 了解绘图基础语言与常用参数

3.2 分析特征间的关系

3.3 分析特征内部数据分布于分散状况

4 Pandas统计分析基础

4.1 读写不同数据源的数据

4.2 掌握DataFrame的常用操作

4.3 转换与处理时间序列数据

4.4 使用分组聚合进行组内计算

4.5 创建透视表与交叉表

泰迪云课堂
第一课作业
个人PC
在线答疑微信群
第二课 Python网络爬虫:概述与静态网页采集

1月20日

19:00 - 21:30

1.1 Python网络爬虫实战介绍

1.2 认识爬虫

1.3 认识反爬虫

1.4 Python爬虫环境

2 网页前端基础

2.1 概述

2.2 HTTP请求方法与过程

2.3 常见HTTP状态码

2.4 HTTP头部信息

2.5 认识cookies

2.6 小结

3 简单静态网页爬取

3.1 静态网页爬取概述

3.2 使用urllib3实现HTTP请求

3.3 使用requests库实现HTTP请求

3.4 谷歌开发者工具介绍

3.5 正则表达式介绍

3.6 使用正则表达式获取网页标题信息

3.7 使用XPath进行网页解析

3.8 使用BeautifulSoup进行网页解析

3.9 数据存储

3.10 小结

泰迪云课堂
第二课作业
个人PC
在线答疑微信群
第三课 Python网络爬虫:动态网页采集与模拟登陆

1月21日

19:00 - 21:30

4 常规动态网页爬取

4.1 常规动态网页爬取概述

4.2 逆向分析爬取动态网页

4.3 使用Selenium打开浏览对象

4.4 Selenium页面等待

4.5 使用Selenium获取图书信息

4.6 小结

5 模拟登录

5.1 模拟登录概述

5.2 查找表单数据入口及提交数据

5.3 验证码人工处理与代理IP

5.4 使用POST请求方法登录

5.5 使用浏览器cookies登录

5.6 基于表单登录的cookies登录

5.7 小结

泰迪云课堂
第三课作业
个人PC
在线答疑微信群
第四课 Python网络爬虫:终端协议分析与Scrapy爬虫

1月22日

19:00 - 21:30

6 终端协议分析

6.1 终端协议分析概述

6.2 了解HTTP Analyzer工具

6.3 爬取千千音乐PC客户端数据

6.4 小结

7 Scrapy爬虫

7.1 了解scrapy爬虫框架

7.2 熟悉scrapy的常用命令

7.3 创建scrapy爬虫项目:爬取网页动态信息

7.4 修改ItemPipelines脚本

7.5 编写spiders脚本

7.6 修改setting脚本

7.7 定制中间件

泰迪云课堂
操作演练
个人PC
在线答疑微信群
第五课 数据采集与处理实战:《流浪地球》豆瓣影评采集与分析

1月23日

19:00 - 21:30

1.1 案例背景与挖掘目标

2.1 短评数据爬取介绍

2.2 安装selenium及配置chromedriver

2.3 获取用户名

2.4 获取短评正文

2.5 设置cookies

2.6 获取用户居住地和入会时间信息

2.7 单页数据整理

2.8 自定义获取单页数据的函数

2.9 判定网页是否已被加载

2.10 翻页爬取

2.11 代码整理及小结

3.1 短评正文数据预处理

3.2 词频统计

3.3 绘制整体频率数据的词云图

3.4 好评差评词云图绘制及小结

3.5 评分分数分布统计

4.1 短评数量与日期的关系

4.2 短评数量与时间的关系

4.3 不同评分数量与时间的关系

4.4 评论最多的前十个城市

4.5 评分数量与城市的关系

5.1 总结

泰迪云课堂
操作演练
个人PC
在线答疑微信群
第六课 数据采集与处理实战:大数据岗位人才招聘信息的分析与挖掘

1月24日

19:00 - 21:30

1.1 背景与目标

2.1 信息爬取介绍

2.2 获取岗位名称数据

2.3 获取目录页的所有字段信息

2.4 获取二级网址的网页链接

2.5 获取二级网址的所有字段信息

2.6 对单一目录页中的所有二级网页信息及进行抓取

2.7 将第一个目录页的数据进行保存

2.8 批量爬取及数据保存

3.1 已爬取数据介绍

3.2 根据岗位名筛选招聘信息_batch

3.3 统一岗位名称

3.4 根据工资列筛选数据

3.5 完成工资数据处理

3.6 工作地点字段处理

3.7 公司类型字段处理

3.8 行业字段数据处理

3.9 工作描述字段处理_batch

3.10 公司规模字段处理

3.11 数据预处理小结

4.1 热门招聘岗位可视化

4.2 热门行业及公司招聘分析

4.3 热门岗位的工资水平

4.4 可视化综合分析_batch

4.5 岗位技能分析

5 总结

泰迪云课堂
操作演练
个人PC
在线答疑微信群
自行安排

拓展自学

Python爬虫助力疫情数据追踪

1 明确项目需求与目标

2 环境准备

3 获取疫情数据(全球、中国各省及各地区数据)

4 疫情数据分析

5 疫情数据可视化

6 完成分析报告

泰迪云课堂

第七课 在线考试

1月25日

19:00 - 21:30

高级Python技术应用工程师职业技术在线考试
泰迪云课堂

四、证书认证

学员经在线培训并考试合格后,可以获得高级Python技术应用工程师职业技术证书。


专题二 数据分析与挖掘实战

一、课程介绍

随着大数据时代的到来,对于数据的要求不仅仅是存储和管理,更重要的是需要对大量数据进行分析、加工最后再决策。数据分析与挖掘可以从海量数据中获得别人看不见的信息,创业者可以通过数据分析来优化产品,营销人员可以通过数据分析改进营销策略,产品经理可以通过数据分析洞察用户习惯,金融从业者可以通过数据分析规避投资风险,程序员可以通过数据分析进一步挖掘出数据价值

本次培训采用“云课堂线上精讲+专家技术在线答疑指导+学员群内实操答疑+助教指导”结合的方式,主要讲解了使用Python进行数据分析与挖掘的相应理论与代码实践,梳理技术框架,从根本上解决如何使用模型、优化模型的问题,通过讲解企业级案例,真正的让各位老师可以了解到所学内容如何何实际结合,做到更好的进行教育教学工作。

二、课程目标及收获

1、本课程全程强调动手实操:内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解企业级案例,真正的让学员把所学内容和工作实际有效结合,做到更好的进行教育教学工作。视频制作精良,讲师真人出镜,系统梳理课程知识框架,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。

2、核心课程部分由讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作,实际动手的能力。通过讲解具体应用,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。

3、全面时间商务数据分析流程,包括数据处理、数据探索、数据建模等课程提供知识讲解,注重案例实战,提供在线答疑等服务,助力夯实理论基础,掌握核心技术,全面提升专业授课能力。

4、无论是前置学习篇还是案例集训篇,相关代码、数据源、PPT、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持回看(支持六个月内免费回看),以便复习和参考。

三、课程大纲(线上)

基础篇 (报名成功后即可开始学习
时间课程内容学习平台
正式培训前

Python编程基

1 准备工作

2 列表操作

3 程序流程控制语句

4 字符串操作

4.1 字符串及其索引&切片

4.2 字符串的常见方法

4.3 字典的创建及索引

4.4 字典常用操作

4.5 字典推导式

5 Python文件读取操作

5.1 Python读取文件

5.2 练习3:统计小说中的单词频次

6 函数

6.1 Python函数自定义

6.2 练习4:自定义求序列偶数个数的函数

7 面向对象与模块

7.1 Python方法与函数对比介绍

7.2 Python面向对象示例

7.3 Python模块使用

7.4 第三方库的安装与调用

8 注意事项

8.1 Python工作路径说明

8.2 模块命令及存放路径的注意事项

8.3 结语

泰迪云课堂
核心课程篇
时间课程内容学习平台
专题讲座

1月19日

18:00 - 19:00

主讲:冯国灿教授

主题内容:计算机视觉技术及其应用

泰迪云课堂
第一课 Python数据分析与应用

1月19日

19:00 - 21:30

1 Python数据分析概述

1.1 认识数据分析

1.2 熟悉Python数据分析的工具

1.3 安装Python3的Anaconda发行版

1.4 掌握Jupyter Notebook常用功能

2 使用Pandas进行数据预处理

2.1 合并数据

2.2 清洗数据

2.3 标准化数据

2.4 转换数据

3 使用scikit-learn构建模型

3.1 使用sklearn转换器处理数据

3.2 构建并评价聚类模型

3.3 构建并评价分类模型

3.4 构建并评价回归模型

泰迪云课堂
第一课作业
个人PC
在线答疑微信群
第二课 Python数据分析实训

1月20日

19:00 - 21:30

1 探索Iris鸢尾花数据

1.1 将数据集存成变量iris创建数据框的列名称

1.2 数据框中有缺失值吗?

1.3 将列petal_length的第10到19行设置为缺失值

1.4 将petal_length缺失值全部替换为1.0

1.5 删除列class

1.6 将数据框前三行设置为缺失值

1.7 删除有缺失值的行

1.8 重新设置索引

2 探索Chipotle快餐数据

2.1 将数据存入一个名为chipo的数据框内

2.2 查看前10行内容

2.3 数据集中有多少个列(columns)?

2.4 打印出全部的列名称

2.5 数据集的索引是怎样的?

2.6 被下单数最多商品(item)是什么?

2.7 在item_name这一列中,一共有多少种商品被下单?

2.8 一共有多少个商品被下单?

2.9 将item_price转换为浮点数

2.10 在该数据集对应的时期内,收入(revenue)是多少?

2.11 在该数据集对应的时期内,一共有多少订单?

2.12 每一单(order)对应的平均总价是多少?

3 探索Apple公司股价数据

3.1 读取"appl_1980_2014.csv"数据并存为一个名叫apple的数据框

3.2 查看每一列的数据类型

3.3 将Date这个列转换为datetime类型

3.4 将Date设置为索引

3.5 有重复的日期吗?

3.6 将index设置为升序

3.7 找到每个月的最后一个交易日(businessday)

3.8 数据集中最早的日期和最晚的日期相差多少天?

3.9 在数据中一共有多少个月?

3.10 按照时间顺序可视化Adj Closs值

泰迪云课堂
第二课作业
个人PC
在线答疑微信群
第三课 机器学习实战

1月21日

19:00 - 21:30

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

3 回归分析(RegressionAnalysis)

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

4 聚类分析(ClusterAnalysis)

4.1 聚类分析概述

4.2 相似性度量

4.3 K-Means聚类分析算法介绍

4.4 利用K-Means算法对鸢尾花进行聚类

4.5 聚类结果的性能度量

4.6 调用sklearn实现聚类分析

泰迪云课堂
第三课作业
个人PC
在线答疑微信群
第四课 机器学习实战案例:市财政收入分析预测

1月22日

19:00 - 21:30

1 背景与案例目标

1.1 财政收入预测背景介绍

1.2 数据基本情况介绍

1.3 分析目标解读

1.4 项目流程介绍

2 相关系数分析

2.1 求解person相关系数

2.2 person相关系数解读

3 Lasso回归特征提取

3.1 了解Lasso回归方法

3.2 Lasso回归选取关键特征的实现

3.3 Lasso回归数据写出及相应解读

4 灰色预测模型

4.1 关键特征数据读取及准备

4.2 GM11特征值预测

4.3 GM11特征数据整理及写出

5 模型训练及预测

5.1 数据标准化

5.2 模型训练及预测

5.3 结果可视化

泰迪云课堂
操作演练
个人PC
在线答疑微信群
第五课 文本挖掘实战

1月23日

19:00 - 21:30

1 自然语言处理简介

2 开源中文NLP系统介绍

3 中文分词介绍

4 机械分词法

5 机器学习算法分词

6 NLP概率图介绍

7 jieba分词演示

8 文本的one-hot表达

9 tf-idf权值策略实现

10 文本的TF-IDF表达

11 模型训练与预测

泰迪云课堂
操作演练
个人PC
在线答疑微信群
第六课 文本分类案例:垃圾短信智能识别

1月24日

19:00 - 21:30

1 背景与目标

2 数据探索

2.1 数据读取

2.2 数据抽取

3 数据预处理

3.1 去除短信中的x序列

3.2 结巴分词

3.3 去除停用词

3.4 数据预处理函数封装

3.5 垃圾短信的词频统计

3.6 词云图绘制

4 文本向量的表示

4.1 文本数据的向量化表达

4.2 获取训练样本的tf-idf权值向量

4.3 获取测试样本的tf-idf权值向量

5 模型训练及评价

6 小结

泰迪云课堂
操作演练
个人PC
在线答疑微信群
第七课 综合实战:电商智能推荐-优惠券使用预测

1月25日

14:00 - 18:00

1 背景与目标

2 数据说明

2.1 线下训练集数据介绍

2.2 线上训练集数据介绍

2.3 测试数据介绍

2.4 项目流程介绍

3 数据预处理

3.1 构建正样本

3.2 构建负样本

3.3 构建样本标签

4 特征构建

4.1 特征构建介绍

4.2 处理Discount_rate列

4.3 特征1-折扣率

4.4 特征2-商户与用户之间的距离

5 模型训练

5.1 建模前数据准备

5.2 初级模型构建

5.3 ROC曲线与AUC值

5.4 模型性能评估

5.5 训练函数封装

5.6 模型预测

5.7 预测函数封装

6 特征完善

6.1 特征3-优惠券流行度

6.2 特征4-用户在商家中的消费次数

6.3 如何进行特征拼接

6.4 拼接训练集的特征3&4

6.5 拼接测试集的特征3&4

7 预测

7.1 模型训练

7.2 预测

7.3 代码整理

7.4 结果提交

泰迪云课堂
操作演练
个人PC
在线答疑微信群

第八课 在线考试

1月26日

19:00 - 21:30

高级大数据技术应用职业技术在线考试
泰迪云课堂

四、课程大纲(线下)


第一部分:线上学习(报名成功后即可开始学习)
时间课程内容学习平台
正式培训前

Python编程基础

1 准备工作

2 列表操作

3 程序流程控制语句

4 字符串操作

4.1 字符串及其索引&切片

4.2 字符串的常见方法

4.3 字典的创建及索引

4.4 字典常用操作

4.5 字典推导式

5 Python文件读取操作

5.1 Python读取文件

5.2 练习3:统计小说中的单词频次

6 函数

6.1 Python函数自定义

6.2 练习4:自定义求序列偶数个数的函数

7 面向对象与模块

7.1 Python方法与函数对比介绍

7.2 Python面向对象示例

7.3 Python模块使用

7.4 第三方库的安装与调用

8 注意事项

8.1 Python工作路径说明

8.2 模块命令及存放路径的注意事项

8.3 结语

泰迪云课堂
第二部分:线下实战         学习时间:2021年1月20日 - 24日
时间课程内容学习平台
1月20日报到全天

1月21日

Python数据分析与应用

1 Python数据分析概述

1.1 认识数据分析

1.2 熟悉Python数据分析的工具

1.3 安装Python3的Anaconda发行版

1.4 掌握Jupyter Notebook常用功能

2 使用Pandas进行数据预处理

2.1 合并数据

2.2 清洗数据

2.3 标准化数据

2.4 转换数据

Python数据分析实训

练习1 探索Chipotle快餐数据

1 将数据集存入一个名为chipo的数据框内

2 查看前10行内容

3 数据集中有多少个列(columns)?

4 打印出全部的列名称

5 数据集的索引是怎样的?

6 被下单数最多商品(item)是什么?

7 在item_name这一列中,一共有多少种商品被下单?

8 一共有多少个商品被下单?

9 将item_price转换为浮点数

10 在该数据集对应的时期内,收入(revenue)是多少?

11 在该数据集对应的时期内,一共有多少订单?

12 每一单(order)对应的平均总价是多少?

练习2 用户用电量统计分析

1 将数据进行转置,转置后行为用户编号、列为日期、值为用户每日用电量。

2 对数据中的异常数据进行识别并处理

3 统计每个用户用电数据的基本统计量,包括:最大值、最小值、均值、中位数、和、

方差、偏度、峰度。

4 每个用户用电数据按日差分,并求取差分结果的基本统计量,统计量同3

5 求取每个用户的5%分位数

6 每个用户按周求和差分(一周7天,年度分开),并求取差分结果的基本统计量,统计量同3

7 统计每个用户的日用电量在其最大值0.9倍以上的次数

8 合并上述特征

9:00 - 12:00

14:00 - 17:00

1月22日

机器学习实战

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量Python实现

市财政收入预测

1 背景与案例目标

2 相关系数分析

2.1 求解person相关系数

2.2 person相关系数解读

3 Lasso回归特征提取

3.1 了解Lasso回归方法

3.2 Lasso回归选取关键特征的实现

3.3 Lasso回归数据写出集相应解读

4 灰色预测模型

4.1 关键特征数据读取及准备

4.2 GM11特征值预测

4.3 GM11特征数据整理及写出

5 模型训练及预测

5.1 数据标准化

5.2 模型训练及预测

5.3 结果可视化

垃圾短信智能识别

1 背景与目标

2 数据探索

2.1 数据读取

2.2 数据抽取

3 数据预处理

3.1 去除短信中的x序列

3.2 结巴分词

3.3 去除停用词

3.4 数据预处理函数封装

3.5 垃圾短信的词频统计

3.6 词云图绘制

4 文本向量的表示

4.1 文本数据的向量化表达

4.2 获取训练样本的tf-idf权值向量

4.3 获取测试样本的tf-idf权值向量

5 模型训练及评价

6 小结

9:00 - 12:00

14:00 - 17:00

1月23日


Python网络爬虫

1 Python爬虫介绍

1.1 认识爬虫

1.2 认识反爬虫

1.3 Python爬虫环境

2 网页爬虫

2.1 了解Python爬虫基本流程

2.2 实现HTTP请求

2.3 网页解析

2.4 数据存储

3 常规动态网页爬取

3.1 常规动态网页爬取概述

3.2 逆向分析爬取动态网页

3.3 使用Selenium打开浏览对象

3.4 Selenium页面等待

3.5 使用Selenium获取图书信息

Python爬虫实战

练习1 爬取网站”泰迪智能科技“(http://www.tipdm.com/)导航条的信息

练习2 爬取”泰迪智能科技“(http://www.tipdm.com/)新闻中心中公司新闻的信息

练习3 获取人邮网站新书资讯

练习4 采集京东商品评论数据

9:00 - 12:00

14:00 - 17:00

1月24日

综合实战:电商智能推荐-优惠券使用预测

1 背景与目标

2 数据说明

2.1 线下训练集数据介绍

2.2 线上训练集数据介绍

2.3 测试数据介绍

2.4 项目流程介绍

3 数据预处理

3.1 构建正样本

3.2 构建负样本

3.3 构建样本标签

4 特征构建

4.1 特征构建介绍

4.2 处理Discount_rate列

4.3 特征1-折扣率

4.4 特征2-商户与用户之间的距离

5 模型训练

5.1 建模前数据准备

5.2 初级模型构建

5.3 ROC曲线与AUC值

5.4 模型性能评估

5.5 训练函数封装

5.6 模型预测

5.7 预测函数封装

6 特征完善

6.1 特征3-优惠券流行度

6.2 特征4-用户在商家中的消费次数

6.3 如何进行特征拼接

6.4 拼接训练集的特征3&4

6.5 拼接测试集的特征3&4

7 预测

7.1 模型训练

7.2 预测

7.3 代码整理

7.4 结果提交

9:00 - 12:00

14:00 - 17:00

1月25日

大数据企业参观访学

在线考试

高级大数据技术应用职业技术在线考试

泰迪云课堂

五、证书颁发

学员经在线培训并考试合格后,可以获得高级大数据技术应用职业技术证书。


专题三 计算机视觉实战

一、课程介绍

计算机视觉是一门研究如何使机器"看"的科学,掌握解决具体计算机视觉任务的方法则会帮助我么解决大规模系统的复杂问题,其应用相当广泛,包括并不限于:图像分类,人脸识别:车辆检测,行人检测等。

本次培训采用“云课堂线上精讲+专家技术在线答疑指导+学员群内实操答疑+助教指导”结合的方式,通过讲解计算机视觉经典应用的常用方法及实现原理使大家对深度学习,计算机视觉等相关领域有更深刻的认识,同时会结合人脸识别业务中的时间工具来手动实现活体检测等常见应用,并从中了解项目开发的一系列流程。

二、课程目标及收获

1、主要介绍了计算机视觉的基本概念、图像处理、图像特征与匹配、卷积神经网络及其在图像处理中的应用等基本思想原理、流行算法和技术,以及深度学习中的卷积神经网络原理、训练和典型网络结构。着重讲师计算机中的几个主要任务:图像特征与匹配、图像分类、人脸识别中的卷积神经网络模型及学习过程;同时,将方法与理论(卷积神经网络,计算视觉理论)紧密结合,理论与实践相结合

2、全面实践计算机视觉项目开发流程,包括图像采集、图像处理、数据建模、业务应用等课程提供知识讲解,注重案例实战,提供在线答疑等服务,助力夯实理论基础,掌握核心技术,全面提升专业授课能力。

3、核心课程内容讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解具体应用,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。

4、无论是前置学习篇还是案例集训篇,相关代码、数据源、PPT、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持回看(支持六个月内免费回看),以便复习和参考。

5、参加线上课程学习的学员,如后续本人参加线下课程继续深造,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程)。

三、课程大纲

基础篇 (报名成功后即可开始学习
时间课程内容学习平台
正式培训前

Python编程基础

1 准备工作

2 列表操作

3 程序流程控制语句

4 字符串操作

4.1 字符串及其索引&切片

4.2 字符串的常见方法

4.3 字典的创建及索引

4.4 字典常用操作

4.5 字典推导式

5 Python文件读取操作

5.1 Python读取文件

5.2 练习3:统计小说中的单词频次

6 函数

6.1 Python函数自定义

6.2 练习4:自定义求序列偶数个数的函数

7 面向对象与模块

7.1 Python方法与函数对比介绍

7.2 Python面向对象示例

7.3 Python模块使用

7.4 第三方库的安装与调用

8 注意事项

8.1 Python工作路径说明

8.2 模块命令及存放路径的注意事项

8.3 结语

泰迪云课堂

Python数据分析与应用

1 Python数据分析概述

1.1 认识数据分析

1.2 熟悉Python数据分析的工具

1.3 安装Python3的Anaconda发行版

1.4 掌握Jupyter Notebook常用功能

2 NumPy数值计算基础

2.1 认识NumPy数组对象ndarray

2.2 认识NumPy矩阵与通用函数

2.3 利用NumPy进行统计分析

3 Matplotlib数据可视化基础

3.1 了解绘图基础语言与常用参数

3.2 分析特征间的关系

3.3 分析特征内部数据分布于分散状况

4 Pandas统计分析基础

4.1 读写不同数据源的数据

4.2 掌握DataFrame的常用操作

4.3 转换与处理时间序列数据

4.4 使用分组聚合进行组内计算

4.5 创建透视表与交叉表

5 使用Pandas进行数据预处理

5.1 合并数据

5.2 清洗数据

5.3 标准化数据

5.4 转换数据

Python机器学习

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

3 回归分析(RegressionAnalysis)

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

核心课程篇
时间课程内容学习平台
专题讲座

1月26日

18:00 - 19:00

主讲:冯国灿教授

主题内容:计算机视觉技术及其应用

泰迪云课堂
第一课 深度学习基础-人工神经网络

1月26日

19:00 - 21:30

1 单个神经元介绍

2 经典网络结构介绍

3 神经网络工作流程演示

4 如何修正网络参数、梯度下降

5 网络工作原理推导

6 网络搭建准备

7 样本从输入层到隐层传输的Python实现

8 网络输出的Python实现

9 单样本网络训练的Python实现

10 全样本网络训练的Python实现

11 网络性能评价

12 调用sklearn实现神经网络算法

泰迪云课堂
操作演练
个人PC
在线答疑微信群
第二课 TensorFlow2实战

1月27日

19:00 - 21:30

1任务1:构建一个线性模型

1.1 TensorFlow介绍

1.2 TensorFolw2常用数据类型和操作

1.3 初始化模型

1.4 构建损失函数

1.5 模型训练及可视化

1.6 使用高阶API-Keras

2 任务2:MNIST手写数字识别

2.1 数据读取及探索

2.2 交叉熵

2.3 模型构建及训练

2.4 调用保存好的模型对新样本进行预测

3 作业-鸢尾花分类

泰迪云课堂
操作演练
个人PC
在线答疑微信群
第三课 人工智能核心课-深度神经网络

1月28日

19:00 - 21:30

1.1 深度圣经网络-引言

2 卷积神经网络CNN

2.1 浅层神经网络的局限

2.2 卷积操作

2.3 卷积操作的优势

2.4 池化及全连接

2.5 高维输入及多filter卷积

2.6 实现卷积操作

2.7 实现池化操作

3 循环神经网络RNN

3.1 循环神经网络简介

3.2 循环神经网络的常见结构

4 长短时记忆网络LSTM

4.1 LSTM的三个门

4.2 LSTM三个门的计算示例

4.3 利用RNN&LSTM实现mnist手写数字识别

泰迪云课堂
操作演练
个人PC
在线答疑微信群
第四课 图像处理实战:水产养殖水质智能识别

1月29日

19:00 - 21:30

1 案例背景与目标

2 读取一张图片数据

3 获取图片数据的像素值矩阵

4 截取图像的有效区域

5 水质图像特征-颜色矩

6 三个颜色矩的Python实现

7 如何进行批量化数据转换

8 自定义函数获取指定路径中的所有图片名称_x264

9 处理所有图片数据

10 数据处理代码整理

泰迪云课堂
操作演练
个人PC
在线答疑微信群
第五课 计算机视觉实战:动态人脸智能识别

1月30日

19:00 - 21:30

1 案例背景及介绍

2 人脸识别流程及实现

2.1 人脸识别案例流程

2.2 工程文件说明

2.3 人脸采集

2.4 人脸检测

2.5 灰度处理

2.6 模型结构与训练

2.7 模型测试

2.8 模型应用:调用电脑摄像头采集数据

2.9 模型应用:人脸检测

2.10 模型应用:模型测试与展示

3 人脸识别拓展思考

泰迪云课堂
操作演练
个人PC
在线答疑微信群
第六课 综合实战:搭建一个智能车牌识别系统

1月31日

19:00 - 21:30

1 明确项目目标

2 准备数据

3 照片预处理

4 定位车牌信息

5 分割车牌字符

6 搭建车牌识别网络

7 进行模型训练

8 模型结果与评估

泰迪云课堂
操作演练
个人PC
在线答疑微信群

第七课 在线考试

2月1日

19:00 - 21:30

高级大数据技术应用职业技术在线考试
泰迪云课堂

四、证书认证

学员经在线培训并考试合格后,可以获得高级大数据技术应用职业技术证书。


专题四 自然语言处理实战

一、课程介绍

自然语言处理(Natural Language Processing, 简称NLP)是人工智能和语言学交叉领域下的分支学科。用于分析、理解和生成自然语言,以方便人和计算机设备进行交流,以及人与人之间的交流。随着人工智能的快速发展,自然语言处理和机器学习技术的应用愈加广泛。

本次培训主要讲解自然语言处理过程中使用的前沿原理与具体实现,采用"云课堂线上精讲+专家技术在线答疑指导+学员群内实操答疑+助教指导"结合的方式,梳理技术框架,从根本上解决如何使用模型、优化模型的问题,通过讲解企业级案例,真正的让各位老师可以了解到所学内容如何和实际结合,做到更好的及逆行教育教学工作。

二、课程目标及收获

1、主要介绍了自然语言处理中的基本概念、预料库概述、文本预处理技术、循环神经网络及变体在自然语言中的使用,并通过实现垃圾短信过滤、自动应答机器人的搭建等项目深入理解相关应用,使得理论与实践结合,做到更好的进行教育教学工作。

2、核心课程部分:讲师手把手一起进行实操演练,在案例场景中全面掌握相关技能,进一步提升专项能力,助力实际案例实训教学工作、实际动手的能力。

3、讲师将在线上对项目进行深入剖析和演示,可以与课程讲师以及学习该课程的其他老师直接进行沟通研讨,快速提升专项能力!

4、无论是前置学习篇还是案例集训篇,相关代码、数据源、PPT、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持回看(支持六个月内免费回看),以便复习和参考。

5、同时,参加线上课程学习的学员,如后续本人参加线下课程继续深造,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程)

三、课程大纲

基础篇 (报名成功后即可开始学习
时间课程内容学习平台
正式培训前

Python编程基础

1 准备工作

2 列表操作

3 程序流程控制语句

4 字符串操作

4.1 字符串及其索引&切片

4.2 字符串的常见方法

4.3 字典的创建及索引

4.4 字典常用操作

4.5 字典推导式

5 Python文件读取操作

5.1 Python读取文件

5.2 练习3:统计小说中的单词频次

6 函数

6.1 Python函数自定义

6.2 练习4:自定义求序列偶数个数的函数

7 面向对象与模块

7.1 Python方法与函数对比介绍

7.2 Python面向对象示例

7.3 Python模块使用

7.4 第三方库的安装与调用

8 注意事项

8.1 Python工作路径说明

8.2 模块命令及存放路径的注意事项

8.3 结语

泰迪云课堂

Python数据分析与应用

1 Python数据分析概述

1.1 认识数据分析

1.2 熟悉Python数据分析的工具

1.3 安装Python3的Anaconda发行版

1.4 掌握Jupyter Notebook常用功能

2 NumPy数值计算基础

2.1 认识NumPy数组对象ndarray

2.2 认识NumPy矩阵与通用函数

2.3 利用NumPy进行统计分析

3 Matplotlib数据可视化基础

3.1 了解绘图基础语言与常用参数

3.2 分析特征间的关系

3.3 分析特征内部数据分布于分散状况

4 Pandas统计分析基础

4.1 读写不同数据源的数据

4.2 掌握DataFrame的常用操作

4.3 转换与处理时间序列数据

4.4 使用分组聚合进行组内计算

4.5 创建透视表与交叉表

5 使用Pandas进行数据预处理

5.1 合并数据

5.2 清洗数据

5.3 标准化数据

5.4 转换数据

Python机器学习

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

3 回归分析(RegressionAnalysis)

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

核心课程篇
时间课程内容学习平台
专题讲座

1月26日

18:00 - 19:00

主讲:冯国灿教授

主题内容:计算机视觉技术及其应用

泰迪云课堂
第一课 深度学习基础-人工神经网络

1月26日

19:00 - 21:30

1 单个神经元介绍

2 经典网络结构介绍

3 神经网络工作流程演示

4 如何修正网络参数、梯度下降

5 网络工作原理推导

6 网络搭建准备

7 样本从输入层到隐层传输的Python实现

8 网络输出的Python实现

9 单样本网络训练的Python实现

10 全样本网络训练的Python实现

11 网络性能评价

12 调用sklearn实现神经网络算法

泰迪云课堂
操作演练
个人PC
在线答疑微信群
第二课 TensorFlow2实战

1月27日

19:00 - 21:30

1任务1:构建一个线性模型

1.1 TensorFlow介绍

1.2 tensorFlow2常用数据类型和操作

1.3 初始化模型

1.4 构建损失函数

1.5 模型训练及可视化

1.6 使用高阶API -keras

2 任务2:MNIST手写数字识别

2.1 数据读取及探索

2.2 交叉熵

2.3 模型构建及训练

2.4 调用保存好的模型对新样本进行预测

3 作业-鸢尾花分类

泰迪云课堂
操作演练
个人PC
在线答疑微信群
第三课 人工智能核心课程-深度神经网络

1月28日

19:00 - 21:30

1.1 深度神经网络-引言

2 卷积神经网络CNN

2.1 浅层神经网络的局限

2.2 卷积操作

2.3 卷积操作的优势

2.4 池化及全连接

2.5 高维输入及多filter卷积

2.6 实现卷积操作

2.7 实现池化操作

3 循环神经网络RNN

3.1 循环神经网络简介

3.2 循环神经网络的常见结构

4 长短时记忆网络LSTM

4.1 LSTM的三个门

4.2 LSTM三个门的计算示例

4.3 利用RNN&LSTM实现mnist手写数字识别

泰迪云课堂
操作演练
个人PC
在线答疑微信群
第四课 路透社新闻分类

1月29日

19:00 - 21:30

1 项目背景与目标

2 数据探索分析

2.1 读取新闻数据

2.2 了解数据的基本情况

3 词嵌入(Word Embedding)

3.1 word embedding的基本概念

3.2 word2vec介绍

3.3 CBOW词向量训练过程

4 构建模型

4.1 数据padding

4.2 网络结构中的Embedding层

4.3 构建RNN网络模型

4.4 模型训练及评估

5 模型优化

5.1 词向量预训练

5.2 模型优化

泰迪云课堂
操作演练
个人PC
在线答疑微信群
第五课 搭建一个属于自己的聊天机器人

1月30日

19:00 - 21:30

1 项目背景与目标

2 语料库预处理

3 Seq2Seq模型计算图搭建--文件读取

4 Seq2Seq模型计算图搭建--Encoder

5 Seq2Seq模型计算图搭建--Decoder

6 Seq2Seq模型计算图搭建--Seq2Seq

7 模型训练

8 模型测试

9 注意力机制

泰迪云课堂
操作演练
个人PC
在线答疑微信群
第六课 综合实战:基于深度学习的推荐系统受众性别预测

1月31日

19:00 - 21:30

1 项目文件结构及编辑环境介绍

2 数据获取与探索分析答案讲解

3.1 理解用户单击流相关概念

3.2 获取用户的各单击流数据

4 对各单击流数据进行探索

5.1 对用户单击流数据进行预处理

5.2 进行词向量训练

5.3 对用户的单击流进行编码及padding操作

5.4 将词向量矩阵做相应排序并储存

5.5 将单击流数据转化为二维样本数据并存储

6.1 建模前数据整理

6.2 模型训练及性能评估

7.1 模型优化-并行网络结构介绍

7.2 模型优化

泰迪云课堂
操作演练
个人PC
在线答疑微信群

第七课 在线考试

2月1日

19:00 - 21:30

机器学习工程师职业技术在线考试
泰迪云课堂

四、证书认证

学员经在线培训并考试合格后,可以获得高级机器学习工程师"职业技术证书。


课程主讲师资介绍

冯国灿.jpg

    冯国灿      博士,中山大学数学学院教授,博士生导师。泰迪杯数据挖掘挑战赛组委会委员,中国工业与应用数学会常务理事,广东省工业与应用数学学会理事长,2000-2002英国格莱莫根大学数字图像实验室和布拉德福大学数字媒体实验室做博士后研究员。主要从事模式识别、计算机视觉研究,参加主持包括国家自然科学基金等科学基金20多项,发表学术论文100余篇,入选2014-2019爱思唯尔计算机科学中国高被引学者排行榜。

张敏.jpg

     张敏     广东泰迪科技高级数据分析师、培训总监,从事用户数据分析和数据挖掘工作六年,具有丰富的大数据挖掘理论及实践培训经验,对数据具有较高的敏感度,根据数据对其进行全面的统计分析。精通Python、R语言、Matlab等多种数据挖掘工具。擅场市场发展情况监控、精确营销封面的数据挖掘工作。有位南方电网、主讲数码等大型企业长期提供实施服务的经验,主导了电子商务网站用户行为分析及网页智能推荐服务、中医证型关联规则挖掘、电信业务话单量预测、航空公司客户价值分析等多个项目。2017年"泰迪杯数据挖掘挑战赛教练员培训"主讲讲师,2018年广东省Python与深度学习技术师资培训班主讲讲师,2018年第一/三/五期全国高校大数据核心技术与应用师资研修班主讲讲师、2019年第一/二/三期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北、湖南省、甘肃省电力系统培训班主讲讲师,广东石油化工学院、上海健康医学院等高校实训课程及德生科技等企业内训和数据挖掘就业班的课程。组织、参与编写图书《Python编程基础》、《Python数据分析与应用》、《R语言编程基础》等。

杨惠-1.jpg

    杨惠    广东泰迪科技高级数据分析师,具备丰富的培训经验,曾为多家企业、院校服务过专业培训工作。如PPV商业培训、泰迪大数据师资培训、珠海城职院数据分析培训;2018年第一、三、五期全国高校大数据核心技术与应用师资研修班主讲讲师;2019年第一、三、五期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北省电力系统培训班主讲讲师。从事数据挖掘工作五年,擅长文本挖掘及深度神经网络RNN,熟悉常用机器学习算法原理及应用,如神经网络、SVM、决策树、贝叶斯等算法;精通R、Python、Matlab等常用数据挖掘处理工具。具有丰富的实践项目经验。如"京东电商产品评论情感分析"项目;"珠江数码大数据营销推荐应用"项目;"电子商务网站智能推荐服务"项目。

报名须知与联系方式

报名须知
专题时长开课日期费用(元)
课程安排网络爬虫与数据处理7天共70课时2021年1月19-25日1980元
数据分析与挖掘实战7天共70课时2021年1月19-25日1980元
计算机视觉实战7天共70课时2021年1月26-2月1日2480元
自然语言处理实战7天共75课时2021年1月26-2月1日2480元

数据分析与挖掘实战

(线下班)

5天共70课时

2021年1月20-25日(20日全天报到)

21-24日 上午09:00-12:00;下午14:00-17:00全天上课,25日参访

3900元

培训地点:泰迪总部

地址:广州黄埔区开泰大道36号

说明:因疫情管控,本期先下班限定40人,培训班学员住宿统一安排,食宿费用自理

1 费用:包含报名费、学习费、资料费、证书费等。

2 报名材料:报名申请表、身份证复印件、两寸近期正面免冠彩色半身证件照电子版(要求:白色背景底,.jpg格式,14-20K大小)

3 本次用广东泰迪智能科技股份有限公司收取费用并开具发票。

4 本期研修班两专题及以上联报者可享受九折优惠。

联系方式:

联系人:曾老师                             微  信:antonia602501

手   机:13246821827                  邮  箱:zengaizhi@tipdm.com


请下载附件:2021年全国高校大数据与人工智能师资研修班邀请函 和 报名回执表