2023年第五期_全国高校大数据与人工智能骨干师资研修班开班通知

2023-05-23 泰迪智能科技 319
分享到:

主办单位:

泰迪杯数据挖掘挑战赛组委会
协办单位:广州人工智能公共算力中心

华为技术有限公司

人民邮电出版社有限公司

北京泰迪云智信息技术研究院
承办单位:广东泰迪智能科技股份有限公司


新一代信息技术正深刻改变着人们的生产、生活、学习乃至思维方式,其朝气蓬勃的产业发展态势和大力度的国家政策鼓励支持,无不揭示了数据智能技术的重要性。人才的培养是新一轮科技较量的基础,高等院校承担着大数据与人工智能人才培养的重任,因此,各高等院校非常重视大数据课程,尽快形成成熟完善的培养方案、课程体系、系列教材、课程师资和实训平台等,是各大高校共同关注的重要事宜。

为推动各院校完善专业建设,解决专业教学中行业案例缺失和实战能力不足等相关痛点问题,泰迪科技基于十余年深耕数据智能产业实践经验,特推出全国高校大数据与人工智能师资研修班。每年在全国范围内滚动开展,截止目前已在全国巡回举办60余场,参训教师近7000人次。2023年第五期全国高校大数据与人工智能师资研修班将开设七大专题方向,青岛和广州两大会场同步举办,现将有关安排通知如下:

一、 课程特色

1、线上线下自由选

本次研修班提供两种学习模式,即线下线上混合班和纯线上班,混合班融合了线上和线下学习各自的优势,技能课在线上学、核心案例在线下学,可充分提升学习效果;线上班则更自由灵活,学习过程相对不受时间和地点限制。

2、企业案例实战+落地实操授课

课程全程强调动手实操,内容以代码落地为主,通过讲解企业级案例,真正让学员把所学内容和工作实际有效结合,从而更好地完成自身后续教育教学工作。

3、全方位答疑辅导学习

课程设有答疑交流讨论群,培训期间助教全程辅助教学。线上学习部分每天提供10小时的实时在线答疑辅导,线下学习部分则有主讲老师和助教面对面的帮助。

4、内容从浅及深更易入门

本课程配套有基础知识内容,即使零基础学员也能找到适合自己的学习内容和节奏,快速掌握课程知识和技能。

5、提供课程资源和回看功能

所有课程相关源代码、数据、PPT、案例素材全部提供下载,即学即用,教学更轻松!线上课程内容支持六个月内免费回看,以便复习和参考。

6、翻转课堂模式

混合班线下与线上结合,线上学习技能课程,线下进行案例实操,帮助学员更好地掌握和应用知识和技能,提高教学水平。

7、课程内容更适合教学

课程内容包含技能学习及案例实战,在具体应用场景中全面掌握相关技能,助力实训教学工作,提升实际动手能力。

二、课程安排

本次培训共七个专题分为线下线上混合班和纯线上班两种班型:

1、青岛/广州线下班,采用线下线上混合模式,技能学习课程放置在线上云课堂以便学员系统学习,核心案例实战采用线下形式由讲师亲授同步操作演练。

2、纯线上班,教学视频实战采用线下形式由讲师亲授同步操作演练。

3、详细课程内容见文末附件课程大纲。

专题一<线下青岛班>  数据采集与分析实践(Python)
基本信息技能学习(线上,8月1日 - 8月5日)案例实战(线下,8月6日 - 8月9日)

时间:2023年8月1日 - 8月9日

线下报到时间:8月5日

学时:共计80学时

证书:高级Python技术应用工程师职业技术证书

费用:3980元

地点:青岛

1 Python编程基础

2 Python数据分析与应用

3 Pandas数据分析基础

4 Python网络爬虫实战

5 网站图像素材采集实战(拓展)

6 特别内容:金牌助手ChatGPT,让应用开发更高效

1 核心技能串讲与巩固

2 微博疫情评论数据采集

3 农产品信息采集与分析

4 泰迪内推平台招聘信息采集与分析

专题一<线上班>  数据采集与分析实践(Python)
基本信息技能学习案例实战

时间:2023年7月20日 - 7月29日

学时:共计80学时

证书:高级Python技术应用工程师职业技术证书

费用:1980元

1 Python编程基础

2 Python数据分析与应用

3 Pandas数据分析基础

4 Python网络爬虫实战

5 特别内容:金牌助手ChatGPT,让应用开发更高效

1 微博疫情评论数据采集

2 农产品信息采集与分析

3 泰迪内推平台招聘信息采集与分析

4 网站图像素材采集实战(拓展)

专题二<线下广州班>  商务数据分析实践(Python)
基本信息技能学习(线上,7月11日 - 7月15日)案例实战(线下,7月16日 - 7月19日)

时间:2023年7月11日 - 7月19日

线下报到时间:7月15日

学时:共计88学时

证书:高级大数据分析师职业技术证书

费用:3980元

地点:广州

1 Python编程基础

2 Python数据分析与应用

3 Pandas数据分析实训

4 特别内容:金牌助手ChatGPT,让应用开发更高效

1 商务数据分析概述

2 牛刀小试-T公司运营数据分析与业务决策

3 回归分析-某市财政收入预测

4 聚类分析-对某航空公司客户分群

5 分类分析-运营商用户流失判别

6 关联规则-购物篮商品推荐

7 协同过滤-新闻网站用户个性化推荐

专题二<线上班>  商务数据分析实践(Excel + Power BI)
基本信息技能学习案例实战

时间:2023年7月21日 - 7月30日

学时:共计80学时

证书:高级大数据分析师职业技术证书

费用:1980元

1 Excel数据分析基础与实战

2 Power BI数据分析与可视化

3 特别内容:金牌助手ChatGPT,让应用开发更高效

1 新零售智能销售数据分析

2 餐饮企业综合分析

3 财务分析在纳税评估中的应用

4 学生校园卡消费行为分析

专题三<线下广州班>  机器学习与大数据分析实践(Python)
基本信息技能学习(线上,7月14日 - 7月19日)案例实战(线下,7月20日 - 7月23日)

时间:2023年7月14日 - 7月23日

线下报到时间:7月19日

学时:共计88学时

证书:计算机程序设计员(大数据分析方向)

费用:4480元

地点:广州

1 Python编程基础

2 Python数据分析与应用

3 Python机器学习实战

4 Python特征工程实战

5 特别内容:金牌助手ChatGPT,让应用开发更高效

1 核心技能串讲与巩固

2 O2O优惠券使用预测

3 网络入侵用户自动识别

4 天猫用户重复购买预测

5 泰迪内推平台信息精准推荐应用

专题三<线上班>  机器学习与大数据分析实践(Python)
基本信息技能学习案例实战

时间:2023年7月20日 - 7月31日

学时:共计96学时

证书:高级机器学习工程师职业技术证书

费用:2480元

1 Python编程基础

2 Python数据分析与应用

3 Pandas数据分析基础

4 Python机器学习实战

5 Python特征工程实战

6 特别内容:金牌助手ChatGPT,让应用开发更高效

1 O2O优惠券使用预测

2 网络入侵用户自动识别

3 天猫用户重复购买预测

4 泰迪内推平台信息精准推荐应用

专题四<线下广州班> PyTorch与人工智能实战
基本信息技能学习(线上,7月18日 - 7月23日)案例实战(线下,7月24日 - 7月27日)

时间:2023年7月18日 - 7月27日

线下报到时间:7月23日

学时:共计80学时

证书:高级人工智能应用工程师职业技术证书

费用:3980元

地点:广州

1 Python编程基础

2 Python数据分析与应用

3 Python机器学习实战

4 PyTorch框架基础实战

5 PyTorch深度学习原理与实现

6 MindSpore框架基础实践(拓展)

7 MindSpore深度学习原理与实现(拓展)

8 基于深度学习的问政留言分类(MindSpore)(拓展)

9 特别内容:金牌助手ChatGPT,让应用开发更高效

1 昇腾人工智能生态介绍

2 核心技能串讲与巩固

3 脑PET图像分析与疾病预测

4 新冠疫情期间网民情绪识别

5 基于FaceNet的人脸智能识别

专题四<线上班> PyTorch与人工智能实战
基本信息技能学习案例实战

时间:2023年7月21日 - 7月29日

学时:共计72学时

证书:高级人工智能应用工程师职业技术证书

费用:1980元

1 Python编程基础

2 Python数据分析与应用

3 Python机器学习实战

4 PyTorch框架基础实战

5 PyTorch深度学习原理与实现

6 特别内容:金牌助手ChatGPT,让应用开发更高效

1 脑PET图像分析与疾病预测

2 新冠疫情期间网民情绪识别

3 基于FaceNet的人脸智能识别

专题五<线下广州班> 文本分析与挖掘实战(PyTorch)
基本信息技能学习(线上,7月20日 - 7月27日)案例实战(线下,7月28日 - 7月31日)

时间:2023年7月20日 - 7月31日

线下报到时间:7月27日

学时:共计88学时

证书:高级人工智能应用工程师职业技术证书

费用:3980元

地点:广州

1 Python编程基础

2 Python数据分析与应用

3 Python机器学习实战

4 PyTorch框架基础实战

5 PyTorch深度学习原理与实现

6 自然语言处理实战

7 特别内容:金牌助手ChatGPT,让应用开发更高效

1 核心技能串讲与巩固

2 基于textCNN的公众健康问句分类

3 新冠疫情期间网民情绪识别

4 推荐系统受众性别智能识别

专题五<线上班> 文本分析与挖掘实战(PyTorch)
基本信息技能学习案例实战

时间:2023年7月20日 - 7月30日

学时:共计88学时

证书:高级人工智能应用工程师职业技术证书

费用:2480元

1 Python编程基础

2 Python数据分析与应用

3 Python机器学习实战

4 PyTorch框架基础实战

5 PyTorch深度学习原理与实现

6 自然语言处理实战

7 特别内容:金牌助手ChatGPT,让应用开发更高效

1 基于textCNN的公众健康问句分类

2 新冠疫情期间网民情绪识别

3 推荐系统受众性别智能识别

专题六<线下广州班> 计算机视觉应用实战(PyTorch)
基本信息技能学习(线上,7月25日 - 7月31日)案例实战(线下,8月1日 - 8月4日)

时间:2023年7月25日 - 8月4日

线下报到时间:7月31日

学时:共计88学时

证书:高级人工智能应用工程师职业技术证书

费用:3980元

地点:广州

1 Python编程基础

2 Python数据分析与应用

3 Python机器学习实战

4 PyTorch框架基础实战

5 PyTorch深度学习原理与实现

6 计算机视觉实战

7 特别内容:昇腾人工智能生态介绍

8 MindSpore框架基础实践(拓展)

9 MindSpore深度学习原理与实现(拓展)

10 基于深度学习的问政留言分类(MindSpore)(拓展)

11 特别内容:金牌助手ChatGPT,让应用开发更高效

1 核心技能串讲与巩固

2 脑PET图像分析和疾病预测

3 基于FaceNet的人脸智能识别

4 基于YOLOX的农田害虫图像检测与识别

专题六<线上班> 计算机视觉应用实战(PyTorch)
基本信息技能学习案例实战

时间:2023年7月20日 - 7月30日

学时:共计88学时

证书:高级人工智能应用工程师职业技术证书

费用:2480元

1 Python编程基础

2 Python数据分析与应用

3 Python机器学习实战

4 PyTorch框架基础实战

5 PyTorch深度学习原理与实现

6 计算机视觉实战

7 特别内容:金牌助手ChatGPT,让应用开发更高效

1 脑PET图像分析和疾病预测

2 基于FaceNet的人脸智能识别

3 基于YOLOX的农田害虫图像检测与识别

专题七<线下广州班>  大数据技术应用实战(Hadoop + Spark)
基本信息技能学习(线上,7月29日 - 8月4日)案例实战(线下,8月5日 - 8月9日)
时间:2023年7月29日 - 8月9日

线下报到时间:8月4日

学时:共计96学时

证书:高级大数据技术应用职业技术证书

费用:4980元

地点:广州

1 Linux操作系统基础

2 Java编程基础

3 Scala编程基础

4 Hadoop大数据基础

5 Hive大数据仓库

6 HBase非关系型数据库

7 Spark大数据技术基础

8 Flume数据采集

9 Kafka消息系统

10 Flink大数据实时处理(拓展)

11 大数据分布式消息Zookeeper(拓展)

12 商品实时推荐系统(拓展)

13 特别内容:金牌助手ChatGPT,让应用开发更高效

1 核心技能串讲与巩固

2 航空客户乘机数据预处理

3 广电大数据用户画像(Hadoop+Spark+Hive)

专题七<线上班>  大数据技术应用实战(Hadoop + Spark)
基本信息技能学习案例实战

时间:2023年7月20日 - 7月31日

学时:共计96学时

证书:高级大数据技术应用职业技术证书

费用:2980元

1 Linux操作系统基础

2 Java编程基础

3 Scala编程基础

4 Hadoop大数据基础

5 Hive大数据仓库

6 HBase非关系型数据库

7 Spark大数据技术基础

8 Flume数据采集

9 Kafka消息系统

10 Flink大数据实时处理(拓展)

11 特别内容:金牌助手ChatGPT,让应用开发更高效

1 航空客户乘机数据预处理

2 广电大数据用户画像(Hadoop+Spark+Hive)

3 大数据分布式消息Zookeeper(拓展)

4 商品实时推荐系统(拓展)

三、师资介绍

b7e2ca4ffa89259092260333a9d212e.jpg冯国灿博士,中山大学数学学院教授,博士生导师。泰迪杯数据挖掘挑战赛组委会委员,中国工业与应用数学会常务理事,广东省工业与应用数学学会理事长,2000-2002英国格莱莫根大学数字图像实验室和布拉德福大学数字媒体实验室做博士后研究员。主要从事模式识别、计算机视觉研究,参加主持包括国家自然科学基金等科学基金20多项,发表学术论文100余篇,入选2014-2019爱思唯尔计算机科学中国高被引学者排行榜。
讲师_樊哲.jpg樊老师,广东泰迪智能科技股份有限公司特聘讲师,某国际银行大数据开发工程师,Hortonworks授权Apache Hadoop开发者认证培训讲师,Hadoop、Mahout技术实践者和研究者;对Hadoop的MapReduce编程模型有深刻理解,同时对Mahout技术有较深认识,对Mahout源码有深入研究,擅于Mahout中数据挖掘的K均值聚类算法、贝叶斯分类算法、FP树关联规则算法的应用;主编《Mahout算法解析与案例实战》、《Hadoop数据分析与挖掘实战》、《Hadoop与大数据挖掘》等图书专著;具有电信行业和银行业的项目经验和行业知识,主持中国电科院电力大数据平台、电能量数据挖掘与智能分析、客户服务智能分析系统等项目

华为资深工程师(特邀嘉宾),华为作为全球领先的ICT(信息与通信)基础设施和智能终端提供商,积极参与人工智能变革,提成华为的全栈全场景AI解决方法。本次主要分享华为昇腾AI的全栈全场景解决方案及其应用。
张敏-1.jpg张敏,广东泰迪智能科技股份有限公司培训总监,高级信息系统项目管理师。具有丰富的大数据挖掘、人工智能教学和开发经验,曾为南方电网、国家电网、格力电器、珠江数码等多个大型企业提供i项目研发与维护服务。参编数据挖掘与人工智能类教材10余本,作为主讲老师参与国内高校和企业关于数据挖掘、人工智能相关培训班百余场。
周东平330724199111285210.jpg周东平,广东泰迪智能科技股份有限公司产品总监,高级数据分析师。项目经理。从事数据行业多年,熟悉大数据、人工智能相关项目开发流程;具有丰富的大数据、人工智能产品与应用设计经验,对于大数据、人工智能教学具有深入研究。精通Python语言,策划主持编写Python方向大数据与人工智能图书10余本,包括《Python数据分析与应用》、《Python3智能数据分析快速入门》、《大数据数学基础(Python语言描述)》等。在职期间参与项目涵盖电力、税务、金融、新闻、建筑等方向,具有丰富的行业经历。
律波-1.jpg律波,广东泰迪智能科技股份有限公司高级数据分析工程师,应用统计学硕士,有较强的统计学、数学、数据挖掘理论功底;精通R、Python、Power BI、Excel等数据挖掘分析工具,具有丰富的培训和项目经验,擅长从数据中发掘规律,对数据具有较高的敏感度,逻辑思维能力强,擅长数据可视化,机器学习、深度学习等算法原理的实现,如神经网络、SVM、决策树、贝叶斯等;负责"珠江数码大数据营销推荐应用"项目,完成标签库的构建及产品推荐模型;负责"京东电商产品评论情感分析"项目,完成了评论数据情感评价模型、LDA主题模型的构建;通过项目案例的转换;负责多个本科类院校数据分析软件培训和毕业生数据分析培训,先后负责广西科技大学、闽江学院、广东石油化工、韩山师范学院、广西师范大学等数据分析软件培训及实训等。多次负责"泰迪杯"数据挖掘大赛题目的构思和实现、赛前培训。大数据专业系列图书编写委员会成员,负责《R语言与数据挖掘》、《Python实训案例》、《Excel可视化案例》等书籍编写工作。
陈四德-1.jpg陈四德,广东泰迪智能科技股份有限公司高级数据分析师,统计学专业,对数据统计分析和数据挖掘领域均有较强的理解和理论基础;有造价行业、游戏行业背景和丰富的项目经验,精通行业内的各种指标分析,擅于从多维度分析数据,逻辑性强;擅长Python、R语言、MySQL数据库等工具,能熟练对数据进行数据处理和分析,掌握常用的数据挖掘算法如分类、聚类等,以及深度学习TensorFlow的使用。负责“网站会员流失预测”项目,完成数据处理,模型构建;负责“平台BI埋点数据入库及数据分析”项目,完成数据盘点、数据指标整理和把控;负责“游戏数据分析”项目,完成产出游戏生态日报、客户价值分群结果、用户流失的预警、用户画像指标的完善和维护,项目经验丰富。负责过西安交大城市学院、福建农林大学、国培师资培训、韩山师范学院数据分析就业班、湖南科技职业技术学院、武汉科技大学、广东机电职业技术学院国培、柳州城市职业技术学院第一届大数据职业技能竞赛指导、吉林大学珠海学院等培训项目,授课经验丰富。负责过“泰迪杯”数据挖掘挑战赛出题及赛题指导。
焦正升.jpg焦正升,广东泰迪智能科技股份有限公司资深项目研发工程师、高级信息系统项目经理、高级软件开发工程师,拥有7年相关从业经验;致力于信息技术的应用与传播,信息系统产业的发展。精通JAVA编程语言,熟悉Spring Boot、Spring Cloud等主流开发框架、MySQL数据库、VUE数据驱动渐进式框架等主流技术。参与《Hadoop与大数据挖掘》、《Hadoop大数据分析与挖掘实战》等图书的编写。拥有电力、电子政务、轻工环保、交通运输等多项领域的项目管理研发经验,项目团队为北京市信访办研发的“大数据助力智慧信访”系统获得第七届金玲奖-公共服务类“智能决策奖”。
叶丽凡.jpg叶丽凡,广东泰迪智能科技股份有限公司高级大数据开发工程师,对Hadoop大数据技术有深入理解,熟悉HDFS分布式文件系统存储结构,熟练掌握Hadoop环境部署和MapReduce计算框架编程。对HBase、Hive数据库有深刻了解。掌握Spark原理及编程,熟悉Spark底层运行机制,并熟练使用Spark SQL即时查询框架和Spark MLlib算法库。深度参与过华南某广电公司大数据营销推荐系统开发,利用Hadoop + Spark + Hive为其中的400多万用户生成用户画像。参与编写《Hadoop与大数据挖掘》、《Spark大数据技术与应用》等图书。跟进负责全国高校大数据与人工智能双师骨干师资研修班、韩山师范学院等高校的大数据培训课程。

四、证书颁发

3.1 学员经在线培训并考试合格后,可以获得本期培训对应专题职业技术证书。

3.2 职业技能等级证书

参加广州线下班相应专题的学员可参加统一组织的人社厅职业技能等级认证考试,考试为计算机程序设计员(大数据分析方向)4级等级认证考试,考点为广州天河区考点。考试合格后,可以获得广东泰迪智能科技股份有限公司(广东省人力资源和社会保障厅认定社会培训评价组织)颁发的计算机程序设计员(大数据分析方向)4级职业技能等级证书(证书可登录人社部“技能人才评价工作网http://osta.mohrss.gov.cn/”全国联网查询)。

并可同时获得计算机程序设计员考评员证,后期学校可与泰迪科技合作建立人社厅职业技能等级证书考点(仅针对广东省内高效),并提供面向社会的培训评价服务。

3.2.1 职业技能等级证书说明

2022年3月16日,广东省人力资源和社会保障厅根据《关于进一步做好职业技能等级认定通知的通知》(粤人社函【2021】76号)精神,在全省范围内开展职业节能功能等级认定社会培训评价组织征集工作,确定广东泰迪智能科技股份有限公司(简称:泰迪科技)成为广东省社会培训评价组织,可向社会开展计算机程序设计员(3级、4级)职业技能等级认定工作。证书全国通用,终身有效,可享受国家职业资格等级证书同等效力。

3.2.2 报考条件

具备以下条件之一者,可申报四级/中级工:

1、累计从事本职业或相关职业工作4年(含)以上。

2、取得相关职业五级/初级工职业资格证书(技能等级证书)后,累计从事本职业或相关职业工作3年(含)以上。

3、取得相关职业五级/初级职业资格证书(技能等级证书)后,累计从事本职业或相关职业工作2年(含)以上,经本职业或相关职业四级/中级工正规培训达规定标准学时数,并取得结业证书。

4、取得技工学校本专业或相关专业毕业证书(含尚未取得毕业证书的在校应届毕业生);或取得经评估论证、以中级技能为培养目标的中等及以上职业学校本专业或相关专业毕业证书(含尚未取得毕业证书的在校应届毕业生)

备注:本专业或相关专业包含软件工程、软件与信息服务、计算机科学与技术、计算机网络技术、计算机网络应用、网络工程、计算机系统与维护、计算机信息管理、计算机应用与维修、计算机与数码产品维修、空间信息与数字技术、区块链工程、人工智能技术服务与应用、数据科学与大数据技术、数字媒体技术应用、电子科学与技术、电子信息工程、电子商务、应用电子技术、通信技术、通信工程、通信网络应用、通信系统工程安装与维护、通信运营服务、网络安全、网站建设与管理、物联网技术应用、新媒体技术、虚拟现实技术应用、移动应用技术与服务、云计算技术与应用、智能科学与技术等专业。

五、报名须知与联系方式

1、报名材料:报名申请表、身份证复印件、两寸近期正面免冠彩色半身证件照电子版(要求:白色背景底,14-20K大小的.JPG格式)。

2、本次由广东泰迪智能科技股份有限公司收取费用并开具发票。

3、报名联系方式

联系人:曾老师                        电 话:13246821827

微   信:antonia602501          邮  箱:zengaizhi@tipdm.com

报名回执.docx

2023年第五期大数据师资研修班.pdf


全国高校大数据与人工智能师资研修班报名申请表

单位名称
部门/院系
通讯地址
发票抬头
发票内容:
纳税号
电子发票
接收邮箱:

联系人
电话:邮箱:
以下表格中要求提供的信息为申报职业技术证书使用,请真实完整填写
姓  名性别职务主要任课专业毕业院校最高学历手机号电子邮箱

专题选择

(线上/线下)

是否住宿

(单间/标间)







































































费用

支付方式

1、电汇到指定账户
2、扫码支付(报名后联系工作人员索要支付码)
3、付款时请注明”大数据研修班+单位名称或姓名“字样,方便查账备案
账户信息账户名:广东泰迪智能科技股份有限公司
开户行:中国工商银行广州花城支行
账户号:3602 0285 0920 1663 221
备  注请将报名表发送至邮箱:zengaizhi@tipdm.com

联系人:曾老师   电话:13246821827        微信:antonia602501


附件一  线下+线上混合专场课表

专题一<青岛线下班> 数据采集与分析实战(Python)课程大纲

技能学习(线上)课程安排

时间:报名成功后即可开始学习

Python编程基础

1 认识Python

2 编写Python程序

3 认识Python数据结构

4 条件判断及分支语句

5 使用def定义函数

6 认识面向对象

7 读取文件数据

8 模块和第三方库

Python数据分析与应用

1 Python数据分析概述

2 NumPy数值计算基础

3 Matplotlib数据可视化基础


时间:8月1日 (09:00 - 18:00)

专题讲座

计算机视觉技术及其应用

Pandas数据分析基础

1 Pandas统计分析基础

1.1 Pandas简介

1.2 读写不同数据源的数据

1.3 数据框与数据框元素

1.4 转换与处理时间序列数据

1.5 使用分组聚合进行组内计算

1.6 创建透视表与交叉表

时间:8月2日 (09:00 - 18:00)

2 使用Pandas进行数据与预处理

2.1 合并数据

2.2 清洗数据

2.3 标准化数据

2.4 转换数据


时间:8月3日 (09:00 - 18:00)

Python网络爬虫实战

1 Python爬虫环境与爬虫简介

1.1 认识爬虫

1.2 认识反爬虫

1.3 配置Python爬虫环境

2 网页前端基础

2.1 认识网络信息传输过程

2.2 认识HTTP

2.2.1 认识HTTP

2.2.2 熟悉Cookie

3 简单静态网页爬取

3.1 认识静态网页

3.2 实现HTTP请求

3.2.1 创建工程

3.2.2 生成HTTP请求

3.2.3 完善HTTP请求

3.3 解析网页

3.3.1 为什么要解析网页

3.3.2 初识Xpath

3.3.3 Xpath相对路径及属性查找

3.3.4 使用BeautifulSoup解析网页

3.3.5 网页解析小结

3.4 存储数据

3.4.1 认识chrome开发者工具

3.4.2 任务演练:爬取并存储泰迪科技官网首页数据

4 认识动态网页

4.1 认识动态网页

4.2 逆向分析爬取动态网页

4.2.1 通过网页源码追踪目标数据文件地址

4.2.2 通过开发者工具追踪目标数据文件地址

4.2.3 爬取数据并及进行保存

4.3 使用Selenium库爬取动态网页


时间:8月4日 (09:00 - 18:00)

5 模拟登录

5.1 使用表单登录方法实现模拟登录

5.2 使用Cookie登录方法实现模拟登录

5.3 使用Selenium模拟登录

6 Scrapy爬虫

6.1 认识Scrapy

6.2 通过Scrapy爬取基本页面信息

6.3 通过Scrapy抓取跳转页面数据

6.3.1 任务介绍及项目创建

6.3.2 获取所有页面的url

6.3.3 获取每个页面的新闻二次页面url

6.3.4 提取各新闻二次页面中的目标数据

6.3.5 运行程序保存数据

7 拓展:终端协议及爬取工具介绍


拓展内容

网站图像素材采集实战

1 思路介绍

2 单个图片文件爬取

3 获取一个页面所有图片网址

4 保存所有图片

5 翻页爬取更多数据

6 PDF文件规律及问题

7 PDF翻页刷新的网址规律

8 获取当前页所有图片网址

9 翻页刷新爬取所有图片

10 图片拼接成PDF文件


特别内容

金牌助手ChatGPT,让应用开发更高效

案例实战(线下)课程安排

时间:8月6日 (08:30 - 17:00)

核心技能串讲与巩固

1 iris数据处理实训

2 探索chipotle数据

3 探索Apple公司股价数据

4 Python爬虫环境与爬虫简介

5 网页前端基础

6 简单静态网页爬取

7 认识动态网页

8 模拟登录

9 Scrapy爬虫


时间:8月7日 (08:30 - 11:30)

微博疫情评论数据采集

1 背景与目标

2.1 评论结构分析

2.2 数据接口分析

3.1.1 微博页面接口分析

3.1.2 微博ID获取

3.1.3 微博接口请求

3.1.4 长文本获取

3.1.5 单页微博获取

3.1.6 单页微博获取函数

3.2.1 评论数据接口分析

3.2.2 单页评论获取

3.3 评论回复数据爬取

3.4 单页微博及评论数据爬取

3.5 多线程爬虫

4 小结


时间:8月7日 (14:00 - 17:00)

农产品信息采集与分析

1.1 背景与分析目标

2.1 网页分析和爬虫思路

2.2 省份链接获取

2.3 获取省份名称

2.4 确定翻页数目

2.5 获取单页表格

2.6 获取所有省份和页面的数据

2.7 分布式爬取

3.1 数据预处理

3.2 数据 指标提取

3.3 省级以上部门审定数据分析

3.4 水稻品种类型数量分析

3.5 主要水稻类型被审定的数量分析

3.6 水稻母本分析

3.7 主要审定公司分析

4 总结


时间:8月8日 (08:30 - 17:00)

泰迪内推平台招聘信息采集与分析

1 背景与目标

2 数据采集

2.1 网页结构探索

2.2 定位一级页面数据地址

2.3 爬取及解析一级页面数据

2.4 提取一级页面字段

2.5 定位二级页面数据地址

2.6 爬取及解析二级页面数据

2.7 翻页爬取及数据保存

3 数据处理

3.1 读取已爬取完成的数据

3.2 数据预处理操作

4 分析与可视化

4.1 招聘岗位对学历要求分析

4.2 各行业的大数据招聘需求数量分析

4.3 不同类型公司的薪资待遇分析

4.4 小结


时间:8月9日 (09:00 - 17:00)

1 职业技术考试

2 企业参观


专题二<线下广州班>  商务数据分析实战(Pythong)

技能学习(线上)课程安排

时间:报名成功后即可开始学习

Python编程基础

1 认识Python

2 编写Python程序

3 认识Python数据结构

4 条件判断及分支语句

5 使用def定义函数

6 认识面向对象

7 读取文件数据

8 模块和第三方库

Python数据分析与应用

1 Python数据分析概述

2 NumPy数值计算基础


时间:7月11日  (09:00 - 18:00)

专题讲座

计算机视觉技术及其应用

Pandas数据分析基础

1 Matplotlib绘制流程说明

1.1 掌握绘图基础语法与常用参数

1.2 分析特征间关系

1.3 分析特征内部数据分布与分散情况


时间:7月12日 (09:00 - 18:00)

2 Pandas统计分析基础

2.1 Pandas简介

2.2 读写不同数据源的数据

2.3 数据框与数据框元素

2.4 转换与处理时间序列数据

2.5 使用分组聚合进行组内计算

2.6 创建透视表与交叉表


时间:7月13日 (09:00 - 18:00)

3 使用Pandas进行数据与预处理

3.1 合并数据

3.2 清洗数据

3.3 标准化数据

3.4 转换数据


时间:7月14日 (09:00 - 18:00)

Python数据分析实训

1 iris数据处理实训

1.1 拓展学习资料&Python环境介绍

1.2 读取数据&修改列名称

1.3 以PythonConsole方式执行代码

1.4 缺失值处理

1.5 重置索引

2 探索chipotle数据

2.1 数据读取及介绍

2.2 分组聚合

2.3 数据类型转化

2.4 求客单价

3 探索Apple公司股价数据

3.1 数据读取及介绍

3.2 找到最后一个交易日

3.3 日期探索及可视化


特别内容

金牌助手ChatGPT,让应用开发更高效

案例实战(线下)课程安排

时间:7月16日 (08:30 - 11:30)

商务数据分析概述

1 商务数据分析基本概念

2 商务数据分析应用场景

3 商务数据分析主要工作及流程

4 商务数据分析方法与工具

5 商务数据分析产业需求

牛刀小试-T公司运营数据分析与业务决策

1 背景与目标

2 目标分析

3 数据探索

4 数据处理

5 统计分析

6 决策建议



时间:7月16日 (14:00 - 17:00)

回归分析-某市财政收入预测

1 背景与目标

2 目标分析

3 数据探索

4 数据处理

5 统计分析

6 决策建议


时间:7月17日 (08:30 - 11:30)

聚类分析-对某航空公司客户分群

1 背景与目标

2 目标分析

3 数据探索

4 数据处理

5 统计分析

6 决策建议

时间:7月17日 (14:00 - 17:00)

分类分析-运营商用户流失判别

1 背景与目标

2 目标分析

3 数据探索

4 数据处理

5 统计分析

6 决策建议


时间:7月18日 (08:30 - 11:30)

关联规则-购物篮商品推荐

1 背景与目标

2 目标分析

3 数据探索

4 数据处理

5 统计分析

6 决策建议

时间:7月18日 (14:00 - 17:00)

协同过滤-新闻网站用户个性化推荐

1 背景与目标

2 目标分析

3 数据探索

4 数据处理

5 统计分析

6 决策建议


时间:7月19日 (09:00 - 17:00)

1 职业技术考试

2 企业参观


专题三 <广州线下班>  机器学习与大数据分析实战(Python)课程大纲

技能学习课程安排

时间:报名成功后即可开始学习

Python编程基础

1 认识Python

2 编写Python程序

3 认识Python数据结构

4 条件判断及分支语句

5 使用def定义函数

6 认识面向对象

7 读取文件数据

8 模块和第三方库

Python数据分析与应用

1 Python数据分析概述

2 NumPy数值计算基础

3 Matplotlib数据可视化基础

4 Pandas统计分析基础

5 使用Pandas进行数据预处理


时间:7月14日 (09:00 - 18:00)

专题讲座

计算机视觉技术及其应用

Python机器学习实战

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2  模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量Python实现

3 回归分析

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

2.3 性能度量

2.4 性能度量Python实现

3 回归分析

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

4 决策树

4.1 从女生相亲到决策树

4.2 明天适合打球吗?

4.3 决策树拆分属性选择

4.4 决策树算法家族

4.5 泰坦尼克号生还者预测-数据预处理

4.6 泰坦尼克号生还者预测-模型构建与预测


时间:7月15日 (09:00 - 18:00)

5 人工神经网络

5.1 单个神经元介绍

5.2 经典网络结构介绍

5.3 神经网络工作流程 演示

5.4 如何修正网络参数-梯度下降法

5.5 网络工作原理推导

5.6 网络搭建准备

5.7 样本从输入层到隐层传输的Python实现

5.8 网络输出的Python实现

5.9 单样本网络训练的Python实现

5.10 全样本网络训练的Python实现

5.11 网络性能评价

5.12 调用sklearn实现神经网络算法


时间:7月16日 (09:00 - 18:00)

6 支持向量机

6.1 间隔与支持向量

6.2 对偶问题

6.3 核函数

6.4 软间隔与正则化

6.5 支持向量机算法的Python实现

7.1 聚类分析概述

7.2 相似性度量

7.3 K-Means聚类分析算法介绍

7.4 利用K-Means算法对鸢尾花进行聚类

7.5 聚类结果的性能度量

7.6 调用sklearn实现聚类分析

拓展

8 集成学习

8.1 集成学习基本概念

8.2 并行集成算法-Bagging&RandomForest

8.3 串行集成算法-Boosting算法流程

8.4 串行集成算法-Boosting代码实现

8.5 Stacking算法流程

8.6 Stacking代码实现


时间:7月17日 (09:00 - 18:00)

特征工程

1.1 特征工程是什么

1.2 特征工程效果评估

1.3 定性还是定量

1.4 数据的4个等级介绍

1.5 数据的4个等级演示

2.1 探索性数据分析

2.2 探究不同类别样本的血糖浓度

2.3 缺失值探索

2.4 删除缺失值

2.5 构建基线模型

2.6 网格搜索优化

2.7 利用0进行缺失值填充的模型性能

2.8 利用均值进行缺失值填充的模型性能

2.9 标准化和归一化介绍

2.10 结合机器学习流水线进一步优化

2.11 数据预处理小结

3.1 特征构建引言

3.2 分类数据的填充

3.3 自定义分类数据填充器

3.4 自定义定量数据填充器

3.5 编码定类数据

3.6 编码定序变量

3.7 连续变量分箱

3.8 在流水线中封装预处理操作

3.9 拓展数值特征的模型基线

3.10 多页式特征模型性能

时间:7月18日 (09:00 - 18:00)

4.1 特征选择介绍

4.2 数据导入及探索

4.3 基于皮尔逊相关系数的特征选择

4.4 特征选择前后模型性能比较

4.5 基于假设检验的特征选择

4.6 基于树的特征选择

4.7 特征选择后模型性能探索

4.8 基于线性模型的特征选择

4.9 小结

5.1 特征转换介绍

5.2 主成分分析(PCA)介绍

5.3 PCA工作流程实现

5.4 PCA方差分析

5.5 利用sklearn实现PCA

5.6 深入解释PCA之相关性探究

5.7 深入解释PCA之线性变换

5.8 深入解释PCA之数据分布探索

5.9 PCA小结

5.10 LDA工作流程及实现

5.11 sklearn实现LDA

5.12 LDA数据分布探索

5.13 应用特征转换

5.14 小结


拓展

6.1 特征学习介绍

6.2 受限波尔兹曼机(RBM)工作原理

6.3 MNIST数字识别任务介绍

6.4 MNIST数据准备

6.5 PCA特征分析

6.6 PBM特征学习

6.7 构建基线模型

6.8 加入PCA进行模型优化

6.9 加入RBM进行模型优化

6.10 多层受限玻尔兹曼机


特别内容

金牌助手ChatGPT,让应用开发更高效

案例实战(线下)课程安排

时间:7月20日 (08:30 - 17:00)

核心技能串讲与巩固

1 机器学习绪论

2 模型评估与选择

3 回归分析

4 决策树

5 人工神经网络

6 支持向量机

7 聚类算法

8 特征工程介绍

9 数据预处理

10 特征构建

11 特征选择

12 降维与特征转换


时间:7月21日 (08:30 - 11:30)

O2O优惠劵使用预测

1 背景与目标

2.1 线下训练集数据介绍

2.2 线上训练集数据介绍

2.3 测试数据介绍

2.4 项目流程介绍

3.1 构建正样本

3.2 构建负样本

3.3 构建样本标签

4.1 特征构建介绍

4.2 处理Discount_rate列

4.3 特征-折扣率

4.4 特征-商户与用户之间的距离

5.1 建模前数据准备

5.2 初级模型构建

5.3 ROC曲线与AUC值

5.4 模型性能评估

5.5 训练函数封装

5.6 模型预测

5.7 预测函数封装

6.1 特征- 优惠券流行度

6.2 特征-用户在商家的消费次数

6.3 如何进行特征拼接

6.4 拼接训练集的特征

6.5 拼接测试集的特征

7.1 模型训练

7.2 预测

7.3 代码整理


时间:7月21日 (14:00 - 17:00

网络入侵用户自动识别

1 背景与目标

2 数据处理

2.1 读取数据

2.2 了解数据基本情况

2.3 哑变量处理

2.4 拼接特征并删除无关列

2.5 标签转化及预处理函数封装

3 模型训练与验证

3.1 认识集成学习算法

3.2 模型训练与性能验证

3.3 保存模型训练集数据结构

4 模型应用与评估

4.1 加载并处理待预测样本

4.2 模型应用及性能评估


时间:7月22日 (08:30 - 11:30)

天猫用户重复购买预测

1.1 背景与挖掘目标

2.1 工程环境准备

2.2 缺失值处理和数据去重

2.3 数据分布探索

3.1 特征工程介绍

3.2 原始特征

3.3.1 用户相关特征:用户在平台的总交互次数

3.3.2 用户相关特征:用户最近一次购买距离第一次的时长

3.4.1 商家相关特征:商家被交互的数量

3.4.2 商家相关特征:商家的复购次数

3.5.1 用户和商家相关特征:用户在商家的交换次数

3.5.2 用户和商家相关特征:不同用户在不同商家购买率

3.6 离散型特征处理

4.1 建模前的数据处理

4.2 模型构建

4.3 模型训练和评估

4.4 模型应用

5 小结

时间:7月22日 (14:00 - 17:00)

泰迪内推平台信息精准推荐应用(基于泰迪建模平台实现)

1 背景与目标

2 目标分析

2.1 推荐思路分析

2.2 基于物品的协同过滤推荐介绍

3 工程实现

3.1 EB工具登录简介

3.2 创建空白工程

3.3 导入数据

3.4 筛选郑文数据

3.5 字符替换及记录去重

3.6 划分训练集用户和测试集用户

3.7 构造训练集和测试集数据

3.8 构建模型

3.9 推荐及性能评估

4 小结


时间:7月23日 (09:00 - 17:00)

1、职业技能等级考试

2、企业参观


专题四<广州线下班>  PyTorch与人工智能实战课程大纲

技能学习(线上)课程安排

时间:报名成功后即可开始学习

Python编程基础

1 认识Python

2 编写Python程序

3 认识Python数据结构

4 条件判断及分支语句

5 使用def定义函数

6 认识面向对象

7 读取文件数据

8 模块和第三方库

Python数据分析与应用

1 Python数据分析概述

2 NumPy数值计算基础

3 Matplotlib数据可视化基础

4 Pandas统计分析基础

5 使用Pandas进行数据预处理


时间:7月18日 (09:00 - 18:00)

专题讲座

计算机视觉技术及其应用

Python机器学习实战

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量Python实现

3 回归分析

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

4 决策树

4.1 从女士相亲到决策树

4.2 明天适合打球吗

4.3 决策树拆分属性选择

4.4 决策树算法家族

4.5 泰坦尼克号生还者预测-数据预处理

4.6 泰坦尼克号生还者预测-模型构建与预测


时间:7月19日 (09:00 - 18:00)

5 人工神经网络

5.1 单个神经元介绍

5.2 经典网络结构介绍

5.3 神经网络工作流程演示

5.4 如何修正网络参数-梯度下降法

5.5 网络工作原理推导

5.6 网络搭建准备

5.7 样本从输入层到隐层传输的Python实现

5.8 网络输出的Python实现

5.9 单样本网络训练的Python实现

5.10 全样本网络训练的Python实现

5.11 网络性能评价

5.12 调用sklearn实现神经网络算法


时间:7月20日 (09:00 - 18:00)

PyTorch框架基础实践

1 PyTorch简介

2 张量操作

2.1 创建张量

2.2 张量与数组相互转化

3 构建一个线性模型

3.1 任务描述:构建一个线性模型

3.2 读取数据

3.3 构建初始模型及损失函数

3.4 test-构建优化器

3.5 构建优化器

3.6 最小化方差(训练)

3.7 执行多轮训练

3.8 训练过程可视化

4 识别手写数字

4.1 案例目标流程

4.2 加载数据

4.3 加工数据

4.4 模型结构介绍

4.5 构建模型

4.6 模型配置

4.7 模型训练

4.8 执行多轮训练

4.9 模型性能评估

4.10 保存模型

4.11 加载模型

4.12 模型应用


时间:7月21日 (09:00 - 18:00)

PyTorch深度学习原理与实现

1 深度神经网络-引言

2 卷积神经网络CNN

2.1 浅层神经网络的局限

2.2 卷积操作

2.3 卷积操作的优势

2.4 池化及全连接

2.5 高维输入及多filter卷积

2.6 实现卷积和操作

2.7 实现池化操作


时间:7月22日 (09:00 - 18:00)

3 循环神经网络RNN

3.1 循环神经网络简介

3.2 循环神经网络的常见结构

4 长短时记忆网络LSTM

4.1 LSTM的三个门

4.2 LSTM三个门的计算示例

4.3 实现LSTM操作

4.4 LSTM返回值解读

5 利用LSTM实现mnist手写数字识别

5.1 加载数据

5.2 数据加工

5.3 搭建循环神经网络

5.4 模型配置

5.5 模型训练

5.6 模型性能验证


拓展自学

1、MindSpore框架基础实践

2、MindSpore深度学习原理与实现

3、基于深度学习的问政留言分类(MindSpore)


特别内容

1、金牌助手ChatGPTl,让应用开发更高效

2、昇腾人工智能生态概述

案例实战(线下)课程安排

时间:7月24日 (08:30) - 7月25日(11:30)

核心技能串讲与巩固

1 PyTorch简介

2 张量操作

3 构建一个线性模型

4 识别手写数字

5 深度学习引言

6 卷积神经网络CNN

7 循环神经网络RNN

8 长短时记忆网络LSTM

9 利用LSTM实现手写数字识别

人工智能专题讲座:

昇腾人工智能生态概述


时间:7月25日 (14:00 - 17:00)

脑PET图像分析与疾病预测

1 背景与目标

2 数据处理

2.1 图像读取及尺寸调整

2.2 图像增强之翻转操作

2.3 图像增强之旋转缩放

2.4 获取所有照片路径

2.5 批量获取照片数据

2.6 将数据处理过程封装成函数

3 模型构建

3.1 定义卷积&池化层

3.2 定义全连接层

3.3 定义网络计算过程

3.4 数据集维度顺序调整及类型转化

3.5 数据集分批及打乱操作

3.6 模型构建及配置

3.7 模型训练

4 模型性能评估及应用

4.1 模型性能评估及保存

4.2 模型应用


时间:7月26日 (08:30 - 11:30)

新冠疫情期间网民情绪识别

1 背景与目标

2 数据准备

2.1 数据基本介绍

2.2 词嵌入介绍

2.3 进行词向量训练

2.4 构建词向量矩阵

2.5 获取编码后的语料库

2.6 对各样本执行padding操作

2.7 拆分数据并将其转为模型所需格式

3 构建模型

3.1 模型介绍

3.2 模型构建

3.3 模型训练

3.4 性能评估

4 小结


时间:7月26日 (14:00 - 17:00)

基于FaceNet的人脸智能识别

1 背景与目标

1.1 背景与目标

1.2 目标分析

1.3 开发环境和工程结构介绍

2 人脸检测

2.1 MTCNN人脸检测介绍

2.2 执行人脸检测操作

3 人脸对齐

3.1 执行人脸对齐操作

3.2 人脸检测及对齐代码整理

4 人脸特征提取

4.1 FaceNet溯源-计算机视觉领域的部分大事件

4.2 FaceNet介绍

4.3 执行人脸特征提取操作

5 人脸识别

5.1 获取后台数据库中的人脸数据

5.2 获取后台数据库人脸数据脚本解读

5.3 完成人脸识别操作

5.4 代码整理与结果可视化

6 小结


时间:7月27日 (09:00 - 17:00)

1、职业技术考试

2、企业参观


专题五<线下广州班>  文本分析与挖掘实战(PyTorch)

技能学习(线上)课程安排

时间:报名成功后即可开始学习

Python编程基础

1 认识Python

2 编写Python程序

3 认识Python数据结构

4 条件判断及分支语句

5 使用def定义函数

6 认识面向对象

7 读取文件数据

8 模块和第三方库

Python数据分析与应用

1 Python数据分析概述

2 NumPy数值计算基础

3 Matplotlib数据可视化基础

4 Pandas统计分析基础

5 使用Pandas进行数据预处理


时间:7月20日 (09:00 - 18:00)

专题讲座

计算机视觉技术及其应用

Python机器学习实战

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量Python实现

3 回归分析

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

4.1 单个神经元介绍

4.2 经典网络结构介绍

4.3 神经网络工作流程演示

4.4 如何修正网络参数-梯度下降法

4.5 网络工作原理推导

时间:7月21日 (09:00 - 18:00)

4.6 网络搭建准备

4.7 样本从输入层到隐层传输的Python实现

4.8 网络输出的Python实现

4.9 单样本网络训练的Python实现

4.10 全样本网络训练的Python实现

4.11 网络性能评价

4.12 调用sklearn实现神经网络算法

5.1 聚类分析概述

5.2 相似性度量

5.3 K-Means聚类分析算法介绍

5.4 利用K-Means算法对鸢尾花进行聚类

5.5 聚类结果的性能度量

5.6 调用sklearn实现聚类分析

6.1 间隔与支持向量

6.2 对偶问题

6.3 核函数

6.4 软间隔与正则化

6.5 支持向量机算法的Python实现


时间:7月22日 (09:00 - 18:00)

PyTorch框架基础实践

1 PyTorch简介

2 张量操作

2.1 创建张量

2.2 张量与数组相互转化

3 构建一个线性模型

3.1 任务描述:构建一个线性模型

3.2 读取数据

3.3 构建初始模型及损失函数

3.4 test-构建优化器

3.5 构建优化器

3.6 最小化方差(训练)

3.7 执行多轮训练

3.8 训练过程可视化

4 识别手写数字

4.1 案例目标与流程

4.2 加载数据

4.3 加工数据

4.4 模型结构介绍

4.5 构建模型

4.6 模型配置

4.7 模型训练

4.8 执行多轮训练

4.9 模型性能评估

4.10 保存模型

4.11 加载模型

4.12 模型应用


时间:7月23日 (09:00 - 18:00)

PyTorch深度学习原理与实现

1 引言

2 卷积神经网络CNN

2.1 浅层神经网络的局限

2.2 卷积操作

2.3 卷积操作的优势

2.4 池化及全连接

2.5 高维输入及多filter卷积

2.6 实现卷积操作

2.7 将卷积结构可视化

2.8 实现池化操作


时间:7月24日 (09:00 - 18:00)

3 循环神经网络RNN

3.1 循环神经网络简介

3.2 循环神经网络的常见结构

4 长短时记忆网络LSTM

4.1 LSTM的三个门

4.2 LSTM三个门的计算示例

4.3 实现LSTM操作

4.4 LSTM返回值解读

5 利用LSTM实现手写数字识别

5.1 加载数据

5.2 数据加工

5.3 搭建循环神经网络

5.4 模型配置

5.5 模型训练

5.6 模型性能验证


时间:7月25日 (09:00 - 18:00)

自然语言处理实战

1 自然语言处理概述

1.1 自然语言处理概述

2 NLP的基本流程

2.1 NLP的基本流程

2.2 语料字符处理

2.2.1 语料字符处理-字符串函数

2.2.2 正则表达式

2.2.3 正则表达式应用

2.3 分词和停用词处理

2.3.1 分词:正向最大匹配法

2.3.2 分词:正向最大匹配法实现

2.3.3 分词:逆向最大匹配法

2.4.1 N元语法模型

2.4.2 N元语法模型与分词

2.5.1 隐马尔可夫概述

2.5.2 隐马尔可夫实例

2.5.3 Viterbi算法

2.5.4 Viterbi算法应用


时间:7月26日 (09:00 - 18:00)

2.6 jieba分词

2.7 去停用词

3 文本向量化

3.1.1 向量化与独热编码

3.1.2 基于字典的one-hot实现

3.1.3 基于keras的one-hot表示

3.2 词袋模型

3.3 TF-IDF

3.4.1 Word2Vec模型概述

3.4.2 Word2Vec模型训练

3.4.3 Word2Vec模型应用

3.5 Doc2Vec模型


拓展自学

1、MindSpore框架基础实践

2、MindSpore深度学习原理实现

3、基于深度学习的问政留言分类(MindSpore)


特别内容

1、金牌助手ChatGPT,让应用开发更高效

2、昇腾人工智能生态概述

案例实战(线下)课程安排

时间:7月28日 (08:30) - 7月29日(11:30)

核心技能串讲与巩固

1 PyTorch简介

2 张量操作

3 构建一个线性模型

4 识别手写数字

5 深度学习引言

6 卷积神经网络CNN

7 循环神经网络RNN

8 长短时记忆网络LSTM

9 利用LSTM实现手写数字识别


时间:7月29日 (14:00 - 17:00)

基于textCNN的公众健康问句分类

1 背景与挖掘目标

1.1 背景与目标

1.2 目标分析

2 数据探索与处理

2.1 数据探索

2.2 剔除无效字符及分词操作

2.3 读取停用词表

2.4  去除停用词

2.5 为词语编号

3 词嵌入(Word2Vec)

3.1 词嵌入(Word2Vec)介绍

3.2 获取目标词向量矩阵

3.3 保存处理好的数据

4 模型构建(textCNN)

4.1 统一各样本的词语数量

4.2 textCNN介绍

4.3 构建textCNN

4.4 建模前数据准备

4.5 执行模型训练

5 模型性能评估

5.1 模型性能评估

5.2 小结


时间:7月30日 (08:30 - 11:30)

新冠疫情期间网民情绪识别

1 背景与目标

2 数据准备

2.1 数据基本介绍

2.2 词嵌入介绍

2.3 进行词向量训练

2.4 构建词向量矩阵

2.5 获取编码后的语料库

2.6 对各样本执行padding操作

2.7 拆分数据并将其转为模型所需格式

3 模型训练与性能验证

3.1 Embedding层介绍

3.2 定义Embedding层算子

3.3 定义LSTM层算子

3.4 定义全连接层算子

3.5 定义网络计算流程

3.6 模型构建及配置

3.7 模型训练

3.8 模型性能评估

4 小结


时间:7月30日 (14:00 - 17:00)

推荐系统受众性别智能识别

1 背景与目标

1.1 项目目标

1.2 数据介绍

1.3 目标分析

2 数据探索与处理

2.1 数据读取与探索

2.2 获取用户点击流介绍

2.3 统计用户的id点击次数

2.4 获取用户点击流

2.5 提取并保存样本标签

2.6 封装数据处理函数

3 词嵌入

3.1 词嵌入准备

3.2 词向量训练

3.3 构建词向量矩阵

3.4 对点击流进行编码

3.5 统一点击流的长度

3.6 保存词向量及点击流数据

4 模型构建与训练

4.1 建模前数据准备

4.2 模型训练

5 模型性能评估与优化

5.1 模型性能评估

5.2 模型优化


时间:7月31日 (09:00 - 17:00)

1、职业技术考试

2、企业参观


专题六<广州线下班>  计算机视觉应用实战(PyTorch)课程大纲

技能学习(线上)课程安排

时间:报名成功后即可开始学习

Python编程基础

1 认识Python

2 编写Python程序

3 认识Python数据结构

4 条件判断及分支语句

5 使用def定义函数

6 认识面向对象

7 读取文件数据

8 模块和第三方库

Python数据分析与应用

1 Python数据分析概述

2 NumPy数值计算基础

3 Matplotlib数据可视化基础

4 Pandas统计分析基础

5 使用Pandas进行数据预处理


时间:7月25日 (09:00 - 18:00)

专题讲座

计算机视觉技术及其应用

Python机器学习实战

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量Python实现

3 回归分析

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

4 决策树

4.1 从女士相亲到决策树

4.2 明天适合打球吗

4.3 决策树拆分属性选择

4.4 决策树算法家族

4.5 泰坦尼克号生还者预测-数据预处理

4.6 泰坦尼克号生还者预测-模型构建与预测


时间:7月26日 (09:00 - 18:00)

5 人工神经网络

5.1 单个神经元介绍

5.2 经典网络结构介绍

5.3 神经网络工作流程演示

5.4 如何修正网络参数-梯度下降法

5.5 网络工作原理推导

5.6 网络搭建准备

5.7 样本从输入层到隐层传输的Python实现

5.8 网络输出的Python实现

5.9 单样本网络训练的Python实现

5.10 全样本网络训练的Python实现

5.11 网络性能评价

5.12 调用sklearn实现神经网络算法


时间:7月27日 (09:00 - 18:00)

PyTorch框架基础实战

1 PyTorch简介

2 张量操作

2.1 创建张量

2.2 张量与数组相互转化

3 构建一个线性模型

3.1 任务描述:构建一个线性模型

3.2 读取数据

3.3 构建初始模型及损失函数

3.4 test-构建优化器

3.5 构建优化器

3.6 最小化方差(训练)

3.7 执行多轮训练

3.8 训练过程可视化

4 识别手写数字

4.1 案例目标与流程

4.2 加载数据

4.3 加工数据

4.4 模型结构介绍

4.5 构建模型

4.6 模型配置

4.7 模型训练

4.8 执行多轮训练

4.9 模型性能评估

4.10 保存模型

4.11 加载模型

4.12 模型应用


时间:7月28日 (09:00 - 18:00)

PyTorch深度学习原理与实现

1 深度神经网络-引言

2 卷积神经网络CNN

2.1 浅层神经网络的局限

2.2 卷积操作

2.3 卷积操作的优势

2.4 池化及全连接

2.5 高维输入及多filter卷积

2.6 实现卷积和操作

2.7 将卷积结果可视化

2.8 实现池化操作


时间:7月29日 (09:00 - 18:00)

3 循环神经网络RNN

3.1 循环神经网络简介

3.2 循环神经网络的常见结构

4 长短时记忆网络LSTM

4.1 LSTM的三个门

4.2 LSTM三个门的计算示例

4.3 实现LSTM操作

4.4 LSTM返回值解读

5 利用RNN&LSTM实现MNIST手写数字识别

5.1 加载数据

5.2 数据加工

5.3 搭建循环神经网络

5.4 模型配置

5.5 模型训练

5.6 模型性能验证


时间:7月30日 (09:00 - 18:00)

计算机视觉实战

1 概述

2.1 图像基础

2.2 读写图像

3.1 几何变换-图像平移和旋转

3.2 几何变换-最近邻插值

3.3 几何变换-其他插值方法介绍

4.1 灰度处理-线性变换

4.2 灰度处理-非线性变换

4.3 灰度处理-直方图均衡化

4.4 图像二值化

5.1 图像平滑

5.2 图像锐化-Sobel算子

5.3 图像锐化-其他算法

6 练习


拓展自学

1、MindSpore框架基础实践

2、MindSpore深度学习原理与实现

3、基于深度学习的问政留言分类(MindSpore)


特别内容

1、金牌助手ChatGPTl,让应用开发更高效

2、昇腾人工智能生态概述

案例实战(线下)课程安排

时间:8月1日 (08:30) - 8月(11:30)

核心技能串讲与巩固

1 PyTorch简介

2 张量操作

3 构建一个线性模型

4 识别手写数字

5 深度学习引言

6 卷积神经网络CNN

7 循环神经网络RNN

8 长短时记忆网络LSTM

9 利用LSTM实现手写数字识别

<

时间:8月2日 (14:00 - 17:00)

脑PET图像分析与疾病预测

1 背景与目标

2 数据处理

2.1 图像读取及尺寸调整

2.2 图像增强之翻转操作

2.3 图像增强之旋转缩放

2.4 获取所有照片路径

2.5 批量获取照片数据

2.6 将数据处理过程封装成函数

3 模型构建

3.1 定义卷积池化层

3.2 定义全连接层

3.3 定义网络计算过程

3.4 数据集维度顺序调整及类型转化

3.5 数据集分批及打乱操作

3.6 模型构建及配置

3.7 模型训练

4 模型性能评估及应用

4.1 模型性能评估及保存

4.2 模型应用


时间:8月3日 (08:30 - 11:30)

基于FaceNet的人脸智能识别

1 背景与目标

1.1 背景与目标

1.2 目标分析

1.3 开发环境和工程结构介绍

2 人脸检测

2.1 MTCNN人脸检测介绍

2.2 执行人脸检测操作

3 人脸对齐

3.1 执行人脸对齐操作

3.2 人脸检测与对齐代码整理

4 人脸特征提取

4.1 FaceNet溯源-计算机视觉领域的部分大事件

4.2 FaceNet介绍

4.3 执行人脸特征提取操作

5 人脸识别

5.1 获取后台数据库中的人脸数据

5.2 获取后台数据库人脸数据脚本解读

5.3 完成人脸识别操作

5.4 代码整理与结构可视化

6 小结


时间:8月3日 (1400 - 17:00)

基于YOLOX的农田害虫图像检测与识别

1 背景与目标

2 目标分析

2.1 目标检测任务的难点与挑战

2.2 目标检测方法发展历程

2.3 经典二阶段&一阶段算法介绍

3 YOLO目标检测

3.1 将目标检测任务转化为回归任务

3.2 YOLOv1中训练样本的标签设计

3.3 YOLOv1网络结构及输出数据解读

3.4 YOLOv1损失函数介绍

3.5 YOLOv1的缺点

3.6 YOLOv3及YOLOX介绍

3.7 目标检测常用数据集与性能评价指标介绍

3.8 项目目标完成步骤介绍

4 数据探索与处理

4.1 配套资源说明

4.2 数据探索

4.3 CopyAndPast数据增强介绍

4.4 CopyAndPast数据增强实现

4.5 汇总照片数据

5 数据加工

5.1 数据加工介绍

5.2 数据加工实现

6 环境搭建与模型训练

6.1 创建虚拟开发环境

6.2 启动虚拟环境并为其安装依赖库

6.3 安装YOLOX

6.4 模型训练

7 模型应用

7.1 模型应用

7.2 小结

8 拓展延申


时间:8月4日 (09:00 - 17:00)

1、职业技术考试

2、企业参观


专题七<广州线下班>  Hadoop+Spark大数据技术应用实战课程大纲

技能学习(线上)课程安排

时间:报名成功后即可开始学习

Linux操作系统基础

1 Linux概述

2 Linux基本命令

3 Linux Vi编辑器

Java编程基础

1 基础知识

2 面向对象

3 线程及异常处理

Scala编程基础

1 Scala简介

2 Scala安装配置

3 Scala基础语法

4 函数

5 面向对象编程

6 文件读写


时间:7月29日 (09:00 - 18:00 )

专题讲座

计算机视觉技术及其应用

Hadoop大数据基础

1 Hadoop简介

1.1 认识大数据

1.2 Hadoop核心组件

1.3 Hadoop生态环境

2 Hadoop集群的安装配置

2.1 安装虚拟机

2.2 配置固定IP

2.3 克隆虚拟机并修改配置

2.4 配置ssh无密码登录

2.5 配置时间同步服务

2.6 安装Java

2.7 Hadoop集群架构

2.8 Hadoop集群安装与配置

2.9 Hadoop集群启动与监控界面介绍



时间:7月30日 (09:00 - 18:00 )

3 Hadoop基本操作

3.1 Hadoop安全模式

3.2 Hadoop集群基本信息介绍

3.3 HDFS常用Shell操作

3.4 MapReduce常用Shell操作

3.5 MapReduce任务管理

3.6 MapReduce资源管理与任务调度

4 MapReduce开发入门

4.1 MapReduce思想与设计构思

4.2 MapReduce开发环境搭建

4.3 MapReduce WordCount源码分析

4.4 MapReduce API分析

4.5 MapReduce统计每天访问次数

4.6 MapReduce按用户访问次数排序


拓展

5 MapReduce编程进阶


时间:7月31日 (09:00 - 18:00 )

Hive大数据仓库

1 Hive简介

2 Hive安装配置

2.1 Hadoop集群介绍与MySQL安装

2.2 Hive安装配置

2.3 Hive单词计数

3 Hive应用

3.1.1 Hive表定义

3.1.2 创建内部表与外部表

3.1.3 创建静态分区表和动态分区表

3.1.4 创建带数据的表和桶表

3.2 Hive导入及导出

3.3.1 Select查询基本用法1

3.3.2 Select查询基本用法2

3.3.3 内置函数应用

3.3.4 关联查询


拓展

4 Hive开发

5 Hive自定义函数

6 Hive查询优化

时间:8月1日 (09:00 - 18:00 )

1 HBase简介与原理架构

1.1 HBase简介

1.2 HBase原理架构

2 HBase安装配置

2.1 安装集群

3 HBase Shell基本操作

3.1 namespace操作命令

3.2 创建表和查看表

3.3 修改和删除表

3.4 插入和查看数据

3.5 删除表数据

4 表的模式设计

4.1 表设计

5 HBase Java API应用

5.1 开发环境创建和连接HBase集群

5.2 Java API实现创建表和删除表

5.3 Java API设置Region

5.4 Java API修改列簇

5.5 Java API插入数据

5.6 Java API查看和删除数据

5.7 Java API任务实现


时间:8月2日 (09:00 - 18:00 )

Spark大数据技术应用

1 Spark入门

1.1 Spark入门

2 Spark集群的安装配置

2.1 Spark安装部署

2.2 Spark安装部署实战

3 Spark架构及原理

3.1 Spark架构

3.2 Spark RDD及DAG图相关概念

4 Spark编程基础

4.1 创建RDD

4.1 创建RDD

4.2 RDD常用算子之transformation算子(1)

4.3 RDD常用算子之transformation算子(2)

4.4 RDD常用算子之键值对RDD算子

4.5 RDD常用算子之action算子

4.6 文件读取与存储

4.7 统计用户停留时间最长的基站

时间:8月3日 (09:00 - 18:00 )

5 配置Spark IDEA开发环境

5.1 搭建Spark开发环境

6 Spark SQL应用

6.1 Spark SQL简介

6.2 Spark SQL配置

6.3 从结构化数据文件创建DataFrame

6.4 从外部数据库创建DataFrame

6.5 从RDD创建DataFrame

6.6 读取Hive表数据创建DataFrame

6.7 读取学生成绩创建DataFrame

6.8 常见DataFrame API操作1

6.9 常见的DataFrame操作2

6.10 常见的DataFrame操作3

6.11 通过DataFrame API计算学生总分和平均分

6.12 保存DataFrame数据

6.13 保存学生成绩分析结果到Hive

6.14 DataSet基础操作

6.15 统计商品销量


拓展内容

1 大数据分布式消息Zookeeper

2 Flume数据采集

3 Kafka消息系统

4 Flink大数据实时处理

5 商品实时推荐系统(Flume+Kafka+Flink)


特别内容

金牌助手ChatGPT,让应用开发更高效

案例实战(线下)课程安排

时间:8月5日(08:30) - 8月7日(11:30)

核心技能串讲与巩固

1 Hadoop大数据基础

2 Hive大数据仓库

3 HBase非关系型数据库

4 Spark大数据技术应用



时间:8月7日(14:00 - 17:00)

航空客户乘机数据预处理

1 案例背景与挖掘目标

2 数据存储

3 数据探索与数据清洗

4 属性规约

5 属性构造


时间:8月8日(08:30 - 17:00)

广电大数据用户画像

1 项目背景与目标分析

1.1 背景介绍

1.2 目标分析

1.3 系统架构介绍

2 数据存储

2.1 数据介绍

2.2 数据存储

2.3 开发环境搭建

3 数据探索与清洗

3.1.1 数据探索

3.1.2 数据清洗

4 用户画像标签计算

4.1 用户画像简介

4.2 消费内容

4.3 消费等级

4.4 产品名称

4.5 入网程度&业务名称

4.6 地区&语言偏好

5 SVM预测用户是否挽留

5.1 SVM介绍

5.2 特征构建

5.3 标签构建

5.4 模型构建与评估


时间:8月9日(09:00 - 17:00)

1、职业技术考试

2、企业参观


附件二  线上专场课表

专题一<线上班>  数据采集与分析实战(Python)课程大纲

技能学习课程安排

时间:报名成功后即可开始学习

Python编程基础

1 认识Python

2 编写Python程序

3 认识Python数据结构

4 条件判断及分支语句

5 使用def定义函数

6 认识面向对象

7 读取文件数据

8 模块和第三方库

Python数据分析与应用

1 Python数据分析概述

2 NumPy数值计算基础


时间:7月20日 (09:00 - 18:00)

专题讲座

计算机视觉技术及其应用

Pandas数据分析基础

1.1 掌握绘图集成语法与常用参数

1.2 分析特征间关系

1.3 分析特征内部数据分布与分散情况


时间:7月21日 (09:00 - 18:00)

2 Pandas统计分析基础

2.1 Pandas简介

2.2 读写不同数据源的数据

2.3 数据框与数据框元素

2.4 转换与处理时间序列数据

2.5 使用分组聚合进行组内计算

2.6 创建透视表与交叉表


时间:7月22日 (09:00 - 18:00)

3 使用Pandas进行数据与预处理

3.1 合并数据

3.2 清洗数据

3.3 标准化数据

3.4 转换数据


时间:7月23日 (09:00 - 18:00)

Python网络爬虫实战

1 Python爬虫环境与爬虫简介

1.1 认识爬虫

1.2 认识反爬虫

1.3 配置Python爬虫环境

2 网页前端基础

2.1 认识网络信息传输过程

2.2 认识HTTP

3 简单静态网页爬取

3.1 认识静态网页

3.2 实现HTTP请求

3.3 解析网页

3.4 存储数据

4 认识动态网页

4.1 认识动态网页

4.2 逆向分析爬取动态网页

4.3 使用Selenium库爬取动态网页


时间:7月24日 (09:00 - 18:00)

5 模拟登录

5.1 使用表单登录方法实现模拟登录

5.2 使用Cookie登录方法实现模拟登录

5.3 使用Selenium模拟登录


时间:7月24日 (09:00 - 18:00)

6 Scrapy爬虫

6.1 认识Scrapy

6.2 通过Scrapy爬取基本页面信息

6.3 通过Scrapy抓取跳转页面数据

7 拓展:终端协议及爬取工具介绍


拓展内容

网站图像素材采集实战

1 思路介绍

2 单个图片文件爬取

3 获取一个页面所有图片网址

4 保存所有图片

5 翻页爬取更多数据

6 PDF文件规律及问题

7 PDF翻页刷新的网址规律

8 获取当前页所有图片网址

9 翻页刷新爬取所有图片

10 图片拼接成PDF文件


特别内容

金牌助手ChatGPT,让应用开发更高效

案例实战课程安排

时间:7月26日 (09:00 - 18:00)

微博疫情评论数据采集

1 背景与目标

2.1 评论结构分析

2.2 数据接口分析

3.1.1 微博页面接口分析

3.1.2 微博ID获取

3.1.3 微博接口请求

3.1.4 长文本获取

3.1.5 单页微博获取

3.1.6 单页微博获取函数

3.2.1 评论数据接口分析

3.2.2 单页评论获取

3.3 评论回复数据爬取

3.4 单页微博及评论数据爬取

3.5 多线程爬虫

4 小结


时间:7月27日 (09:00 - 18:00)

农产品信息采集与分析

1.1 背景与分析目标

2.1 网页分析和爬虫思路

2.2 省份链接获取

2.3 获取省份名称

2.4 确定翻页数目

2.5 获取单页表格

2.6 获取所有省份和页面的数据

2.7 分布式爬取

3.1 数据预处理

3.2 数据 指标提取

3.3 省级以上部门审定数据分析

3.4 水稻品种类型数量分析

3.5 主要水稻类型被审定的数量分析

3.6 水稻母本分析

3.7 主要审定公司分析

4 总结

时间:7月28日 (09:00 - 18:00)

泰迪内推平台招聘信息采集与分析

1 背景与目标

2 数据采集

2.1 网页结构探索

2.2 定位一级页面数据地址

2.3 爬取及解析一级页面数据

2.4 提取一级页面字段

2.5 定位二级页面数据地址

2.6 爬取及解析二级页面数据

2.7 翻页爬取及数据保存

3 数据处理

3.1 读取已爬取完成的数据

3.2 数据预处理操作

4 分析与可视化

4.1 招聘岗位对学历要求分析

4.2 各行业的大数据招聘需求数量分析

4.3 不同类型公司的薪资待遇分析

4.4 小结

时间:7月29日 (16:00 - 18:00)

职业技术考试


专题二<线上班>  商务数据分析实战(Excel+Power BI)课程大纲

技能学习课程安排

时间:7月21日 (09:00 - 18:00)

专题讲座

计算机视觉技术及其应用

Excel数据分析基础与实战

1.1 认识数据分析

1.2 认识Excel 2016

2.1 获取文本数据

2.2 从数据库获取数据

3.1 排序

3.2 筛选

3.3 分类汇总

4.1 认识公式和函数

4.2 数组公式

4.3 日期和时间函数

4.4 数学函数

4.5 统计函数

4.6 文本函数

4.7 逻辑函数

5.1 透视表的创建和修改

5.2 透视表的操作

5.3 透视图的操作


时间:7月22日 (09:00 - 18:00)

6.1 对比分析

6.2 趋势分析

6.3 饼图

6.4 散点图

6.5 雷达图

7.1 案例背景

7.2 数据预处理

8 商品销售分析

9 库存分析

10 用户分析

11 分析报告

时间:7月23日 (09:00 - 18:00)

1.1 认识数据分析

1.2 了解可视化工具

1.3 认识Power BI

2.1 数据来源

2.2 获取数据

3.1 认识编辑器和M语言

3.2 数据集成

3.3 数据清洗

3.4 转换数据

3.5 数据泛化


时间:7月24日 (09:00 - 18:00)

Python数据分析实训

4.1 认识DAX语言

4.2 构建日历表

4.3 构建表间关系

4.4 度量值

5.1 认识可视化

5.2 条形图和柱状图

5.3 雷达图和漏斗图


时间:7月25日 (09:00 - 18:00)

5.4 饼图和环形图

5.5 瀑布图和树状图

5.6 折线图和散点图

5.7 描述性分析

5.8 KPI分析

6.1 认识分析报表

6.2 制作分析报表

7 部署


特别内容

金牌助手ChatGPT,让应用开发更高效

案例实战课程安排

时间:7月26日 (09:00 - 18:00)

新零售智能销售数据分析(Power BI)

1 案例背景

2 数据清洗

3 数据规约

4 数据建模

5 销售分析

6 库存分析

7 用户分析

8 部署和发布

时间:7月27日 (09:00 - 18:00)

餐饮企业综合分析(Power BI)

1 案例背景

2 数据预处理

2.1 数据预处理1

2.2 数据预处理2

3 数据可视化

3.1 数据分析与可视化1

3.2 数据分析与可视化2

时间:7月28日 (09:00 - 18:00)

财务分析在纳税评估中的应用(Excel)

1 案例背景和分析流程

2 数据预处理

3 发现疑点

4 共同比分析

5 增长趋势分析

6 财务比率分析

7 重点评估区域

8 重点评估区域审计

9 问题发现和财务报表的调整

10 小结

时间:7月29日 (09:00 - 18:00)

学生校园卡消费行为分析(Excel)

1.1 案例背景与目标

2.1 预处理:读取数据和异常值

2.2 预处理:缺失值

2.3 预处理:重复值与合并数据

3.1 食堂消费数据分析

3.2 学生消费行为分析


时间:7月29日 (09:00 - 18:00)

职业技术考试


专题三<线上班>  机器学习与大数据分析实战(Python)课程大纲

技能学习课程安排

时间:报名成功后即可开始学习

Python编程基础

1 认识Python

2 编写Python程序

3 认识Python数据结构

4 条件判断及分支语句

5 使用def定义函数

6 认识面向对象

7 读取文件数据

8 模块和第三方库

Python数据分析与应用

1 Python数据分析概述

2 NumPy数值计算基础


时间:7月20日 (09:00 - 18:00)

专题讲座

计算机视觉技术及其应用

Pandas数据分析基础

1 Matplotlib数据可视化基础

1.1 掌握绘图基础语法与常用参数

1.2 分析特征间关系

1.3 分析特征内部数据分布与分散情况

2 Pandas统计分析基础

2.1 Pandas简介

2.2 读写不同数据源的数据

2.3 数据框与数据框元素


时间:7月21日 (09:00 - 18:00)

2.4 转换与处理时间序列数据

2.5 使用分组聚合进行组内计算

2.6 创建透视表与交叉表

3 使用Pandas进行数据预处理

3.1 合并数据

3.2 清洗数据

3.3 标准化数据

3.4 转换数据


时间:7月22日 (09:00 - 18:00)

Python机器学习实战

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2  模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量Python实现

3 回归分析

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

4 决策树

4.1 从女生相亲到决策树

4.2 明天适合打球吗?

4.3 决策树拆分属性选择

4.4 决策树算法家族

4.5 泰坦尼克号生还者预测-数据预处理

4.6 泰坦尼克号生还者预测-模型构建与预测


时间:7月23日 (09:00 - 18:00)

5 人工神经网络

5.1 单个神经元介绍

5.2 经典网络结构介绍

5.3 神经网络工作流程 演示

5.4 如何修正网络参数-梯度下降法

5.5 网络工作原理推导

5.6 网络搭建准备

5.7 样本从输入层到隐层传输的Python实现

5.8 网络输出的Python实现

5.9 单样本网络训练的Python实现

5.10 全样本网络训练的Python实现

5.11 网络性能评价

5.12 调用sklearn实现神经网络算法


时间:7月24日 (09:00 - 18:00)

6 支持向量机

6.1 间隔与支持向量

6.2 对偶问题

6.3 核函数

6.4 软间隔与正则化

6.5 支持向量机算法的Python实现

7.1 聚类分析概述

7.2 相似性度量

7.3 K-Means聚类分析算法介绍

7.4 利用K-Means算法对鸢尾花进行聚类

7.5 聚类结果的性能度量

7.6 调用sklearn实现聚类分析

拓展

8 集成学习

8.1 集成学习基本概念

8.2 并行集成算法-Bagging&RandomForest

8.3 串行集成算法-Boosting算法流程

8.4 串行集成算法-Boosting代码实现

8.5 Stacking算法流程

8.6 Stacking代码实现


时间:7月25日 (09:00 - 18:00)

特征工程

1.1 特征工程是什么

1.2 特征工程效果评估

1.3 定性还是定量

1.4 数据的4个等级介绍

1.5 数据的4个等级演示

2.1 探索性数据分析

2.2 探究不同类别样本的血糖浓度

2.3 缺失值探索

2.4 删除缺失值

2.5 构建基线模型

2.6 网格搜索优化

2.7 利用0进行缺失值填充的模型性能

2.8 利用均值进行缺失值填充的模型性能

2.9 标准化和归一化介绍

2.10 结合机器学习流水线进一步优化

2.11 数据预处理小结

3.1 特征构建引言

3.2 分类数据的填充

3.3 自定义分类数据填充器

3.4 自定义定量数据填充器

3.5 编码定类数据

3.6 编码定序变量

3.7 连续变量分箱

3.8 在流水线中封装预处理操作

3.9 拓展数值特征的模型基线

3.10 多页式特征模型性能


时间:7月26日 (09:00 - 18:00)

4.1 特征选择介绍

4.2 数据导入及探索

4.3 基于皮尔逊相关系数的特征选择

4.4 特征选择前后模型性能比较

4.5 基于假设检验的特征选择

4.6 基于树的特征选择

4.7 特征选择后模型性能探索

4.8 基于线性模型的特征选择

4.9 小结

5.1 特征转换介绍

5.2 主成分分析(PCA)介绍

5.3 PCA工作流程实现

5.4 PCA方差分析

5.5 利用sklearn实现PCA

5.6 深入解释PCA之相关性探究

5.7 深入解释PCA之线性变换

5.8 深入解释PCA之数据分布探索

5.9 PCA小结

5.10 LDA工作流程及实现

5.11 sklearn实现LDA

5.12 LDA数据分布探索

5.13 应用特征转换

5.14 小结


拓展

6.1 特征学习介绍

6.2 受限波尔兹曼机(RBM)工作原理

6.3 MNIST数字识别任务介绍

6.4 MNIST数据准备

6.5 PCA特征分析

6.6 PBM特征学习

6.7 构建基线模型

6.8 加入PCA进行模型优化

6.9 加入RBM进行模型优化

6.10 多层受限玻尔兹曼机


特别内容

金牌助手ChatGPT,让应用开发更高效

案例实战课程安排

时间:7月27日 (09:00 - 18:00)

O2O优惠劵使用预测

1 背景与目标

2.1 线下训练集数据介绍

2.2 线上训练集数据介绍

2.3 测试数据介绍

2.4 项目流程介绍

3.1 构建正样本

3.2 构建负样本

3.3 构建样本标签

4.1 特征构建介绍

4.2 处理Discount_rate列

4.3 特征-折扣率

4.4 特征-商户与用户之间的距离

5.1 建模前数据准备

5.2 初级模型构建

5.3 ROC曲线与AUC值

5.4 模型性能评估

5.5 训练函数封装

5.6 模型预测

5.7 预测函数封装

6.1 特征- 优惠券流行度

6.2 特征-用户在商家的消费次数

6.3 如何进行特征拼接

6.4 拼接训练集的特征

6.5 拼接测试集的特征

7.1 模型训练

7.2 预测

7.3 代码整理


时间:7月28日 (09:00 - 18:00)

网络入侵用户自动识别

1 背景与目标

2 数据处理

2.1 读取数据

2.2 了解数据基本情况

2.3 哑变量处理

2.4 拼接特征并删除无关列

2.5 标签转化及预处理函数封装

3 模型训练与验证

3.1 认识集成学习算法

3.2 模型训练与性能验证

3.3 保存模型训练集数据结构

4 模型应用与评估

4.1 加载并处理待预测样本

4.2 模型应用及性能评估

时间:7月29日 (09:00 - 18:00)

天猫用户重复购买预测

1.1 背景与挖掘目标

2.1 工程环境准备

2.2 缺失值处理和数据去重

2.3 数据分布探索

3.1 特征工程介绍

3.2 原始特征

3.3.1 用户相关特征:用户在平台的总交互次数

3.3.2 用户相关特征:用户最近一次购买距离第一次的时长

3.4.1 商家相关特征:商家被交互的数量

3.4.2 商家相关特征:商家的复购次数

3.5.1 用户和商家相关特征:用户在商家的交换次数

3.5.2 用户和商家相关特征:不同用户在不同商家购买率

3.6 离散型特征处理

4.1 建模前的数据处理

4.2 模型构建

4.3 模型训练和评估

4.4 模型应用

5 小结


时间:7月30日 (09:00 - 18:00)

泰迪内推平台信息精准推荐应用(基于泰迪建模平台实现)

1 背景与目标

2 目标分析

2.1 推荐思路分析

2.2 基于物品的协同过滤推荐介绍

3 工程实现

3.1 EB工具登录简介

3.2 创建空白工程

3.3 导入数据

3.4 筛选郑文数据

3.5 字符替换及记录去重

3.6 划分训练集用户和测试集用户

3.7 构造训练集和测试集数据

3.8 构建模型

3.9 推荐及性能评估

4 小结


时间:7月31日 (16:00 - 18:00)

职业技术考试


专题四<线上班>  PyTorch与人工智能课程大纲

技能学习课程安排

时间:报名成功后即可开始学习

Python编程基础

1 认识Python

2 编写Python程序

3 认识Python数据结构

4 条件判断及分支语句

5 使用def定义函数

6 认识面向对象

7 读取文件数据

8 模块和第三方库

Python数据分析与应用

1 Python数据分析概述

2 NumPy数值计算基础

3 Matplotlib数据可视化基础

4 Pandas统计分析基础

5 使用Pandas进行数据预处理


时间:7月21日 (09:00 - 18:00)

专题讲座

计算机视觉技术及其应用

Python机器学习实战

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量Python实现

3 回归分析

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

4 决策树

4.1 从女士相亲到决策树

4.2 明天适合打球吗

4.3 决策树拆分属性选择

4.4 决策树算法家族

4.5 泰坦尼克号生还者预测-数据预处理

4.6 泰坦尼克号生还者预测-模型构建与预测


时间:7月22日 (09:00 - 18:00)

5 人工神经网络

5.1 单个神经元介绍

5.2 经典网络结构介绍

5.3 神经网络工作流程演示

5.4 如何修正网络参数-梯度下降法

5.5 网络工作原理推导

5.6 网络搭建准备

5.7 样本从输入层到隐层传输的Python实现

5.8 网络输出的Python实现

5.9 单样本网络训练的Python实现

5.10 全样本网络训练的Python实现

5.11 网络性能评价

5.12 调用sklearn实现神经网络算法


时间:7月23日 (09:00 - 18:00)

PyTorch框架基础实践

1 PyTorch简介

2 张量操作

2.1 创建张量

2.2 张量与数组相互转化

3 构建一个线性模型

3.1 任务描述:构建一个线性模型

3.2 读取数据

3.3 构建初始模型及损失函数

3.4 test-构建优化器

3.5 构建优化器

3.6 最小化方差(训练)

3.7 执行多轮训练

3.8 训练过程可视化

4 识别手写数字

4.1 案例目标流程

4.2 加载数据

4.3 加工数据

4.4 模型结构介绍

4.5 构建模型

4.6 模型配置

4.7 模型训练

4.8 执行多轮训练

4.9 模型性能评估

4.10 保存模型

4.11 加载模型

4.12 模型应用


时间:7月24日 (09:00 - 18:00)

PyTorch深度学习原理与实现

1 深度神经网络-引言

2 卷积神经网络CNN

2.1 浅层神经网络的局限

2.2 卷积操作

2.3 卷积操作的优势

2.4 池化及全连接

2.5 高维输入及多filter卷积

2.6 实现卷积和操作

2.7 将卷积结果可视化

2.8 实现池化操作


时间:7月25日 (09:00 - 18:00)

3 循环神经网络RNN

3.1 循环神经网络简介

3.2 循环神经网络的常见结构

4 长短时记忆网络LSTM

4.1 LSTM的三个门

4.2 LSTM三个门的计算示例

4.3 实现LSTM操作

4.4 LSTM返回值解读

5 利用LSTM实现mnist手写数字识别

5.1 加载数据

5.2 数据加工

5.3 搭建循环神经网络

5.4 模型配置

5.5 模型训练

5.6 模型性能验证


特别内容

金牌助手ChatGPTl,让应用开发更高效

案例实战课程安排

时间:7月26日 (09:00 - 18:00)

脑PET图像分析与疾病预测

1 背景与目标

2 数据处理

2.1 图像读取及尺寸调整

2.2 图像增强之翻转操作

2.3 图像增强之旋转缩放

2.4 获取所有照片路径

2.5 批量获取照片数据

2.6 将数据处理过程封装成函数

3 模型构建

3.1 定义卷积&池化层

3.2 定义全连接层

3.3 定义网络计算过程

3.4 数据集维度顺序调整及类型转化

3.5 数据集分批及打乱操作

3.6 模型构建及配置

3.7 模型训练

4 模型性能评估及应用

4.1 模型性能评估及保存

4.2 模型应用

时间:7月27日 (09:00 - 18:00)

新冠疫情期间网民情绪识别

1 背景与目标

2 数据准备

2.1 数据基本介绍

2.2 词嵌入介绍

2.3 进行词向量训练

2.4 构建词向量矩阵

2.5 获取编码后的语料库

2.6 对各样本执行padding操作

2.7 拆分数据并将其转为模型所需格式

3 构建模型

3.1 模型介绍

3.2 模型构建

3.3 模型训练

3.4 性能评估

4 小结

时间:7月28日 (09:00 - 18:00)

基于FaceNet的人脸智能识别

1 背景与目标

1.1 背景与目标

1.2 目标分析

1.3 开发环境和工程结构介绍

2 人脸检测

2.1 MTCNN人脸检测介绍

2.2 执行人脸检测操作

3 人脸对齐

3.1 执行人脸对齐操作

3.2 人脸检测及对齐代码整理

4 人脸特征提取

4.1 FaceNet溯源-计算机视觉领域的部分大事件

4.2 FaceNet介绍

4.3 执行人脸特征提取操作

5 人脸识别

5.1 获取后台数据库中的人脸数据

5.2 获取后台数据库人脸数据脚本解读

5.3 完成人脸识别操作

5.4 代码整理与结果可视化

6 小结

时间:7月29日 (16:00 - 18:00)

职业技术考试


专题五<线上班> 文本分析与挖掘实战(PyTorch)课程大纲

技能学习课程安排

时间:报名成功后即可开始学习

Python编程基础

1 认识Python

2 编写Python程序

3 认识Python数据结构

4 条件判断及分支语句

5 使用def定义函数

6 认识面向对象

7 读取文件数据

8 模块和第三方库

Python数据分析与应用

1 Python数据分析概述

2 NumPy数值计算基础

3 Matplotlib数据可视化基础

4 Pandas统计分析基础

5 使用Pandas进行数据预处理


时间:7月20日 (09:00 - 18:00)

专题讲座

计算机视觉技术及其应用

Python机器学习实战

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量Python实现

3 回归分析

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

4.1 单个神经元介绍

4.2 经典网络结构介绍

4.3 神经网络工作流程演示

4.4 如何修正网络参数-梯度下降法

4.5 网络工作原理推导

时间:7月21日 (09:00 - 18:00)

4.6 网络搭建准备

4.7 样本从输入层到隐层传输的Python实现

4.8 网络输出的Python实现

4.9 单样本网络训练的Python实现

4.10 全样本网络训练的Python实现

4.11 网络性能评价

4.12 调用sklearn实现神经网络算法

5.1 聚类分析概述

5.2 相似性度量

5.3 K-Means聚类分析算法介绍

5.4 利用K-Means算法对鸢尾花进行聚类

5.5 聚类结果的性能度量

5.6 调用sklearn实现聚类分析

6.1 间隔与支持向量

6.2 对偶问题

6.3 核函数

6.4 软间隔与正则化

6.5 支持向量机算法的Python实现


时间:7月22日 (09:00 - 18:00)

PyTorch框架基础实践

1 PyTorch简介

2 张量操作

2.1 创建张量

2.2 张量与数组相互转化

3 构建一个线性模型

3.1 任务描述:构建一个线性模型

3.2 读取数据

3.3 构建初始模型及损失函数

3.4 test-构建优化器

3.5 构建优化器

3.6 最小化方差(训练)

3.7 执行多轮训练

3.8 训练过程可视化

4 识别手写数字

4.1 案例目标与流程

4.2 加载数据

4.3 加工数据

4.4 模型结构介绍

4.5 构建模型

4.6 模型配置

4.7 模型训练

4.8 执行多轮训练

4.9 模型性能评估

4.10 保存模型

4.11 加载模型

4.12 模型应用


时间:7月23日 (09:00 - 18:00)

PyTorch深度学习原理与实现

1 引言

2 卷积神经网络CNN

2.1 浅层神经网络的局限

2.2 卷积操作

2.3 卷积操作的优势

2.4 池化及全连接

2.5 高维输入及多filter卷积

2.6 实现卷积操作

2.7 将卷积结构可视化

2.8 实现池化操作


时间:7月24日 (09:00 - 18:00)

3 循环神经网络RNN

3.1 循环神经网络简介

3.2 循环神经网络的常见结构

4 长短时记忆网络LSTM

4.1 LSTM的三个门

4.2 LSTM三个门的计算示例

4.3 实现LSTM操作

4.4 LSTM返回值解读

5 利用LSTM实现手写数字识别

5.1 加载数据

5.2 数据加工

5.3 搭建循环神经网络

5.4 模型配置

5.5 模型训练

5.6 模型性能验证


时间:7月25日 (09:00 - 18:00)

自然语言处理实战

1 自然语言处理概述

1.1 自然语言处理概述

2 NLP的基本流程

2.1 NLP的基本流程

2.2 语料字符处理

2.2.1 语料字符处理-字符串函数

2.2.2 正则表达式

2.2.3 正则表达式应用

2.3 分词和停用词处理

2.3.1 分词:正向最大匹配法

2.3.2 分词:正向最大匹配法实现

2.3.3 分词:逆向最大匹配法

2.4.1 N元语法模型

2.4.2 N元语法模型与分词

2.5.1 隐马尔可夫概述

2.5.2 隐马尔可夫实例

2.5.3 Viterbi算法

2.5.4 Viterbi算法应用


时间:7月26日 (09:00 - 18:00)

2.6 jieba分词

2.7 去停用词

3 文本向量化

3.1.1 向量化与独热编码

3.1.2 基于字典的one-hot实现

3.1.3 基于keras的one-hot表示

3.2 词袋模型

3.3 TF-IDF

3.4.1 Word2Vec模型概述

3.4.2 Word2Vec模型训练

3.4.3 Word2Vec模型应用

3.5 Doc2Vec模型


特别内容

金牌助手ChatGPT,让应用开发更高效

案例实战课程安排

时间:7月27日 (09:00 - 18:00)

基于textCNN的公众健康问句分类

1 背景与挖掘目标

1.1 背景与目标

1.2 目标分析

2 数据探索与处理

2.1 数据探索

2.2 剔除无效字符及分词操作

2.3 读取停用词表

2.4  去除停用词

2.5 为词语编号

3 词嵌入(Word2Vec)

3.1 词嵌入(Word2Vec)介绍

3.2 获取目标词向量矩阵

3.3 保存处理好的数据

4 模型构建(textCNN)

4.1 统一各样本的词语数量

4.2 textCNN介绍

4.3 构建textCNN

4.4 建模前数据准备

4.5 执行模型训练

5 模型性能评估

5.1 模型性能评估

5.2 小结

时间:7月28日 (09:00 - 18:00)

新冠疫情期间网民情绪识别

1 背景与目标

2 数据准备

2.1 数据基本介绍

2.2 词嵌入介绍

2.3 进行词向量训练

2.4 构建词向量矩阵

2.5 获取编码后的语料库

2.6 对各样本执行padding操作

2.7 拆分数据并将其转为模型所需格式

3 模型训练与性能验证

3.1 Embedding层介绍

3.2 定义Embedding层算子

3.3 定义LSTM层算子

3.4 定义全连接层算子

3.5 定义网络计算流程

3.6 模型构建及配置

3.7 模型训练

3.8 模型性能评估

4 小结

时间:7月29日 (09:00 - 18:00)

推荐系统受众性别智能识别

1 背景与目标

1.1 项目目标

1.2 数据介绍

1.3 目标分析

2 数据探索与处理

2.1 数据读取与探索

2.2 获取用户点击流介绍

2.3 统计用户的id点击次数

2.4 获取用户点击流

2.5 提取并保存样本标签

2.6 封装数据处理函数

3 词嵌入

3.1 词嵌入准备

3.2 词向量训练

3.3 构建词向量矩阵

3.4 对点击流进行编码

3.5 统一点击流的长度

3.6 保存词向量及点击流数据

4 模型构建与训练

4.1 建模前数据准备

4.2 模型训练

5 模型性能评估与优化

5.1 模型性能评估

5.2 模型优化


时间:7月30日 (16:00 - 18:00)

职业技术考试


专题六<线上班>  计算机视觉应用实战(PyTorch)课程大纲

技能学习课程安排

时间:报名成功后即可开始学习

Python编程基础

1 认识Python

2 编写Python程序

3 认识Python数据结构

4 条件判断及分支语句

5 使用def定义函数

6 认识面向对象

7 读取文件数据

8 模块和第三方库

Python数据分析与应用

1 Python数据分析概述

2 NumPy数值计算基础

3 Matplotlib数据可视化基础

4 Pandas统计分析基础

5 使用Pandas进行数据预处理


时间:7月20日 (09:00 - 18:00)

专题讲座

计算机视觉技术及其应用

Python机器学习实战

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量Python实现

3 回归分析

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

4 决策树

4.1 从女士相亲到决策树

4.2 明天适合打球吗

4.3 决策树拆分属性选择

4.4 决策树算法家族

4.5 泰坦尼克号生还者预测-数据预处理

4.6 泰坦尼克号生还者预测-模型构建与预测


时间:7月21日 (09:00 - 18:00)

5 人工神经网络

5.1 单个神经元介绍

5.2 经典网络结构介绍

5.3 神经网络工作流程演示

5.4 如何修正网络参数-梯度下降法

5.5 网络工作原理推导

5.6 网络搭建准备

5.7 样本从输入层到隐层传输的Python实现

5.8 网络输出的Python实现

5.9 单样本网络训练的Python实现

5.10 全样本网络训练的Python实现

5.11 网络性能评价

5.12 调用sklearn实现神经网络算法


时间:7月22日 (09:00 - 18:00)

PyTorch框架基础实战

1 PyTorch简介

2 张量操作

2.1 创建张量

2.2 张量与数组相互转化

3 构建一个线性模型

3.1 任务描述:构建一个线性模型

3.2 读取数据

3.3 构建初始模型及损失函数

3.4 test-构建优化器

3.5 构建优化器

3.6 最小化方差(训练)

3.7 执行多轮训练

3.8 训练过程可视化

4 识别手写数字

4.1 案例目标与流程

4.2 加载数据

4.3 加工数据

4.4 模型结构介绍

4.5 构建模型

4.6 模型配置

4.7 模型训练

4.8 执行多轮训练

4.9 模型性能评估

4.10 保存模型

4.11 加载模型

4.12 模型应用


时间:7月23日 (09:00 - 18:00)

PyTorch深度学习原理与实现

1 深度神经网络-引言

2 卷积神经网络CNN

2.1 浅层神经网络的局限

2.2 卷积操作

2.3 卷积操作的优势

2.4 池化及全连接

2.5 高维输入及多filter卷积

2.6 实现卷积和操作

2.7 将卷积结果可视化

2.8 实现池化操作

<


时间:7月24日 (09:00 - 18:00)

3 循环神经网络RNN

3.1 循环神经网络简介

3.2 循环神经网络的常见结构

4 长短时记忆网络LSTM

4.1 LSTM的三个门

4.2 LSTM三个门的计算示例

4.3 实现LSTM操作

4.4 LSTM返回值解读

5 利用RNN&LSTM实现MNIST手写数字识别

5.1 加载数据

5.2 数据加工

5.3 搭建循环神经网络

5.4 模型配置

5.5 模型训练

5.6 模型性能验证


时间:7月25日 (09:00 - 18:00)

计算机视觉实战

1 概述

2.1 图像基础

2.2 读写图像

3.1 几何变换-图像平移和旋转

3.2 几何变换-最近邻插值

3.3 几何变换-其他插值方法介绍

4.1 灰度处理-线性变换

4.2 灰度处理-非线性变换

4.3 灰度处理-直方图均衡化

4.4 图像二值化

5.1 图像平滑

5.2 图像锐化-Sobel算子

5.3 图像锐化-其他算法

6 练习


特别内容

金牌助手ChatGPTl,让应用开发更高效

案例实战课程安排

时间:7月26日 (09:00 - 18:00)

脑PET图像分析与疾病预测

1 背景与目标

2 数据处理

2.1 图像读取及尺寸调整

2.2 图像增强之翻转操作

2.3 图像增强之旋转缩放

2.4 获取所有照片路径

2.5 批量获取照片数据

2.6 将数据处理过程封装成函数

3 模型构建

3.1 定义卷积&池化层

3.2 定义全连接层

3.3 定义网络计算过程

3.4 数据集维度顺序调整及类型转化

3.5 数据集分批及打乱操作

3.6 模型构建及配置

3.7 模型训练

4 模型性能评估及应用

4.1 模型性能评估及保存

4.2 模型应用


时间:7月27日 (09:00 - 18:00)

基于FaceNet的人脸智能识别

1 背景与目标

1.1 背景与目标

1.2 目标分析

1.3 开发环境和工程结构介绍

2 人脸检测

2.1 MTCNN人脸检测介绍

2.2 执行人脸检测操作

3 人脸对齐

3.1 执行人脸对齐操作

3.2 人脸检测与对齐代码整理

4 人脸特征提取

4.1 FaceNet溯源-计算机视觉领域的部分大事件

4.2 FaceNet介绍

4.3 执行人脸特征提取操作

5 人脸识别

5.1 获取后台数据库中的人脸数据

5.2 获取后台数据库人脸数据脚本解读

5.3 完成人脸识别操作

5.4 代码整理与结构可视化

6 小结

时间:7月28日 (09:00 - 18:00)

基于YOLOX的农田害虫图像检测与识别

1 背景与目标

2 目标分析

2.1 目标检测任务的难点与挑战

2.2 目标检测方法发展历程

2.3 经典二阶段&一阶段算法介绍

3 YOLO目标检测

3.1 将目标检测任务转化为回归任务

3.2 YOLOv1中训练样本的标签设计

3.3 YOLOv1网络结构及输出数据解读

3.4 YOLOv1损失函数介绍

3.5 YOLOv1的缺点

3.6 YOLOv3及YOLOX介绍

3.7 目标检测常用数据集与性能评价指标介绍

3.8 项目目标完成步骤介绍

4 数据探索与处理

4.1 配套资源说明

4.2 数据探索

4.3 CopyAndPast数据增强介绍

4.4 CopyAndPast数据增强实现

4.5 汇总照片数据

时间:7月29日 (09:00 - 18:00)

5 数据加工

5.1 数据加工介绍

5.2 数据加工实现

6 环境搭建与模型训练

6.1 创建虚拟开发环境

6.2 启动虚拟环境并为其安装依赖库

6.3 安装YOLOX

6.4 模型训练

7 模型应用

7.1 模型应用

7.2 小结

8 拓展延申


时间>:7月30日 (16:00 - 18:00)

职业技术考试


专题七<线上班>  Hadoop+Spark大数据技术应用实战课程大纲

技能学习课程安排

时间:报名成功后即可开始学习

Linux操作系统基础

1 Linux概述

2 Linux系统安装

3 Linux基本命令

4 Linux Vi编辑器

5 Linux Shell编程

Java编程基础

1 基础知识

2 面向对象

3 线程及异常处理

Scala编程基础

1 Scala简介

2 Scala安装配置

3 Scala基础语法

4 函数

5 面向对象编程

6 文件读写


时间:7月20日 (09:00 - 18:00 )

专题讲座

计算机视觉技术及其应用

Hadoop大数据基础

1 Hadoop简介

1.1 认识大数据

1.2 Hadoop核心组件

1.3 Hadoop生态环境

2 Hadoop集群的安装配置

2.1 安装虚拟机

2.2 配置固定IP

2.3 克隆虚拟机并修改配置

2.4 配置ssh无密码登录

2.5 配置时间同步服务

2.6 安装Java

2.7 Hadoop集群架构

2.8 Hadoop集群安装与配置

2.9 Hadoop集群启动与监控界面介绍



时间:7月21日 (09:00 - 18:00 )

3 Hadoop基本操作

3.1 Hadoop安全模式

3.2 Hadoop集群基本信息介绍

3.3 HDFS常用Shell操作

3.4 MapReduce常用Shell操作

3.5 MapReduce任务管理

3.6 MapReduce资源管理与任务调度

4 MapReduce开发入门

4.1 MapReduce思想与设计构思

4.2 MapReduce开发环境搭建

4.3 MapReduce WordCount源码分析

4.4 MapReduce API分析

4.5 MapReduce统计每天访问次数

4.6 MapReduce按用户访问次数排序


拓展

5 MapReduce编程进阶


时间:7月22日 (09:00 - 18:00 )

Hive大数据仓库

1 Hive简介

2 Hive安装配置

2.1 Hadoop集群介绍与MySQL安装

2.2 Hive安装配置

2.3 Hive单词计数

3 Hive应用

3.1.1 Hive表定义

3.1.2 创建内部表与外部表

3.1.3 创建静态分区表和动态分区表

3.1.4 创建带数据的表和桶表

3.2 Hive导入及导出


时间:7月23日 (09:00 - 18:00 )

3.3.1 Select查询基本用法1

3.3.2 Select查询基本用法2

3.3.3 内置函数应用

3.3.4 关联查询


拓展

4 Hive开发

5 Hive自定义函数

6 Hive查询优化


时间:7月24日 (09:00 - 18:00 )

1 HBase简介与原理架构

1.1 HBase简介

1.2 HBase原理架构

2 HBase安装配置

2.1 安装集群

3 HBase Shell基本操作

3.1 namespace操作命令

3.2 创建表和查看表

3.3 修改和删除表

3.4 插入和查看数据

3.5 删除表数据


时间:7月25日 (09:00 - 18:00 )

4 表的模式设计

4.1 表设计

5 HBase Java API应用

5.1 开发环境创建和连接HBase集群

5.2 Java API实现创建表和删除表

5.3 Java API设置Region

5.4 Java API修改列簇

5.5 Java API插入数据

5.6 Java API查看和删除数据

5.7 Java API任务实现


时间:7月26日 (09:00 - 18:00 )

Spark大数据技术应用

1 Spark入门

1.1 Spark入门

2 Spark集群的安装配置

2.1 Spark安装部署

2.2 Spark安装部署实战

3 Spark架构及原理

3.1 Spark架构

3.2 Spark RDD及DAG图相关概念

4 Spark编程基础

4.1 创建RDD

4.1 创建RDD

4.2 RDD常用算子之transformation算子(1)

4.3 RDD常用算子之transformation算子(2)

4.4 RDD常用算子之键值对RDD算子

4.5 RDD常用算子之action算子

4.6 文件读取与存储

4.7 统计用户停留时间最长的基站


时间:7月28日 (09:00 - 18:00 )

5 配置Spark IDEA开发环境

5.1 搭建Spark开发环境

6 Spark SQL应用

6.1 Spark SQL简介

6.2 Spark SQL配置

6.3 从结构化数据文件创建DataFrame

6.4 从外部数据库创建DataFrame

6.5 从RDD创建DataFrame

6.6 读取Hive表数据创建DataFrame

6.7 读取学生成绩创建DataFrame

6.8 常见DataFrame API操作1

6.9 常见的DataFrame操作2

6.10 常见的DataFrame操作3

6.11 通过DataFrame API计算学生总分和平均分

6.12 保存DataFrame数据

6.13 保存学生成绩分析结果到Hive

6.14 DataSet基础操作

6.15 统计商品销量


拓展内容

1 大数据分布式消息Zookeeper

2 Flume数据采集

3 Kafka消息系统

4 Flink大数据实时处理

5 商品实时推荐系统


特别内容

金牌助手ChatGPT,让应用开发更高效

案例实战课程安排

时间:7月28日(09:00 - 18:00)

航空客户乘机数据预处理

1 案例背景与挖掘目标

2 数据存储

3 数据探索与数据清洗

4 属性规约

5 属性构造


时间:7月29日(09:00 - 18:00)

广电大数据用户画像

1 项目背景与目标分析

1.1 背景介绍

1.2 目标分析

1.3 系统架构介绍

2 数据存储

2.1 数据介绍

2.2 数据存储

2.3 开发环境搭建

3 数据探索与清洗

3.1.1 数据探索

3.1.2 数据清洗

时间:7月30日(09:00 - 18:00)

4 用户画像标签计算

4.1 用户画像简介

4.2 消费内容

4.3 消费等级

4.4 产品名称

4.5 入网程度&业务名称

4.6 地区&语言偏好

5 SVM预测用户是否挽留

5.1 SVM介绍

5.2 特征构建

5.3 标签构建

5.4 模型构建与评估

时间:7月31日(16:00 - 18:00)

职业技术考试