2022年第一期_全国高校师资培训九大专题方向培训通知

2021-11-30 泰迪智能科技 605
分享到:

主办单位:

泰迪杯数据挖掘挑战赛组委会
承办单位:广东泰迪智能科技股份有限公司
协办单位:人民邮电出版社有限公司
北京泰迪云智信息技术研究院
广州思迈特软件有限公司
深圳点宽网络科技有限公司


互联网、大数据、云计算、人工智能等现代信息技术深刻改变着人类的生产、生活、学习乃至思维方式,深刻展示了世界发展的前景。目前各院校的大数据和人工智能专业教师匮乏、相关落地动手实战应用能力欠缺、授课过程中相关行业实战案例项目缺失等,为加快建设大数据、人工智能相关专业教师队伍,推动各院校建立大数据人才培训体系和评价体系,特推出全国高校大数据与人工智能师资研修班。每年在全国范围内滚动开展,截止目前已在全国巡回举办50余场,参训教师近6000人次。2022年第一期全国高校大数据与人工智能实战研修将开设九大专题方向,本期研修班以线上云课堂形式举办,现将有关安排通知如下:

一、课程特色

1、本研修班课程全程强调动手实操,内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解企业级案例,真正的让学员把所学内容和工作实际有效结合、更好地进行教育教学工作。

2、核心课程部分由讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。视频制作精良,讲师真人出镜,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。

3、课程设有答疑交流讨论群,培训期间助教全程辅助教学,每天提供10小时的实时在线答疑辅导,并进行答疑文档汇总,帮助学员更好地总结学习。

4、本课程配套有基础知识内容,即使零基础学员也能找到适合自己的学习内容和节奏,快速掌握课程知识和技能。

5、所有课程相关源代码、数据、PPT、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持六个月内免费回看,以便复习和参考。

6、全面实践大数据/人工智能项目流程,包括数据采集、数据存储管理、数据探索、数据处理、特征工程、数据建模等课程,提供知识讲解,助力夯实理论基础,掌握核心技术。

7、参加线上课程学习的学员,如后续本人参加线下课程继续深造,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程)。

二、课程安排

专题一  商业大数据可视化智能分析实战学习时间: 2022年01月15日 - 01月22日,共计64学时
证书颁发:高级大数据技术应用费用:1980元(报名费、学习费、资料费、证书费等)

课程模块:数据分析与BI、数据可视化方法论与数据支撑、数据分析基础和可视化展现方法

实战案例:制造业产销数据可视化分析;商品仓储及供应链物流数据分析;某人寿保险数据可视化分析;某能源投资集团财务分析项目。

详见附件一:商业大数据可视化智能分析实战课程大纲

专题二  商业大数据可视化智能分析实战学习时间: 2022年01月15日 - 01月24日,共计80学时
证书颁发:高级大数据分析师费用:1980元(报名费、学习费、资料费、证书费等)

课程模块:Excel数据分析基础与实战、Power BI数据分析与可视化

实战案例:新零售无人智能售货机可视化项目、疫情期间湘鄂省区物流数据分析、学生校园卡消费行为分析、水果卖场销售检测可视化

详见附件二 商务数据分析实战课程大纲

专题三  金融数据分析实战(Python)学习时间: 2022年01月15日 - 01月24日,共计80学时
证书颁发:高级大数据分析师费用:1980元(报名费、学习费、资料费、证书费等)

课程模块:Python编程基础、金融量化基础与数据提取、金融数据处理与可视化分析、量化投资基础、金融统计模型、经典量化策略实现、量化交易策略实现和回测、股票因子分析

实战案例:CTA策略构建、多因子选股策略构建

详见附件三:金融数据分析实战(Python)课程大纲

专题四  数据采集与处理实战(Python)学习时间: 2022年01月15日 - 01月23日,共计72学时
证书颁发:高级Python技术应用工程师费用:1980元(报名费、学习费、资料费、证书费等)

课程模块:Python编程基础Python数据分析与应用、Python数据可视化、Python爬虫实战

实战案例:《流浪地球》豆瓣影评采集与分析、农产品信息采集与可视化分析、某品牌手机的京东评论数据采集分析。

案例实战:全国汽车销量可视化、

详见附件四:  Python网络爬虫与数据处理实战课程大纲

专题五  大数据分析与机器学习实战(Python)学习时间:022年01月14日 - 01月23日,共计80学时
证书颁发:高级机器学习工程师费用:1980元(报名费、学习费、资料费、证书费等)

课程模块:Python编程基础、NumPy数值计算基础、Python数据分析与应用、Python数据可视化、Python机器学习实战

实战案例:运营商流失用户分析与预测、信用评分卡建模分析、百货商场用户画像描绘与价值分析、天猫用户重复购买预测

详见附件五: 大数据分析与机器学习实战(Python)课程大纲

专题六  大数据技术应用实战(Hadoop+Spark)学习时间:2022年01月13日 - 01月25日,共计104学时
证书颁发:高级大数据技术应用费用:2980元(报名费、学习费、资料费、证书费等)

课程模块:Linux操作系统基础、MySQL基础、Java编程基础、Hadoop大数据基础、Hive大数据仓库、HBase非关系型数据库

案例实战:航空客户乘机数据预处理、Scala编程基础、Spark大数据分析基础

项目实战:广电大数据用户画像(Hadoop+Spark+Hive)

拓展课程:Zookeeper分布式服务框架、Flume大数据采集与传输、Kafka大数据流处理、Flink大数据实时处理、商品实时推荐系统(Flume+Kafka+Flink)

详见附件六: 大数据技术应用实战(Hadoop+Spark)课程大纲

专题七  深度学习推荐系统实战学习时间:2022年01月13日 - 01月25日,共计80学时
证书颁发:高级机器学习工程师费用:2480元(报名费、学习费、资料费、证书费等)

课程模块:Python编程基础Python数据分析与应用、Python机器学习实战、智能推荐算法、BP神经网络与TensorFlow2实战、TensorFlow2深度学习原理与实战

实战案例:O2O优惠券使用预测、大数据法律服务智能推荐、广电大数据营销推荐、基于深度学习的推荐系统受众性别预测

详见附件七:深度学习推荐系统实战课程大纲

专题八  人工智能实战(计算机视觉方向)学习时间:2022年01月16日 - 01月24日,共计72学时
证书颁发:高级机器学习工程师费用:2480元(报名费、学习费、资料费、证书费等)

课程模块:Python编程基础Python数据分析与应用、Python机器学习实战、TensorFlow2实战、TensorFlow2深度学习原理与实现

图像处理实战:水产养殖水质智能识别

计算机视觉实战:动态人脸智能识别

实战案例:基于GAN的图像风格转换

详见附件八  人工智能推实战(计算机视觉方向)课程大纲

专题九  人工智能实战(自然语言处理方向)学习时间:2022年01月16日 - 01月25日,共计80学时
证书颁发:高级机器学习工程师费用:2480元(报名费、学习费、资料费、证书费等)

课程模块:Python编程基础Python数据分析与应用、Python机器学习实战、TensorFlow2实战、TensorFlow2深度学习原理及实现、自然语言处理实战

文本处理实战:路透社新闻分类

实战案例:搭建一个属于自己的聊天机器人

综合案例:基于深度学习的推荐系统受众性别预测

详见附件九  人工智能实战(自然语言处理方向)课程大纲

三、师资介绍

郝志峰-1.jpg    郝志峰                  汕头大学校长、教授、博士生导师,泰迪杯数据挖掘挑战赛组委会主任,教育部2018-2022高等学校大学数学课程教学指导委员会副主任委员。入选教育部“新世纪人才支持计划”、广东省“千百十”工程省级人选。郝志峰教授主要从事代数及其应用、数学建模、教育信息化等领域的研究,先后主持NSFC联合基金、教育部霍英东基金、广东省科技攻关重大项目、广东省自然科学基金、国家教育科学“十五”规划项目等省部级以上项目20余项,先后赴美国、英国、德国、日本、泰国和香港等地区访问讲学。曾获教育部自然科学奖二等奖、教育部(原国家教委)霍英东青年教师奖、广东省科技进步奖一等奖等奖项。2009年主持的“大学数学立体化教育资源与集成系统的研究和实践”获国家优秀教学成果奖二等奖。
方海涛-1.jpg    方海涛                  中国科学院数学与系统科学研究院研究员,博士生导师,《控制理论与应用》杂志副主编,泰迪杯数据挖掘挑战赛专家组成员。主要研究兴趣包括:系统估计、优化与控制等。
冯国灿-1.jpg

冯国灿                  博士,中山大学数学学院教授,博士生导师。泰迪杯数据挖掘挑战赛组委会委员,中国工业与应用数学会常务理事,广东省工业与应用数学学会理事长,2000-2002英国格莱莫根大学数字图像实验室和布拉德福大学数字媒体实验室做博士后研究员。主要从事模式识别、计算机视觉研究,参加主持包括国家自然科学基金等科学基金20多项,发表学术论文100余篇,入选2014-2019爱斯唯尔计算机科学中国高被引学者排行榜。

刘政永-1.jpg      刘政永                  吉林大学经济学学士,厦门大学经济学硕士,河北金融学院大数据科学学院副教授,科研处战略管理岗,长期从事数据挖掘分析工作,致力于运用Python、R进行金融数据挖掘,有较丰富的数据挖掘等理论知识与实践经验。现为河北金融学院大数据科学学院副教授,曾担任河北金融学院经济贸易系经济统计学专业任教研室主任三年。近年来致力于金融数据挖掘。近三年来给金融硕士讲授《金融数据挖掘》课程,运用Python进行金融数据挖掘分析;给本科生讲授《Python经济数据分析》、《国内外经济预测分析实训》等课程,运用Python进行经济数据分析、挖掘、预测等;参加天池AI实训平台师资培训、《Python金融大数据分析》培训;带领学生参加“泰迪杯”数据分析与挖掘比赛并获三等奖。从2020年开始担任财经数据科学实战训练营讲师,讲授金融风控方面的实战案例。
樊哲-1.jpg      樊哲                  广东泰迪智能科技股份有限公司特聘讲师,某国际银行大数据开发工程师,Hortonworks授权Apache  Hadoop开发者认证培训讲师,Hadoop Mahout技术实践者和研究者;对Hadoop的MapReduce编程模型有深刻理解,同时对Mahout技术有较深认识,对Mahout源码有深入研究,擅于Mahout中数据挖掘的K均值聚类算法、贝叶斯分类算法、FP树关联规则算法的应用;主编《Mahout算法解析与案例实战》、《Hadoop数据分析与挖掘实战》、《Hadoop与大数据挖掘》等图书专著;具有电信行业和银行业的项目经验和行业知识,主持中国电科院电力大数据平台、电能量数据挖掘与智能分析、客户服务智能分析系统等项目。
张敏-1.jpg张敏                  广东泰迪智能科技股份有限公司、培训总监,从事用户数据分析和数据挖掘工作六年,具有丰富得大数据挖掘理论及实践培训经验,对数据具有较高的敏感度,根据数据对其进行全面得统计分析。精通Python、R语言、Matlab等多种数据挖掘工具。擅长市场发展情况监控、精确营销方面得数据挖掘工作。有为南方电网、珠江数码等大型企业长期提供实施服务得经验,主导了电子商务网站用户行为分析及网页智能推荐服务、中医证型关联规则挖掘、电信业务话单量预测、航空公司客户价值分析等多个项目。2017年"泰迪杯数据挖掘挑战赛教练员培训"主讲讲师,2018年广东省Python与深度学习技术师资培训班主讲讲师、2018年第一/三/五期全国高校大数据核心技术与应用师资研修班主讲讲师、2019年第一/二/三期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北、湖南省、甘肃省电力系统培训班主讲讲师,先后负责过西安理工大学、广东工业大学、广西师范学院、广西科技大学、闽江学院、广东石油化工学院、上海健康医学院等高校实训课程及德生科技等企业内训和数据挖掘就业班的课程。组织、参与编写图书《Python编程基础》、《Python数据分析与应用》、《R语言编程基础》等。
律波-1.jpg律波                  广东泰迪智能科技股份有限公司高级数据分析工程师,应用统计学硕士,有较强的统计学、数学、数据挖掘理论功底;精通R、Python、Power BI、Excel等数据挖掘分析工具,具有丰富的培训和项目经验,擅长从数据中发掘规律,对数据具有较高的敏感度,逻辑思维能力强,擅长数据可视化,机器学习、深度学习等算法原理的实现,如神经网络、SVM、决策树、贝叶斯等;负责"珠江数码大数据营销推荐应用"项目,完成标签库的构建及产品推荐模型;负责"京东电商产品评论情感分析"项目,完成了评论数据情感评价模型、LDA主题模型的构建;通过项目案例的转换;负责多个本科类院校数据分析软件培训和毕业生数据分析培训,先后负责广西科技大学、闽江学院、广东石油化工、韩山师范学院、广西师范大学等数据分析软件培训及实训等。多次负责"泰迪杯"数据挖掘大赛题目的构思和实现、赛前培训。大数据专业系列图书编写委员会成员,负责《R语言与数据挖掘》、《Python实训案例》、《Excel可视化案例》等书籍编写工作。
杨惠-1.jpg杨惠                  广东泰迪智能科技股份有限公司高级数据分析师,从事人工智能工作多年,擅长计算机视觉和自然语言处理,熟悉常用深度学习算法原理及应用,如神经网络、SVM、强化学习等算法;精通TensorFlow、Python、MATLAB等常用数据挖掘处理工具。具有丰富的实践项目经验。如"智能聊天客服"项目,"车牌智能识别"项目,"京东电商产品评论情感分析"项目,"珠江数码大数据营销推荐应用"项目;"电子商务网站智能推荐服务"项目;"基于Seq2Seq注意力模型实现聊天机器人"项目。具备丰富的培训经验,曾为多家企业、院校服务过专业培训工作。如PPV商业培训、泰迪大数据师资培训、珠海城职院数据分析培训;2018年第一/三/五期全国高校大数据核心技术与应用师资研修班主讲讲师,2019年第一/三/五期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北省电力系统培训班主讲讲师。大数据专业系列图书编写委员会成员,负责《Python数据分析与应用》、《R语言编程基础》、《TensorFlow2深度学习实战》、《深度学习与计算机视觉实战》等书籍编写工作。
陈四德-1.jpg陈四德                  广东泰迪智能科技股份有限公司高级数据分析师,统计学专业,对数据统计分析和数据挖掘领域均有较强的理解和理论基础;有造价行业、游戏行业背景和丰富的项目经验,精通行业内的各种指标分析,擅于从多维度分析数据,逻辑性强;擅长Python、R语言、MySQL数据库等工具,能熟练对数据进行数据处理和分析,掌握常用的数据挖掘算法如分类、聚类等,以及深度学习TensorFlow的使用。负责“网站会员流失预测”项目,完成数据处理,模型构建;负责“平台BI埋点数据入库及数据分析”项目,完成数据盘点、数据指标整理和把控;负责“游戏数据分析”项目,完成产出游戏生态日报、客户价值分群结果、用户流失的预警、用户画像指标的完善和维护,项目经验丰富。负责过西安交大城市学院、福建农林大学、国培师资培训、韩山师范学院数据分析就业班、湖南科技职业技术学院、武汉科技大学、广东机电职业技术学院国培、柳州城市职业技术学院第一届大数据职业技能竞赛指导、吉林大学珠海学院等培训项目,授课经验丰富。负责过“泰迪杯”数据挖掘挑战赛出题及赛题指导。
焦正升-1.jpg     焦正升                  广东泰迪智能科技股份有限公司资深项目研发工程师、高级信息系统项目经理、高级软件开发工程师,拥有7年相关从业经验;致力于信息技术的应用与传播,信息系统产业的发展。精通JAVA编程语言,熟悉Spring Boot、Spring Cloud等主流开发框架、MySQL数据库、VUE数据驱动渐进式框架等主流技术。参与《Hadoop与大数据挖掘》、《Hadoop大数据分析与挖掘实战》等图书的编写。拥有电力、电子政务、轻工环保、交通运输等多项领域的项目管理研发经验,项目团队为北京市信访办研发的“大数据助力智慧信访”系统获得第七届金铃奖-公共服务类“智能决策奖”。
郑素铃-1.jpg    郑素铃                  广东泰迪智能科技股份有限公司特聘讲师。从事大数据项目研发工作,对Hadoop大数据技术有较深的研究,熟悉掌握Hadoop环境部署和Hadoop核心计算框架MapReduce的原理和应用。掌握Spark原理及编程,熟练使用Spark的图计算Graphx和算法库MLlib。对非结构化数据框HBase以及结构化数据框Hive有深刻的了解。掌握数据挖掘和机器学习的常用算法,熟悉数据挖掘流程,具备项目开发经验,如“数睿思网站用户画像研究”和“法律服务智能推荐系统”项目,在推荐系统方面比较有研究。先后参与了《Hadoop大数据开发基础》、《Spark大数据技术与应用》等图书编写工作。
温鼎-1.jpg    温鼎                  广东泰迪智能科技股份有限公司大数据研发工程师、大数据讲师。从事大数据研发工作,对Hadoop生态圈相关组件技术有比较深的认识,掌握Hadoop核心框架原理。熟悉掌握Hadoop、Hive、Flume等大数据核心组件的环境搭建和使用。同时对Spark核心API core和SQL&DataFrame的使用有深刻的认识,掌握MLlib算法库的应用。掌握数据挖掘和机器学习十大算法的应用。对数据有较强的敏感度,掌握常用机器学习算法原理。先后参与湖南商务职业技术学院Hadoop模块考题开发,深圳职业技术学院PySpark大数据课程资源开发,广东技术师范大学Hadoop大数据培训。
马明月-1.jpg    马明月                  广州思迈特软件有限公司数据分析师与认证讲师,从事数据分析多年,擅长Smartbi(TIPDMBI)工具使用,三年BI平台培训经验,对数据分析、数据可视化有比较深入的学习研究,独创SOC可视化方法论。组织过“数据分析认证”、“汽车市场分析”、“跨境电商可视化分析”、“BI大屏制作”等多场主题培训,并由多家银行、企业培训经验。参与过多次数据分析大赛组织、支持与评审工作。如:第三届、第四届“泰迪杯”数据分析技能赛出题、赛事培训与赛题评审。
杨瑾瑜-1.jpg    杨瑾瑜                   广州思迈特软件有限公司研究院秘书长,管理科学与工程硕士,研究方向商业智能与大数据,有较强的计算机、数学、数据挖掘理论功底;精通SPSS、Stata、Python、Smartbi等数据挖掘分析工具,具有丰富的数据挖掘项目经验,擅长从数据中发掘规律,对数据具有较高的敏感度,逻辑思维能力强,擅长数据可视化,机器学习,深度学习等算法原理的实现,如神经网络、LSTM、CNN、贝叶斯等;负责“基于大数据和游戏化学习的用户行为数据挖掘”项目,完成用户行为网络更新算法,该算法取得发明专利一项;负责“电商产品推荐”项目,基于TensorFlow搭建深度神经网络,构建用户个性化推荐模型;参与“金融时间序列可视化”项目,负责基于CNN及LSTM提取近十年量价分布特征。
毛朝选-1.jpg    毛朝选                  深圳点宽网络科技有限公司  合伙人&金融科技教研部总监,上海财经大学硕士,曾任上海立信会计金融学院统计与数学学院金融数学系主任,深圳数字动能信息技术有限公司量化研究员。近十年高校一线教学经验与多个高等教材编写经验,具有丰富的学科竞赛指导经验,熟悉高等教育领域的人才培养,学科建设与产学共建工作。多次获得所在高校十大受欢迎的老师荣誉称号。参与多个国家自然科学基金项目、上海市教委重点课程建设项目。2021年以合伙人身份加入点宽,任金融科技课程教研部总经理,负责结合高校本科教育和金融科技行业实践,专注金融科技教育人才培养与课程建设工作。
刘洋-1.jpg    刘洋                  深圳点宽网络科技有限公司 金融科技教研部数据分析师,点宽高级数据分析师(人工智能方向),香港中文大学理学硕士。拥有多年基础数学研究经历,丰富的数据分析经验,熟悉港股美股市场,具备多年的期权、期货等衍生品实践经验,对人工智能领域有着深刻研究,包括图像识别、自然语言处理等。目前主要负责数据清洗和特征工程、人工智能实践课程研发和培训。
严鉴知-1.jpg    严鉴知                  深圳点宽网络科技有限公司  金融科技教研部量化研究员,点宽高级量化研究员跟培训讲师,美国纽约州立大学理工学院计算机理学硕士。拥有丰富的软件和人工智能项目开发经验,包括基于3D点云的图像识别项目、神经网络的优化工程以及国内某大型物流公司的人工智能系统开发,熟悉国内外金融市场,具备丰富的期权量化交易实践经验。目前主要负责量化金融和人工智能实践课程研发和培训。
严韬-1.jpg    严韬                  深圳点宽网络科技有限公司 金融科技教研部量化研究员,FRM持证人,通过CFA3级,香港中文大学风险管理科学本科毕业,美国霍夫斯特拉大学量化金融学硕士。拥有丰富的金融工程、统计学研究经历及数据分析经验。熟悉国内金融市场,具备丰富的期权、期货量化交易实践经验。有多次参与国际股票、期货竞赛的经历,曾在CME期货交易大赛中进入top3%。曾在海外任职IPO项目组金融数据分析工作,且具有商业银行交易部门金融工程实战经验。目前主要负责量化金融课程研发和培训。

四、证书颁发

学员经在线培训并考试合格后,可以获得本期培训对应专题职业技术证书。

五、报名须知与联系方式

1、报名材料:报名申请表、身份证复印件、两寸近期正面免冠彩色半身证件照电子版(要求:白色背景底,14-20K大小的.JPG格式)。

2、本次由广东泰迪智能科技股份有限公司收取费用并开具发票。

3、本期研修班两专题及以上联报者可享受九折优惠。

4、报名联系方式

联系人:曾老师

电话:13246821827

微信:antonia602501

邮箱:zengaizhi@tipdm.com



全国高校大数据与人工智能师资研修班报名申请表

单位名称
部门/院系
通讯地址
发票抬头
发票内容:
纳税号
电子发票
接收邮箱:
联系人
电话:邮箱:
以下表格中要求提供的信息为申报职业技术证书使用,请真实完整填写
姓  名性别职务毕业院校最高学历手机号电子邮箱专题选择
























































费用

支付方式

1、电汇到指定账户
2、扫码支付(报名后联系工作人员索要支付码)
3、付款时请注明”大数据研修班+单位名称或姓名“字样,方便查账备案
账户信息账户名:广东泰迪智能科技股份有限公司
开户行:中国工商银行广州花城支行
账户号:3602               0285 0920 1663 221
备  注请将报名表发送至邮箱:zengaizhi@tipdm.com

联系人:曾老师   电话:13246821827                      微信:antonia602501

附件一 商业大数据可视化智能分析实战课程大纲

核心课程篇
时间课程内容
学习平台
专题讲座

2022年1月15日

18:30 - 22:00

主讲:郝志峰

主题内容:大数据视角下数字孪生与元宇宙的思考

泰迪云课堂
第一课 数据分析与BI

2022年1月15日

18:30 - 22:00

1 数据分析概述

1.1 数据分析是什么?

1.2 业务数据分析流程

1.3 数据分析方法论

1.4 数据分析师的要求

2 商务智能

2.1 BI的发展阶段

2.2 认识Smartbi

3 业务背景下的数据分析

3.1 了解业务数据

3.2 了解分析需求

4 数据分析之数据获取

4.1 数据连接

4.2 关系数据库

4.3 本地数据

泰迪云课堂

操作演练

个人PC
在线答疑微信群
第二课 数据准备与数据探索分析

2022年1月16日

18:30 - 22:00

1 数据分准备

1.1 自助ETL

1.2 业务主题

1.3 自助数据集

2 数据探索分析

2.1 明细数据之即席查询

2.2 即席查询功能介绍

2.3 用即席查询分析数据

2.4 即席查询常用功能

2.5 多维度分析之透视分析

2.6 透视分析功能介绍

2.7 透视分析常用功能

2.8 透视分析高级功能

2.9 增加图形

泰迪云课堂

操作演练

个人PC
在线答疑微信群
第三课 数据可视化展现

2022年1月17日

18:30 - 22:00

1 SOC数据可视化方法论

1.2 S-图表选择

1.3 图形选择决策树

1.4 O-图表优化

1.5 加减乘除美化图形

1.6 C-图表组合

1.7 图形布局

1.8 图形配色

1.9 图形内容

2 可视化大屏制作

2.1 自助仪表盘

2.2 制作流程

2.3 基础图形

2.4 交互效果

泰迪云课堂
操作演练个人PC
在线答疑微信群
第四课 实战案例:制造业产销数据可视化分析

2022年1月18日

18:30 - 22:00

1 项目背景及目标

1.1 了解某集团业务

1.2 集团管理中存在的痛点

2 数据获取、预处理与建模

2.1 数据结构梳理

2.2 清洗数据

2.3 数据建模

3 数据准备

3.1 销售自助业务主题

3.2 毛利自助分析主题

4 数据分析可视化

4.1 多维度销售分析

4.2 多维度利润分析

4.3 综合看板制作

5 产销数据联合分析

泰迪云课堂
操作演练个人PC
在线答疑微信群
第五课 实战案例:商品仓储及供应链物流数据分析

2022年1月19日

18:30 - 22:00

1 案例背景与目标

1.1 案例背景解读

1.2 挖掘目标分析

2 数据预处理

2.1 预处理:读取数据和异常值

2.2 预处理:缺失值

2.3 预处理:重复值与合并数据

3 数据分析

3.1 库存情况分析

3.2 供销情况分析

3.3 综合看板

3.4 图表整理

4 总结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第六课 实战案例:某保险公司数据可视化分析

2022年1月20日

18: 30 - 22:00

1 案例背景与目标

1.1 案例背景解读

1.2 挖掘目标分析

2 数据预处理

2.1 数据结构梳理

2.2 数据建模

3 数据分析

3.1 整体经营分析

3.2 机构经营分析

3.3 保险产品分析

3.4 渠道分析

3.5 运营数据分析

4 小结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第七课 实战案例:某公司财务分析案例

2022年1月21日

18:30 - 22:00

1 案例背景与目标

2 数据预处理

3 数据分析

3.1 预算分析

3.2 融资分析

3.3 资金分析

3.4 财务分析

4 管理驾驶舱

4.1 可视化大屏制作

5 小结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第八课 在线考试

2022年1月22日

19:00 - 21:00

高级大数据技术应用职业技术在线考试泰迪云课堂


附件二 商务数据分析实战课程大纲

核心课程篇
时间课程内容
学习平台
专题讲座

2022年1月15日

18:30 - 22:00

主讲:郝志峰

主题内容:大数据视角下数字孪生与元宇宙的思考

泰迪云课堂
第一课 Excel数据分析基础与实战

2022年1月15日

18:30 - 22:00

1.1 认识数据分析

1.2 认识Excel 2016

2.1 获取文本数据

2.2 从数据库获取数据

3.1 排序

3.2 筛选

3.3 分类汇总

4.1 认识公式和函数

4.2 数组公式

4.3 日期和时间函数

4.4 数学函数

4.5 统计函数

4.6 文本函数

4.7 逻辑函数

5.1 透视表的创建和修改

5.2 透视表的操作

5.3 透视图的操作

泰迪云课堂

操作演练

个人PC
在线答疑微信群

2022年1月16日

18:30 - 22:00

6.1 对比分析

6.2 趋势分析

6.3 饼图

6.4 散点图

6.5 雷达图

7.1 案例背景

7.2 数据预处理

8 商品销售分析

9 库存分析

10 用户分析

11 分析报告

泰迪云课堂
操作演练个人PC
在线答疑微信群
第二课 Power BI数据分析与可视化

2022年1月17日

18:30 - 22:00

1 数据分析与可视化概述

1.1 认识数据分析(Power BI)

1.2 常用数据可视化软件

1.3 认识Power BI

2 数据获取

2.1 获取数据的方式

2.2 数据获取

3 M语言数据建模与处理

3.1 编辑器和M语言

3.2 获取网络分页数据

3.3 清洗数据

3.4 数据转换

3.5 规约数据

泰迪云课堂
操作演练个人PC
在线答疑微信群

2022年1月18日

18:30 - 22:00

4 DAX语言数据预处理

4.1 DAX语言

4.2 DAX语言处理表间关系

4.3 DAX函数使用实例

4.4 数据查询操作

5 数据分析可视化

5.1 可视化

5.2 认识对比分析

5.3 对比分析图表绘制操作

泰迪云课堂
操作演练个人PC
在线答疑微信群

2022年1月19日

18:30 - 22:00

5.4 认识结构分析

5.5 结构分析可视化操作

5.6 相关分析

5.7 相关分析可视化操作

5.8 描述性分析

5.9 描述性分析可视化操作

5.10 KPI图表分析

5.11 KPI分析可视化操作

6 数据分析报表

6.1 认识Power BI报表

6.2 完整的分析报表:会员数据分析

6.3 完整分析报表的操作

7 Power BI移动版数据部署

7.1 移动版发布一份分析报表

7.2 仪表板的使用

泰迪云课堂
操作演练个人PC
在线答疑微信群
第三课 新零售无人智能售货机可视化项目

2022年1月20日

18:30 - 22:00

1 了解某公司自动售货机现状

1.1 分析某公司自动售货机现状

1.2 认识自动售后机案例分析的步骤与流程

2 数据获取、预处理与建模

2.1 清洗数据

2.2 规约数据

2.3 数据建模

3 数据分析及可视化

3.1 销售分析及可视化

3.2 库存分析及可视化

3.3 用户分析及可视化

4 数据部署

4.1 整理销售分析报表

4.2 整理库存分析和用户分析报表

4.3 发布自动售货机案例报表

5 便利店销售业绩分析

泰迪云课堂
操作演练个人PC
在线答疑微信群
第四课 实战案例:疫情期间湘鄂省区物流数据分析

2022年1月21日

18:30 - 22:00

1 背景及分析目标

2 数据加载与预处理

3.1 两省结算方式比较

3.2 两省总利润比较

3.3 两省运输方式比较

3.4 两省利润趋势分析

3.5 两省送货小包装数量趋势分析

3.6 两省货物性质比较

3.7 两省折扣金额趋势分析

3.8 湖北医疗物资数量分析

3.9 图表整理

4 小结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第五课 实战案例:学生校园卡消费行为分析

2022年1月22日

18: 30 - 22:00

1 案例背景与目标

1.1 案例背景解读

1.2 挖掘目标分析

2 数据预处理

2.1 预处理:读取数据和异常值

2.2 预处理:缺失值

2.3 预处理:重复值与合并数据

3 数据分析

3.1 食堂消费数据分析

3.2 学生消费行为分析

4 小结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第六课 实战案例:水果卖场销售检查可视化

2022年1月23日

18:30 - 22:00

1 案例背景和目标

2 数据预处理

3 水果卖场销售数据分析

3.1 水果卖场销售图

4 水果产品销量分析

4.1 水果产品销量柱状图

5 小结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第七课 在线考试

2022年1月24日

19:00 - 21:00

高级大数据分析师职业技术在线考试泰迪云课堂


附件三 金融数据分析实战(Python)课程大纲

基础篇(报名成功后即可开始学习)
时间课程内容
学习平台
正式培训前

Python编程基础

1 Python简介和安装

1.1 Python基础概念介绍

1.2 学会Python环境配置安装

1.3 学会编写Python第一个脚本

2 数据类型

2.1 结构化数据与非结构化数据

2.2 六种数据类型在生活中的运用

2.3 字符串、列表、字典的常用使用方法

3 数据运算符

3.1 常用的七种运算符运用

3.2 运算符优先级

4 循环和条件语句

4.1 循环语句与案例使用

4.2 条件语句案例使用

4.3 break语句

4.4 continue语句

4.5 pass语句

4.6 案例:实现九九乘法表

5 函数创建与案例实现

5.1 函数定义和调用

5.2 函数参数传递

6 NumPy工具包与案例实现

6.1 创建简单NumPy数组

6.2 NumPy数组属性与形状转换

6.3 NumPy数值计算

6.4 NumPy排序分析

6.5 NumPy矩阵操作与线性方程组

6.6 案例:NumPy对股票因子数据统计分析

7 Pandas工具包与案例实现

7.1 Pandas基础数据结构Series

7.2 Pandas基础数据结构DataFrame

7.3 Pandas数据提取和排序

7.4 Pandas表统计与整合

7.5 案例:Pandas对期货行情数据统计分析与整合

泰迪云课堂
核心课程篇
时间课程内容
学习平台
主题讲座

2022年1月15日

18:30 - 22:00

主讲:郝志峰

主题内容:大数据视角下数字孪生与元宇宙的思考

泰迪云课堂
第一课 金融量化基础与数据提取

2022年1月15日

18:30 - 22:00

1 股票量化基础

1.1 股票交易基础知识

1.2 股票行情数据集介绍

1.3 Python提取单个股票、多个股票、单天、多天的行情数据

1.4 股票指数数据合成方法和Python提取数据

1.5 股票财务报表数据集概览

1.6 Python提取财务报表各表的数据,并分析应用

1.7 股票因子数据分类和介绍

1.8 Python提取单个因子、多个因子的数据,并简单分析

2 期货量化基础

2.1 期货交易基础知识

2.2 期货品种分类和介绍

2.3 Python提取各交易所的期货数据

3 案例:分析期货品种流动性和波动性

3.1 Python获取所有期货品种一年的行情数据

3.2 求取所有期货品种的日均振幅,并排序处理

3.3 求取所有期货品种的日均成交额、成交量,并排序处理

3.4 分析所有品种的流动性和波动性,并按照交易所分析

4 基金量化基础

4.1 基金基础知识

4.2 基金交易规则

4.3 利用指标评价基金绩效

泰迪云课堂
操作演练
个人PC
在线答疑微信群
第二课 金融数据处理与可视化分析

2022年1月16日

18:30 - 22:00

1 金融数据读取和存储

1.1 金融数据获取

1.2 Python读取和存储CSV数据集

1.3 Python读取和存储TXT数据集

1.4 Python读取和存储JSON数据集

2 金融数据处理

2.1 金融数据缺失值查看

2.2 Python对金融数据缺失值进行删除处理

2.3 Python对金融数据缺失值进行填充处理

2.4 金融数据计算:每日收益率

2.5 金融数据计算:累计收益率

2.6 Python分析金融数据相关性

2.7 金融数据热图绘制与分析

3 金融时间数据转化和处理

3.1 DataFrame数据介绍

3.2 DataFrame数据时间差

3.3 日期转换为字符串格式strftime

3.4 字符串转换为日期格式strptime

3.5 Pandas下的时间格式timestamp

3.6 Pandas下的时间格式DatatimeIndex

3.7 Pandas中的时间函数date_range()

4 金融数据可视化

4.1 Pandas内置可视化

4.2 seaborn绘图

4.3 K线Python绘图

5 案例:沪深300指数数据时间分析

5.1 Python获取沪深300指数日数据集

5.2 将日数据集转换为月数据集

5.3 对数据集进行可视化分析

泰迪云课堂
操作演练个人PC
在线答疑微信群
第三课 量化投资基础

2022年1月17日

18:30 - 22:00

1 量化理论基础

1.1 量化投资概述

1.2 量化投资与传统投资区别

1.3 量化投资的优势和劣势

2 量化策略基础

2.1 国内量化的发展

2.2 私募和公募基金的策略类型

2.3 CTA趋势策略

2.4 统计套利策略

2.5 市场中性策略

2.6 多因子选股策略

2.7 量化指数增强策略

2.8 机器学习交易策略

2.9 大数据与舆情分析策略

2.10 行业轮动策略

2.11 事件驱动策略

2.12 高频策略

3 策略评价指标构建

3.1 Python实现年化收益率

3.2 绝对收益率与相对收益率

3.3 夏普比率的应用和Python实现

3.4 信息比率的应用和Python实现

3.5 最大回撤的应用和Python实现

4 技术形态指标分析和实践

4.1 技术指标分类

4.2 talib库安装和Python调用

4.3 Python计算MACD指标,并绘图

4.4 BOLL指标的应用和Python实现绘图

4.5 ATR指标原理应用,以及指标Python计算和绘图

4.6 K线形态分类

4.7 十字晨星形态Python实现和图形绘制

4.8 三只乌鸦Python计算和绘图

4.9 上升/下跌三部曲Python实现和绘图

4.10 头肩顶形态量化构建分析

泰迪云课堂
操作演练个人PC
在线答疑微信群
第四课 金融统计模型

2022年1月18日

18:30 - 22:00

1 线性回归模型

1.1 线性回归原理

1.2 单变量线性回归Python操作实现

1.3 多变量线性回归Python操作实现

1.4 案例:利用线性回归分析股票与指数之间的关系

2 时间序列模型

2.1 MA模型和AR模型

2.2 ARMA模型的求解过程

2.3 ARMA模型Python构建和实现

2.4 案例:应用ARMA模型预测工商银行股价

3 协整模型

3.1 协整定义和检验步骤

3.2 平稳性检验

3.3 E-G检验法Python实践

3.4 案例:判断工商银行和建设银行之间股票是否协整

4 Python实现期权定价

4.1 蒙特卡洛算法介绍

4.2 期权定价模型

4.3 案例:使用Python实现蒙特卡洛模拟期权定价

5 Python实现最优投资组合管理

5.1 均值-方差前沿组合

5.2 案例:利用Python进行MVF最优化投资组合管理

6 Python分析实现在险价值VAR

6.1 VAR的定义和应用

6.2 案例:利用Python测试在险价值VAR

泰迪云课堂
操作演练个人PC
在线答疑微信群
第五课 经典量化策略实现

2022年1月19日

18: 30 - 22:00

1 均线交易策略实现

1.1 均线策略交易原理

1.2 案例:均线策略实现和改进

1.3 均线策略表现评估

2 动量交易策略实现

2.1 动量概念

2.2 动量策略原理和盈利原因

2.3 案例:动量策略Python代码实现

3 均值反转策略实现

3.1 均值反转概念

3.2 均值反转策略原理分析

3.3 案例:均值回归策略Python实现

4 配对交易策略实现

4.1 配对交易策略原理和流程

4.2 协整检验

4.3 案例:配对交易策略Python编写实现

泰迪云课堂
操作演练个人PC
在线答疑微信群
第六课 量化交易策略实现和回测

2022年1月20日

18: 30 - 22:00

1 策略回测框架介绍

1.1 Python执行策略流程

1.2 整体策略框架介绍

1.3 策略初始化

1.4 策略数据获取

1.5 策略逻辑运算

1.6 策略回测机制说

1.7 平台API实践说明

1.8 案例:使用策略框架使用双均线策略

1.9 拓展:三均线策略的设计和实现

2 策略构建思路

2.1 标的选择

2.2 策略逻辑

2.3 仓位设计

2.4 进场设计

2.5 离场设计

2.6 止盈止损设计

3 案例:使用框架实现BiasAverage策略构建

3.1 BiasAverage策略思路分析

3.2 策略逻辑分析与代码实现

3.3 策略进出场设计与实现

3.4 策略止盈止损设计与实现

3.5 策略回测与绩效分析

泰迪云课堂
操作演练个人PC
在线答疑微信群
第七课 股票因子分析

2022年1月21日

18:30 - 22:00

1 因子数据处理

1.1 因子值获取

1.2 因子去极值处理

1.3 因子标准化处理

1.4 因子中性化处理

2 单因子有效性检验

2.1 因子回归法检验

2.2 因子IC值分析检验

2.3 因子分层回测法检验

2.4 案例:挑选优质的股票因子

3 多因子分析

3.1 历史收益率加权法合成因子

3.2 历史信息比率加权法合成因子

3.3 主成分分析法合成因子

3.4 因子正交化处理共线性

3.5 因子异方差分析

4 案例:构建简单多义字选股策略

4.1 挑选5个有效因子

4.2 对因子数据进行处理

4.3 因子相关性处理

4.4 因子合成处理

4.5 构建多因子选股策略并进行绩效分析

泰迪云课堂
操作演练个人PC
在线答疑微信群
第八课 实战案例:CTA策略构建

2022年1月22日

19:00 - 21:00

1 Dual Turust策略构建

1.1 Dual Turust策略原理

1.2 交易逻辑构建

1.3 离市设计

1.4 策略增加择时改进

1.5 策略表现评估和分析

2 海龟交易策略构建

2.1 策略原理分析

2.2 选择标的

2.3 确定仓位

2.4 确定交易逻辑

2.5 进出场设计

2.6 止盈止损设计

2.7 策略回撤绩效分析与改进思路

3 统计套利策略构建

3.1 套利策略的原理和流程

3.2 挑选套利组合

3.3 套利组合协整检验

3.4 进场自适应均线计算

3.5 套利策略离场设计

3.6 止盈止损设计

3.7 完整策略搭建和回测分析

泰迪云课堂
操作演练个人PC
在线答疑微信群
第九课 实战案例:多因子选股策略构建

2022年1月23日

19:00 - 21:00


1 案例:资产资本定价模型构建选股策略

1.1 资产资本定价模型分析

1.2 资产定价模型策略选股逻辑设计

1.3 资产定价模型策略进出场设计

1.4 资产定价模型策略实现与分析

2 案例:Fama三因子模型选股策略构建

2.1 Fama三因子模型分析

2.2 Fama三因子的构建方法

2.3 Fama三因子选股策略思路分析

2.4 Fama三因子选股策略实践编写

2.5 Fama三因子选股策略绩效分析

2.6 拓展:Fama五因子模型策略实现

3 案例:实现基于支持向量机模型的多因子选股策略

3.1 机器学习模型选股原理

3.2 支持向量机模型Python实践

3.3 选股策略的特征集和测试集构建

3.4 支持向量机选股逻辑设计

3.5 支持向量机选股策略实践编写

3.6 支持向量机选股策略分析和改进思路

泰迪云课堂
操作演练个人PC
在线答疑微信群
第十课 在线考试

2022年1月24日

19:00 - 21:00

高级大数据分析师职业技术在线考试泰迪云课堂


附件四 数据采集与处理实战(Python)课程大纲

基础篇(报名成功后即可开始学习)
时间课程内容
学习平台
正式培训前

Python编程基础

1 准备工作

2 列表操作

3 程序流程控制语句

4 字符串操作

4.1 字符串及其索引&切片

4.2 字符串的常见方法

4.3 字典的创建及索引

4.5 字典推导式

5 Python文件读取操作

5.1 Python读取文件

5.2 练习3:统计小说中的单词频次

6 函数

6.1 Python函数自定义

6.2 练习4:自定义求序列偶数个数的函数

7 面向对象与模块

7.1 Python方法与函数对比介绍

7.2 Python面向对象示例

7.3 Python模块使用

7.4 第三方库的安装与调用

8 注意事项

8.1 Python工作路径说明

8.2 模块命名及存放路径的注意事项

8.3 结语

泰迪云课堂
正式培训前

NumPy数值计算基础

1 Python数据分析概述

1.1 认识数据分析

1.2 熟悉Python数据分析的工具

1.3 安装Anaconda与启动Jupyter Notebook

1.4 掌握Jupyter Notebook常用功能

2 NumPy数值计算基础

2.1 掌握NumPy数值计算基础

2.1.1 NumPy简介

2.1.2 数组创建及基础属性

2.1.3 初识数组的特点

2.1.4 创建常用数组

2.1.5 数组数据类型

2.1.6 生成随机数

2.1.7 一维数组的索引

2.1.8 逻辑型索引

2.1.9 多维数组的索引

2.1.10 求解距离矩阵

2.1.11 变化数组shape

2.2 掌握NumPy矩阵与通用函数

2.2.1 NumPy矩阵介绍

2.2.2 NumPy通用函数介绍

2.2.3 通用函数的广播机制

2.3 利用NumPy进行统计分析

2.3.1 NumPy读写二进制文件

2.3.2 NumPy读写txt文件

2.3.3 利用NumPy对数据进行简单统计分析

泰迪云课堂
核心课程篇
时间课程内容
学习平台
专题讲座

2022年1月15日

18:30 - 22:00

主讲:郝志峰

讲座主题:大数据视角下数字孪生与元宇宙的思考

泰迪云课堂
第一课 Python数据分析与应用

2022年1月15日

18:30 - 22:00

1 Pandas统计分析基础

1.1 Pandas简介

1.2 读写不同数据源的数据

1.2.1 Pandas读取文本数据

1.2.2 存储数据框

1.2.3 Pandas读取excel文件

1.2.4 将数据框存储为excel文件

1.3 数据框与数据框元素

1.3.1 构建数据框

1.3.2 查看数据框的常用属性

1.3.3 按行列顺序访问数据框中的元素

1.3.4 按行列名称访问数据框中的元素

1.3.5 修改数据框中的元素

1.3.6 删除数据框中的元素

1.3.7 描述分析数据框中的元素

1.4 转换与处理时间序列数据

1.4.1 转换成时间类型数据

1.4.2 时间类型数据的常用操作

1.5 使用分组聚合进行组内计算

1.5.1 groupby分组操作

1.5.2 agg聚合操作

1.6 创建透视表与交叉表

1.6.1 生成透视表

1.6.2 生成交叉表

2 使用Pandas进行数据预处理

2.1 合并数据

2.1.1 表堆叠

2.1.2 主键合并

2.1.3 重叠合并

2.2 清洗数据

2.2.1 检测与处理重复值

2.2.2 检测与处理缺失值

2.2.3 检测与处理异常值

2.3 标准化数据

2.4 转换数据

2.4.1 哑变量处理

2.4.2 离散化连续型数据

泰迪云课堂

操作演练

个人PC
在线答疑微信群
第二课 Python数据可视化

2022年1月16日

18:30 - 22:00

1.1 Matplotlib绘制流程说明

1.2 添加文本和修改绘图风格

1.3 rc参数

1.4 散点图

1.5 折线图

1.6 直方图和条形图

1.7 饼图

1.8 箱线图

1.9 人口特征间分布

1.10 人口各个特征分布

泰迪云课堂

操作演练

个人PC
在线答疑微信群
拓展自学票
自行安排

2.1 seaborn基础介绍

2.2 seaborn简单绘图

2.3 seaborn绘图风格

2.4 调色板1

2.5 调色板2

2.6 关系图

2.7 分类图

2.8 分布图

2.9 回归图

2.10 矩阵图

2.11 网格图

3.1 Pyecharts基础介绍

3.2 Pyecharts绘制日历图

3.3 Pyecharts绘制漏斗图

3.4 Pyecharts绘制仪表盘

3.5 Pyecharts绘制水球图

3.6 Pyecharts绘制关系图

3.7 Pyecharts绘制直角坐标系图表

3.8 Pyecharts绘制饼图

3.9 Pyecharts绘制雷达图

3.10 Pyecharts绘制词云图

3.11 Pyecharts绘制柱状图

3.12 Pyecharts绘制树形图

3.13 Pyecharts绘制地理图表

泰迪云课堂
第三课 Python网络爬虫实战

2022年1月17日

18:30 - 22:00

1 Python爬虫环境与爬虫简介

1.1 认识爬虫

1.1.1 常见网上冲浪过程

1.1.2 爬虫的概念

1.1.3 爬虫合法性

1.2 认识发爬虫

1.3 配置Python爬虫环境

2 网页前端基础

2.1 认识网络信息传输过程

2.1.1 网络传输模型

2.1.2 网络信息传输过程

2.2 认识HTTP

2.2.1 认识HTTP

2.2.2 熟悉Cookie

3 简单静态网页爬取

3.1 认识静态网页

3.2 实现HTTP请求

3.2.1 创建工程

3.2.2 生成HTTP请求

3.2.3 完善HTTP请求

3.3 解析网页

3.3.1 为什么要解析网页

3.3.2 初始Xpath

3.3.3 Xpath相对路径及属性查找

3.3.4 使用BeautifulSoup解析网页

3.3.5 网页解析小结

3.4 存储数据

3.4.1 认识chrome开发者工具

3.4.2 任务演练:爬取并存储泰迪科技官网首页数据

泰迪云课堂
操作演练个人PC
在线答疑微信群

2022年1月18日

18:30 - 22:00

4 认识动态网页

4.1 认识动态网页

4.2 逆向分析爬取动态网页

4.2.1 通过网页源码追踪目标数据文件地址

4.2.2 通过开发者工具追踪目标数据文件地址

4.2.3 爬取数据并进行保存

4.3 使用Selenium库爬取动态网页

4.3.1 搭建Selenium环境

4.3.2 利用Selenium获取网页数据

4.3.3 利用Selenium控制点击操作

5 模拟登录

5.1 使用表单登录方法实现模拟登录

5.1.1 模拟登录的过程

5.1.2 查找提交入口和表单数据

5.1.3 提交表单完成模拟登录

5.1.4 使用表单登录的注意事项

5.2 使用Cookie登录方法实现模拟登录

5.3 使用Selenium模拟登录

泰迪云课堂
操作演练个人PC
在线答疑微信群

2022年1月19日

18:30 - 22:00

6 Scrapy爬虫

6.1 认识Scrapy

6.2 通过Scrapy爬取基本页面信息

6.2.1 创建项目

6.2.2 指定字段及创建spiders

6.2.3 完成spiders编写

6.2.4 运行程序保存数据

6.3 通过Scrapy抓取跳转页面数据

6.3.1 任务介绍及项目创建

6.3.2 获取所有页面的url

6.3.3 获取每个页面的新闻二次页面url

6.3.4 提取各新闻二次页面中的目标数据

6.3.5 运行程序保存数据

7 拓展:终端协议及爬取工具介绍

泰迪云课堂
操作演练个人PC
在线答疑微信群
第四课 数据采集与处理实战:《流浪地球》豆瓣影评采集与分析

2022年1月20日

18:30 - 22:00

1.1 案例背景与挖掘目标

2.1 短评数据爬取介绍

2.2 安装Selenium及配置Chromedriver

2.3 获取用户名

2.4 获取短评正文

2.5 设置Cookies

2.6 获取用户居住地和入会时间信息

2.7 单页数据整理

2.8 自定义获取单页数据的函数

2.9 判定网页是否已被加载

2.10 翻页爬取

2.11 代码整理及小结

3.1 短评正文数据预处理

3.2 词频统计

3.3 绘制整体评论数据的词云图

3.4 好评差评词云图绘制及小结

4.1 评分分数分布统计

4.2 短评数量与日期的关系

4.3 短评数量与时刻的关系

4.4 不同评分数量与时间的关系

5.1 评论最多的前十个城市

5.2 评分数量与城市的关系

5.3 总结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第五课 数据采集与处理实战:农产品信息采集与可视化分析

2022年1月21日

18:30 - 22:00

1.1 背景与分析目标

2.1 网页分析和爬虫思路

2.2 省份链接获取

2.3 获取省份名称

2.4 确定翻页数目

2.5 获取单页表格

2.6 获取所有省份和页面的数据

2.7 分布式爬取

3.1 数据预处理

3.2 数据指标提取

3.3 省级以上部门审定数量分析

3.4 水稻品种类型数量分析

3.5 主要水稻类型被审定的数量分析

3.6 水稻母本分析

3.7 主要审定公司分析

4 总结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第六课 数据采集与处理实战:某品牌手机的京东评论数据采集与分析

2022年1月22日

18:30 - 22:00

1 项目背景与挖掘目标

2.1 通过谷歌开发者工具获取URL

2.2 发送HTTP请求与转换程JSON数据

2.3 提取信息并保存到本地

2.4 循环采集数据:保存数据

2.5 循环采集数据:自定义函数

3.1 数据预处理

3.2 数据预处理实现

4.1 评论数据词云绘制

4.2 好评、差评词云绘制与分析

4.3 不同颜色商品购买比例分析

4.4 不同配置商品购买比例分析

4.5 销售数量和评论数量和日期的关系

4.6 销售数量和评论数量和时间的关系

4.7 购买与评论时间间隔统计分析

4.8 不同渠道的销售比例

泰迪云课堂
操作演练个人PC
在线答疑微信群
第七课 在线考试

2022年1月23日

19:00 - 21:00

高级Python技术应用工程师职业技术在线考试泰迪云课堂


附件五  大数据分析与机器学习实战(Python)课程大纲

基础篇(报名成功后即可开始学习)
时间课程内容学习平台
正式培训前

Python编程基

1 准备工作

2 列表操作

3 程序流程控制语句

4 字符串操作

4.1 字符串及其索引&切片

4.2 字符串的常见方法

4.3 字典的创建及索引

4.4 字典常用操作

4.5 字典推导式

5 Python文件读取操作

5.1 Python读取文件

5.2 练习3:统计小说中的单词频次

6 函数

6.1 Python函数自定义

6.2 练习4:自定义求序列偶数个数的函数

7 面向对象与模块

7.1 Python方法与函数对比介绍

7.2 Python面向对象示例

7.3 Python模块使用

7.4 第三方库的安装与调用

8 注意事项

8.1 Python工作路径说明

8.2 模块命名及存放路径的注意事项

8.3 结语

泰迪云课堂
正式培训前

NumPy数值计算基础

1 Python数据分析概述

1.1 认识数据分析

1.2 熟悉Python数据分析的工具

1.3 安装Anaconda与启动Jupyter Notebook

1.4 掌握Jupyter Notebook常用功能

2 NumPy数值计算基础

2.1 掌握NumPy数组对象

2.1.1 NumPy简介

2.1.2 数组创建及基础属性

2.1.3 初始数组的特点

2.1.4 创建常用数组

2.1.5 数组数据类型

2.1.6 生成随机数

2.1.7 一维数组的索引

2.1.8 逻辑型索引

2.1.9 多维数组的索引

2.1.10 求解距离矩阵

2.1.11 变化数组shape

2.2 掌握NumPy矩阵与通用函数

2.2.1 NumPy矩阵介绍

2.2.2 NumPy通用函数介绍

2.2.3 通用函数的广播机制

2.3 利用NumPy进行统计分析

2.3.1 NumPy读写二进制文件

2.3.2 NumPy读写txt文件

2.3.3 利用NumPy对数据进行简单统计分析

泰迪云课堂
核心课程篇
时间课程内容学习平台
专题讲座

2022年1月14日

18:30 - 22:00

主讲:方海涛

主题内容:随机最优控制与人工智能

主讲:郝志峰

讲座主题:大数据视角下数字孪生与元宇宙的思考


第一课 Python数据分析与应用

2022年1月14日

18:30 - 22:00

1 Pandas统计分析基础

1.1 Pandas简介

1.2 读写不同数据源的数据

1.2.1 Pandas读取文本数据

1.2.2 存储数据框

1.2.3 Pandas读取Excel文件

1.2.4 将数据框存储为Excel文件

1.3 数据框与数据框元素

1.3.1 构建数据框

1.3.2 查看数据框的常用属性

1.3.3 按行列顺序访问数据框中的元素

1.3.4 按行列名称访问数据框中的元素

1.3.5 修改数据框中的元素

1.3.6 删除数据框中的元素

1.3.7 描述分析数据框中的元素

1.4 转换与处理时间类型数据

1.4.1 转换成时间类型数据

1.4.2 时间爱类型数据的常用操作

1.5 使用分组聚合进行组内计算

1.5.1 groupby分组操作

1.5.2 agg聚合操作

1.6 创建透视表与交叉表

1.6.1 生成透视表

1.6.2 生成交叉表

2 使用Pandas进行数据预处理

2.1 合并数据

2.1.1 表堆叠

2.1.2 主键合并

2.1.3 重叠合并

2.2 清洗数据

2.2.1 检测与处理重复值

2.2.2 检测与处理缺失值

2.2.3 检测与处理异常值

2.3 标准化数据

2.4 转换数据

2.4.1 哑变量处理

2.4.2 离散化连续型数据

泰迪云课堂
操作演练个人PC
在线答疑微信群
第二课 Python数据可视化

2022年1月15日

18:30 - 22:00

1.1 Matplotlib绘制流程说明

1.2 添加文本和修改绘图风格

1.3 rc参数

1.4 散点图

1.5 折线图

1.6 直方图和条形图

1.7 饼图

1.8 箱线图

1.9 人口特征间分布

1.10 人口各个特征分布

泰迪云课堂
操作演练个人PC
在线答疑微信群
拓展自学篇
自行安排

2.1 seaborn基础介绍

2.2 seaborn简单绘图

2.3 seaborn绘图风格

2.4 调色板1

2.5 调色板2

2.6 关系图

2.7 分类图

2.8 分布图

2.9 回归图

2.10 矩阵图

2.11 网格图

3.1 Pyecharts基础介绍

3.2 Pyecharts绘制日历图

3.3 Pyecharts绘制漏斗图

3.4 Pyecharts绘制仪表图

3.5 Pyecharts绘制水球图

3.6 Pyecharts绘制关系图

3.7 Pyecharts绘制直角坐标系图表

3.8 Pyecharts绘制饼图

3.9 Pyecharts绘制雷达图

3.10 Pyecharts绘制词云图

3.11 Pyecharts绘制柱状图

3.12 Pyecharts绘制树形图

3.13 Pyecharts绘制地理图表


第三课 Python机器学习实战

2022年1月16日

18:30 - 22:00

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量Python实现

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

泰迪云课堂
操作演练个人PC
在线答疑微信群

2022年1月17日

18:30 - 22:00

4.1 从女生相亲到决策树

4.2 明天适合打球吗?

4.3 决策树拆分属性选择

4.4 决策树算法家族

4.5 泰坦尼克号生还者预测-数据预处理

4.6 泰坦尼克号生还者预测-模型构建与预测

5.1 聚类分析概述

5.2 相似性度量

5.3 K-Means聚类分析算法介绍

5.4 利用K-Means算法对鸢尾花进行聚类

5.5 聚类结果的性能度量

5.6 调用scikit-learn实现聚类分析

泰迪云课堂
操作演练/作业个人PC
在线答疑微信群

2022年1月18日

18:30 - 22:00

6.1 单个神经元介绍

6.2 经典网络结构介绍

6.3 神经网络工作流程演示

6.4 如何修正网络参数-梯度下降法

6.5 网络工作原理推导

6.6 网络搭建准备

6.7 样本从输入层到隐层传输的Python实现

6.8 网络输出的Python实现

6.9 单样本网络训练的Python实现

6.10 全样本网络训练的Python实现

6.11 网络性能评价

6.12 调用scikit-learn实现神经网络算法

泰迪云课堂

操作演练个人PC
在线答疑微信群
拓展自学篇
自行安排

7 支持向量机

7.1 非洲人还是北美人

7.2 为什么有“朴素”二字

7.3 拉普拉斯修正

7.4 用高斯朴素贝叶斯算法解决鸢尾花分类问题

8 集成学习

8.1 集成学习基本概念

8.2 并行集成算法-Bagging&RandomForest

8.3 串行集成算法-Boosting算法流程

8.4 串行集成算法-Boosting代码实现

8.5 Stacking算法流程

8.6 Stacking代码实现

泰迪云课堂
第四课 实战案例:运营商流失用户分析与预测

2022年1月19日

18:30 - 22:00

1.1 背景与目标

1.2 案例思路分析

2.1 数据探索

2.2 数据去重及删除无关属性

2.3 用户分组及标签构建

2.4 提取用户基本信息和在网时长

2.5 处理合约是否有效

2.6 处理合约计划到期时间

2.7 其余变量处理

2.8 特征拼接及缺失值处理

2.9 数据保存

3.1 特征选择介绍

3.2 皮尔逊特征选择

3.3 处理样本类别不均衡问题

4.1 模型性能评估介绍

4.2 模型构建及性能评估

泰迪云课堂
操作演练/作业个人PC
在线答疑微信群
第五课 实战案例:信用评分卡建模分析

2022年1月20日

18:30 - 22:00

1 背景思路

1.1 金融风控背景说明

1.2 案例分析流程说明

1.3 案例思路过程说明

2 基于逻辑回归的贷款违约预测分析

2.1 数据读取分析

2.2 数据预处理

2.2.1 缺失值处理

2.2.2 重复值处理

2.2.3 异常值处理

2.3 数据探索性分析

2.3.1 变量分布特征探索分析

2.3.2 各个变量与是否违约的数据探索分析

2.4 特征选择

2.5 建模分析

2.5.1 划分数据集

2.5.2 建立逻辑回归模型

2.5.3 模型评估分析

3 基于WOE信用评分的逻辑回归模型建立信用评分卡

3.1 特征选择

3.1.1 分箱处理

3.1.2 相关分析

3.1.3 IV筛选

3.2 建模分析

3.2.1 WOE转换

3.2.2 模型建立

3.2.3 模型检验

3.3 信用评分卡构建

4 总结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第六课 实战案例:百货商场用户画像描绘与价值分析

2022年1月21日

18:30 - 22:00

1.1 背景与分析目标

2.1 会员信息表处理

2.2 销售流水表处理

3.1 会员年龄分析

3.2 不同年龄的消费能力

3.3 不同性别的消费情况

3.4 会员和非会员消费情况

3.5 商场会员年消费趋势

3.6 不同月份的消费趋势

3.7 每年每月的消费金额趋势

3.8 不同时刻的消费情况

4.1 用户画像介绍

4.2 会员基本信息标签

4.3 会员消费特征标签

4.4 会员商品偏好标签

4.5 生成用户画像

5.1 会员细分介绍

5.2 K-Means算法实现会员聚类

5.3 结果分析

泰迪云课堂
操作演练个人PC
在线答疑微信群
第七课 实战案例:天猫用户重复购买预测

2022年1月22日

18:30 - 22:00

1.1 背景与挖掘目标

2.1 工程环境准备

2.2 缺失值处理和数据去重

2.3 数据分布探索

3.1 特征工程介绍

3.2 原始特征

3.3.1 用户相关特征:用户在平台的总交互次数

3.3.2 用户相关特征:用户最近一次购买距离第一次的时长

3.4.1 商家相关特征:商家被交互的数量

3.4.2 商家相关特征:商家的复购次数

3.5.1 用户和商家相关特征:用户在商家的交互次数

3.5.2 用户和商家相关特征:不同用户在不同商家购买率

3.6 离散型特征处理

4.1 建模前的数据处理

4.2 模型构建

4.3 模型训练和评估

4.4 模型应用

5 小结

泰迪云课堂
操作演练/作业个人PC
在线答疑微信群
第八课 在线考试

2022年1月23日

19:00 - 21:00

高级机器学习工程师职业技术在线考试泰迪云课堂


附件六  Hadoop+Spark大数据技术应用实战课程大纲

基础篇(报名成功后即可开始学习)
时间课程内容学习平台
正式培训前

Linux操作系统基础

1 Linux简介

1.1 Linux简介与发展历程

1.2 Linux常见版本

2 Linux基本命令

2.1 Linux文件系统树

2.2 创建与删除目录或文件

2.3 查看文件内容

2.4 创建硬连接和符合链接

2.5 帮助命令

2.6 重定向相关命令

2.7 用户及用户组

2.8 权限相关命令

2.9 用户、用户组及权限实践操作进程

3 Linux Vi编辑器

3.1 模式介绍与常见快捷命令

3.2 一般模式快捷键

3.3 编辑模式与指令模式快捷键

泰迪云课堂
正式培训前

MySQL基础

1 数据库概述

1.1 数据库概述

1.2 数据库基本概念介绍

2 MySQL安装与配置

2.1 MySQL安装与配置

2.2 可视化工具使用

3 MySQL基本命令

3.1 创建与删除数据库

3.2 数据结构与数据类型

3.3 主键与外键

3.4 创建、修改、删除表

3.5 插入与删除数据

4 SQL语法操作

4.1 MySQL常用运算符

4.2 MySQL数据更新操作

4.3 MySQL数据查询操作

5 MySQL联表操作与子查询

5.1 联表查询

5.2 子查询

5.3 复制表

6 MySQL函数

6.1 函数类型介绍

6.2 SQL函数应用

7 约束与索引

7.1 约束介绍与设置

7.2 索引介绍与设置

泰迪云课堂
正式培训前

Java编程基础

1 基础知识

1.1 Java简介

1.2 Java安装配置

1.3 Java基础语法

1.4.1 Java基本数据类型&引用数据类型

1.4.2 Java变量

1.5 Java String类

1.6.1 Java运算符-赋值运算符&算术运算符

1.6.2 Java运算符-关系、逻辑、其他运算符

1.7 循环、条件、循环中断

1.8 Java数组

1.9 Java函数

1.10.1 Java集合简介

1.10.2 Java集合之List

1.10.3 Java集合之Set

1.10.4 Java集合之Map

1.11 Java泛型

2 面向对象

2.1 Java类、对象

2.2.1 Java类封装

2.2.2 Java构造函数

2.2.3 Java类继承

2.2.4 Java类多态

2.3.1 Java抽象类

2.3.2 Java接口

3 线程及异常处理

3.1 Java多线程

3.2 Java包、异常

泰迪云课堂
核心课程篇
时间课程内容学习平台

2022年1月13日

18:30 - 22:00

主讲:方海涛

主题内容:随机最优控制与人工智能

主讲:郝志峰

讲座主题:大数据视角下数字孪生与元宇宙的思考

泰迪云课堂
第一课 Hadoop大数据基础

2022年1月13日

18:30 - 22:00

1 Hadoop介绍

1.1 认识大数据

1.2 Hadoop核心组件

1.3 Hadoop特性与生态环境

1.4 Hadoop应用场景

2 Hadoop集群安装与部署

2.1 安装虚拟机

2.2 安装Java

2.3 Hadoop集群部署模式

2.4 配置固定IP

2.5 配置ssh无密码登录

2.6 Hadoop集群安装与部署

2.7 Hadoop配置参数介绍

2.8 Hadoop集群启动与监控界面介绍

泰迪云课堂
操作演练/作业泰迪大数据编程实训平台
在线答疑
微信群

2022年1月14日

18:30 - 22:00

3 Hadoop基础操作

3.1 Hadoop安全模式

3.2 Hadoop集群基本信息

3.3 HDFS常用Shell操作

3.4 MapReduce常用Shell操作

3.5 MapReduce任务管理

3.6 YARN资源管理及调度策略

4 MapReduce开发入门

4.1 MapReduce框架与设计构思

4.2 MapReduce开发环境搭建

4.3 MapReduce单词计数源码解析

4.4 MapReduce API介绍

4.5 MapReduce Java开发实战:按日期统计访问次数

4.6 MapReduce Java开发实战:用户访问次数排序

5 MapReduce编程进阶

5.1 MapReduce输出文件格式介绍及序列化文件生成

5.2 MapReduce输入文件格式介绍及读取序列化文件

5.3 MapReduce程序优化:Combiner&Partitioner应用

5.4 提交MapReduce程序

泰迪云课堂
操作演练/作业泰迪大数据编程实训平台
在线答疑
微信群
第二课 Hive大数据仓库

2022年1月13日

18:30 - 22:00


泰迪云课堂

操作演练/作业泰迪大数据编程实训平台

在线答疑
微信群



2022年1月15日

18:30 - 22:00

1 Hive概述

1.1 Hive的产生背景

1.2 Hive体系架构

1.3 数据类型

1.4 与传统数据库的区别

1.5 Hive的应用

2 Hive安装配置

2.1 安装MySQL

2.2 安装Hive

3 Hive表定义

3.1 Hive创建内表和外表

3.2 Hive创建静态分区表

3.3 Hive创建动态分区表

3.4 创建带有数据的表

4 Hive导入导出数据

4.1 Hive导入本地或者HDFS上的数据

4.2 Hive单表查询和多表查询导入数据

4.3 Hive导出数据

泰迪云课堂
操作演练/作业泰迪大数据编程实训平台
在线答疑
微信群

2022年1月16日

18:30 - 22:00

5 Hive查询

5.1 Hive查询语法及distinct操作

5.2 Hive order by和内置函数查询

5.3 Hive group by查询

5.4 Hive join查询

5.5 Hive子查询和case when查询

6 函数

6.1 Hive内置函数

6.2 Hive自定义函数

7 综合实战:航空客户乘机数据预处理

泰迪云课堂
操作演练/作业泰迪大数据编程实训平台
在线答疑
微信群
第三课 HBase非关系型数据库

2022年1月17日

18:30 - 22:00

1 HBase简介

1.1 认识HBase

1.2 HBase适用场景

2 HBase安装配置

2.1 HBase集群拓扑简介

2.2 Zookeeper集群安装配置

2.3 HBase安装配置

2.4 HBase监控界面讲解

3 HBase架构原理

3.1 HBase数据模型

3.2 HBase架构

3.3 HBase读写流程

4 HBase Shell基本操作

4.1 命令空间操作

4.2 创建表

4.3 修改和删除表

4.4 插入数据到表中

4.5 查看表数据

4.6 删除表数据

泰迪云课堂
操作演练/作业泰迪大数据编程实训平台
在线答疑
微信群

2022年1月18日

18:30 - 22:00

5 HBase表的模式设计

5.1 HBase表设计

6 HBase Java API应用

6.1 搭建HBase开发环境

6.2 建立与HBase数据库连接实例

6.3 创建或删除表应用实例

6.4 设置Region分割点应用实例

6.5 修改表结构应用实例

6.6 写入数据应用实例

6.7 查看一行数据应用实例

6.8 扫描表数据应用实例

6.9 删除数据应用实例

6.10 创建职工信息表emp

6.11 写入数据到职工信息表

6.12 查找指定范围职工信息

泰迪云课堂
操作演练/作业泰迪大数据编程实训平台
在线答疑
微信群
第四课 Scala编程基础

2022年1月19日

18:30 - 22:00

1 Scala简介与安装

1.1 Scala简介与特性

1.2 Scala安装

2 Scala基础语言

2.1 Scala数据类型

2.2 Scala变量

2.3 Scala运算符

2.4 条件控制与循环

2.5 函数

3 Scala集合

3.1 Scala集合-Array

3.2 Scala集合-List

3.3 Scala集合-Set

3.4 Scala集合-Map

3.5 Scala集合-Tuple

3.6 内置函数组合器

泰迪云课堂
操作演练/作业泰迪大数据编程实训平台
在线答疑
微信群

2022年1月20日

18:30 - 22:00

4 Scala异常

5 Scala类

5.1 类定义

5.2 构造函数

5.3 成员变量和方法

5.4 单例对象、伴生类和伴生对象

5.5 文件读写

6 Scala应用实例

泰迪云课堂
操作演练/作业泰迪大数据编程实训平台
在线答疑
微信群
第七课 Spark大数据分析基础

2022年1月21日

18:30 - 22:00

1 Spark概述

1.1 认识Spark

1.2 搭建Spark环境

1.3 了解Spark运行架构与原理

1.4 Spark生态系统

2 Spark编程

3.1 创建RDD

3.2 RDD Transform算子应用

3.3 RDD Action算子应用

泰迪云课堂
操作演练/作业泰迪大数据编程实训平台
在线答疑
微信群

2022年1月22日

18:30 - 22:00

4 Spark编程进阶

4.1 搭建开发环境

4.2 编程实现学生信息分析

4.3 程序编译

4.4 任务提交与运行模式

4.5 查看任务监控

4.6 RDD持久化

4.7 RDD依赖与容错

5 Spark SQL:结构化数据文件处理

5.1 认识Spark SQL

5.2 认识DataFrame、DataSet

5.3 掌握DataFrame基础操作

5.4 探索分析法律服务网站数据

泰迪云课堂
操作演练/作业泰迪大数据编程实训平台
在线答疑
微信群

2022年1月23日

18:30 - 22:00

6 Spark与机器学习库

6.1 机器学习简介

6.2 MLlib各模块简介

6.3 探索分析模块

6.4 算法模块

6.5 模型评估与优化模块

6.6 PipeLine介绍

6.7 PipeLine整合预处理、建模、调优、评估过程

泰迪云课堂
操作演练/作业泰迪大数据编程实训平台
在线答疑
微信群
第八课 项目实战:广电大数据用户画像(Hadoop+Spark+Hive)

2022年1月24日

18:30 - 22:00

1 项目需求

1.1 项目背景

1.2 项目目标

2 技术方案

2.1 技术选型

2.2 系统架构

3 数据存储与传输

3.1 创建Hive表

3.2 CSV数据导入到Hive

4 需求探索

4.1 数据说明

4.2 基础探索

4.3 业务需求探索

4.4 需求探索总结

5 基础数据预处理

6 SVM预测用户是否挽留

6.1 SVM算法简介

6.2 构建特征列和标签列数据

6.3 建立SVM模型

6.4 模型评估与预测

7 用户画像

7.1 用户画像概述

7.2 标签计算

7.3 标签展示

泰迪云课堂
操作演练/作业泰迪大数据编程实训平台
在线答疑
微信群
拓展自学篇
自行安排

1 Zookeeper分布式服务框架

2 Flume大数据采集与传输

3 Kafka大数据流处理

4 Flink大数据实时处理

5 商品实时推荐系统(Flume+Kafka+Flink)

泰迪云课堂
第九课 在线考试

2022年1月25日

19:00 - 21:00

高级大数据技术应用职业技术在线考试泰迪云课堂


附件七 深度学习推荐系统实战课程大纲

基础篇(报名成功后即可开始学习)
时间课程内容学习平台
正式培训前

Python编程基础

1 准备工作

2 列表操作

3 程序流程控制语句

4 字符串操作

4.1 字符串及其索引&切片

4.2 字符串的常见方法

4.3 字典的创建及索引

4.4 字典常用操作

4.5 字典推导式

5 Python文件读取操作

5.1 Python读取文件

5.2 练习3:统计小说中的单词频次

6 函数

6.1 Python函数自定义

6.2 练习4:自定义求序列偶数个数的函数

7 面向对象与模块

7.1 Python方法与函数对比介绍

7.2 Python面向对象示例

7.3 Python模块使用

7.4 第三方库的安装与调用

8 注意事项

8.1 Python工作路径说明

8.2 模块命名及存放路径的注意事项

8.3 结语

泰迪云课堂
正式培训前

Python数据分析与应用

1 Python数据分析概述

1.1 认识数据分析

1.2 熟悉Python数据分析的工具

1.3 安装anaconda与启动Jupyter Notebook

1.4 掌握Jupyter Notebook常用功能

2 NumPy数值计算基础

2.1 掌握NumPy数组对象

2.1.1 NumPy简介

2.1.2 数组创建及基础属性

2.1.3 初识数组的特点

2.1.4 创建常用数组

2.1.5 数组数据类型

2.1.6 生成随机数

2.1.7 一维数组的索引

2.1.8 逻辑型索引

2.1.9 多维数组的索引

2.1.10 求解距离矩阵

2.1.11 变化数组shape

2.2 掌握NumPy矩阵与通用函数

2.2.1 NumPy矩阵介绍

2.2.2 NumPy通用函数介绍

2.2.3 通用函数的广播机制

2.3 利用NumPy进行统计分析

2.3.1 NumPy读写二进制文件

2.3.2 NumPy读写txt文件

2.3.3 利用NumPy对数据进行简单统计分析

3 Matplotlib数据可视化基础

3.1 掌握绘图基础语法与常用参数

3.1.1 Matplotlib介绍

3.1.2 基础图形绘制

3.1.3 常用参数设置

3.2 分析特征间关系

3.2.1 绘制散点图

3.2.2 散点图参数设置

3.2.3 绘制折线图

3.3 分析特征内部数据分布与分散情况

3.3.1 绘制直方图

3.3.2 绘制饼图

3.3.3 绘制箱线图

4 Pandas统计分析基础

4.1 Pandas简介

4.2 读写不同数据源得数据

4.2.1 Pandas读取文本数据

4.2.2 存储数据框

4.2.3 Pandas读取excel文件

4.2.4 将数据框存储为excel文件

4.3 数据框与数据框元素

4.3.1 构建数据框

4.3.2 查看数据框得常用属性

4.3.3 按行列顺序访问数据框中的元素

4.3.4 按行列名称访问数据框中的元素

4.3.5 修改数据框中的元素

4.3.6 删除数据框中的元素

4.3.7 描述分析数据框中的元素

4.4 转换与处理时间序列数据

4.4.1 转换成时间类型数据

4.4.2 时间类型数据的常用操作

4.5 使用分组聚合进行组内计算

4.5.1 groupby分组操作

4.5.2 agg聚合操作

4.6 创建透视表与交叉表

4.6.1 生成透视表

4.6.2 生成交叉表

5 使用Pandas进行数据预处理

5.1 合并数据

5.1.1 表堆叠

5.1.2 主键合并

5.1.3 重叠合并

5.2 清洗数据

5.2.1 检测与处理重复值

5.2.2 检测与处理缺失值

5.2.3 检测与处理异常值

5.3 标准化数据

5.4 转换数据

5.4.1 哑变量处理

5.4.2 离散化连续型数据

泰迪云课堂
核心课程篇
时间课程内容学习平台
专题讲座

2022年1月16日

18:30 - 22:00

主讲:方海涛

主题内容:随机最优控制与人工智能

主讲:郝志峰

讲座主题:大数据视角下数字孪生与元宇宙的思考

泰迪云课堂
第一课 Python机器学习算法原理与实现

2022年1月16日

18:00 - 22:00

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量Python实现

3 回归分析

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

4.1 从女生相亲到决策树

4.2 明天适合打球吗?

4.3 决策树拆分属性选择

4.4 决策树算法家族

4.5 泰坦尼克号生还者预测-数据预处理

4.6 泰坦尼克号生还者预测-模型构建与预测

泰迪云课堂
操作演练个人PC
在线答疑微信群
拓展自学篇
自行安排

5.1 聚类分析概述

5.2 相似性度量

5.3 K-Means聚类分析算法介绍

5.4 利用K-Means算法对鸢尾花进行聚类

5.5 聚类结构的性能度量

5.6 调用sklearn实现聚类分析

6 支持向量机

6.1 非洲人还是北美人

6.2 为什么有"朴素"二字

6.3 拉普拉斯修正

6.4 用高斯朴素贝叶斯算法解决鸢尾花分类问题

7 集成学习

7.1 集成学习基本概念

7.2 并行集成算法-Bagging&RandomForest

7.3 串行集成算法-Boosting算法流程

7.4 串行集成算法-Boosting代码实现

7.5 Stacking算法流程

7.6 Stacking代码实现

泰迪云课堂
第二课 智能推荐算法

2022年1月17日

18:00 - 22:00

1 智能推荐系统简介

1.1 智能推荐简介

1.2 基于内容的推荐

1.3 协同过滤推荐

1.4 基于深度学习的推荐&复合推荐

1.5 智能推荐系统性能度量

2 关联规则

2.1 关联规则简介

2.2 事务和项集

2.3 支持度与置信度

2.4 Apriori算法流程

2.5 Apriori算法实现

3 协同过滤

3.1 协同过滤推荐算法流程

3.2 新闻推荐数据介绍

3.3 数据准备

3.4 模型构建

3.5 构建测试集用户网址浏览字典

3.6 执行推荐操作

3.7 推荐结构评估

4 FM&Ranking模型

泰迪云课堂
操作演练个人PC
在线答疑微信群
第三课 BP神经网络与TensorFlow2实战

2022年1月18日

18:00 - 22:00

1 BP神经网络

1.1 单个神经元介绍

1.2 经典网络结构介绍

1.3 神经网络工作流程演示

1.4 如何修正网络参数、梯度下降

1.5 网络工作原理推导

1.6 网络搭建准备

1.7 样本从输入层到隐层传输的Python实现

1.8 网络输出的Python实现

1.9 单样本网络训练的Python实现

1.10 全样本网络训练的Python实现

1.11 网络性能评价

1.12 调用scikit-learn实现神经网络算法

泰迪云课堂
操作演练个人PC
在线答疑微信群

2022年1月19日

18:00 - 22:00

2 任务1:构建一个线性模型

2.1 TensorFlow2介绍

2.2 TensorFlow2常用数据类型和操作

2.3 初始化模型

2.4 构建损失函数

2.5 模型训练及可视化

2.6 使用高阶API-Keras

3 任务2:MNIST手写数字识别

3.1 数据读取及探索

3.2 交叉熵

3.3 模型构建及训练

3.4 调用保存好的模型对新样本进行预测

泰迪云课堂
操作演练个人PC
在线答疑微信群
第四课 TensorFlow2深度学习原理与实战

2022年1月20日

18:00 - 22:00

1.1 深度神经网络-引言

2 卷积神经网络CNN

2.1 浅层神经网络的局限

2.2 卷积操作

2.3 卷积操作的优势

2.4 池化及全连接

2.5 高维输入及多filter卷积

2.6 实现卷积操作

2.7 实现池化操作

3 循环神经网络RNN

3.1 循环神经网络简介

3.2 循环神经网络的常见结构

泰迪云课堂
操作演练个人PC
在线答疑微信群
第五课 实战案例:O2O优惠券使用预测

2022年1月21日

18:00 - 22:00

1 背景与目标

2.1 线下训练集数据介绍

2.2 线上训练集数据介绍

2.3 测试数据介绍

2.4 项目流程介绍

3.1 构建正样本

3.2 构建负样本

3.3 构建样本标签

4.1 特征构建介绍

4.2 处理Discount_rate列

4.3 特征1-折扣率

4.4 特征2-商户与用户之间的距离

5.1 建模前数据准备

5.2 初级模型构建

5.3 ROC曲线与AUC值

5.4 模型性能评估

5.5 训练函数封装

5.6 模型预测

5.7 预测函数封装

6.1 特征3-优惠券流行度

6.2 特征4-用户在商家中的消费次数

6.3 如何进行特征拼接

6.4 拼接训练集的特征

6.5 拼接测试集的特征

7.1 模型训练

7.2 预测

7.3 代码整理

7.4 结构提交

泰迪云课堂
操作演练个人PC
在线答疑微信群
第六课 实战案例:大数据法律服务智能推荐

2022年1月22日

18:00 - 22:00

1 智能推荐介绍

2 背景与挖掘目标

3.1 读取用户访问数据

3.2 统计不同类型的网页访问次数

3.3 探索101和1999类型网页的访问次数

3.4 统计用户点击次数

3.5 网页点击分析

3.6 翻页网址探索

4.1 脏数据探索

4.2 脏数据处理规则汇总

4.3 脏数据处理操作实现

4.4 翻页网址处理

5.1 协同过滤推荐算法介绍

5.2 提取婚姻类型数据

5.3 模型构建准备工作介绍

5.4 将用户划分为训练用户和测试用户

5.5 将数据集划分为训练集和测试集

5.6 构架用户物品矩阵

5.7 自定义函数求杰卡德相似系数

5.8 模型构建-求物品相似度矩阵

6.1 模型推荐及性能评价方法介绍

6.2 构建测试用户网址浏览字典

6.3 模型推荐

6.4 模型性能评价

泰迪云课堂
操作演练个人PC
在线答疑微信群
第七课 实战案例:基于深度学习的推荐系统受众性别预测

2022年1月23日

18:00 - 22:00

1 项目文件结构及编辑环境介绍

2 数据获取与探索分析答案讲解

3.1 理解用户单击流相关概念

3.2 获取用户的各单击流数据

4 对各单击流数据进行探索

5.1 对用户单击流数据进行预处理

5.2 进行词向量训练

5.3 对用户的单击流进行编码及padding操作

5.4 将词向量矩阵做相应排序并储存

5.5 将单击流数据转化为二维样本数据并存储

6.1 建模前数据整理

6.2 模型训练及性能评估

7.1 模型优化-并行网络结构介绍

7.2 模型优化

泰迪云课堂
操作演练个人PC
在线答疑微信群
第八课 实战案例:广电大数据营销推荐

2022年1月24日

18:00 - 22:00

1.1 背景与目标

1.2 目标分析与解读

2 数据介绍

2.1 收视数据探索

2.2 异常数据探索

3.1 收视数据处理介绍

3.2 去重特殊线路和政企用户记录

3.3 去重直播记录中不关机顶盒的数据记录

3.4 去重累计超过3小时或小于4秒的直播记录

3.5 保存预处理后的数据

4.1 用户观看电视时长可视化

4.2 热门频道的可视化

5.1 构建标签库介绍

5.2 客户标签的计算方式

5.3 产品标签体系

5.4 客户标签体系介绍

5.5 客户标签计算

6 用户画像构建

7 写哦给你过滤推荐

8 案例小结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第九课 在线考试

2022年1月25日

19:00 - 21:00

高级机器学习工程师职业技术在线考试泰迪云课堂


附件八  人工智能实战(计算机视觉方向)课程大纲

基础篇(报名成功后即可开始学习)
时间课程内容学习平台
正式培训前

Python编程基础

1 准备工作

2 列表操作

3 程序流程控制语句

4 字符串操作

4.1 字符串及其索引&切片

4.2 字符串的常见方法

4.3 字典的创建及索引

4.4 字典常用操作

4.5 字典推导式

5 Python文件读取操作

5.1 Python读取文件

5.2 练习3:统计小说中的单词频次

6 函数

6.1 Python函数自定义

6.2 练习4:自定义求序列偶数个数的函数

7 面向对象与模块

7.1 Python方法与函数对比介绍

7.2 Python面向对象示例

7.3 Python模块使用

7.4 第三方库的安装与调用

8 注意事项

8.1 Python工作路径说明

8.2 模块命名及存放路径的注意事项

8.3 结语

泰迪云课堂
正式培训前

Python数据分析与应用

1 Python数据分析概述

1.1 认识数据分析

1.2 熟悉Python数据分析的工具

1.3 安装anaconda与启动Jupyter Notebook

1.4 掌握Jupyter Notebook常用功能

2 NumPy数值计算基础

2.1 掌握NumPy数组对象

2.1.1 NumPy简介

2.1.2 数组创建及基础属性

2.1.3 初识数组的特点

2.1.4 创建常用数组

2.1.5 数组数据类型

2.1.6 生成随机数

2.1.7 一维数组的索引

2.1.8 逻辑型索引

2.1.9 多维数组的索引

2.1.10 求解距离矩阵

2.1.11 变化数组shape

2.2 掌握NumPy矩阵与通用函数

2.2.1 NumPy矩阵介绍

2.2.2 NumPy通用函数介绍

2.2.3 通用函数的广播机制

2.3 利用NumPy进行统计分析

2.3.1 NumPy读写二进制文件

2.3.2 NumPy读写txt文件

2.3.3 利用NumPy对数据进行简单统计分析

3 Matplotlib数据可视化基础

3.1 掌握绘图基础语法与常用参数

3.1.1 Matplotlib介绍

3.1.2 基础图形绘制

3.1.3 常用参数设置

3.2 分析特征间关系

3.2.1 绘制散点图

3.2.2 散点图参数设置

3.2.3 绘制折线图

3.3 分析特征内部数据分布与分散情况

3.3.1 绘制直方图

3.3.2 绘制饼图

3.3.3 绘制箱线图

4 Pandas统计分析基础

4.1 Pandas简介

4.2 读写不同数据源得数据

4.2.1 Pandas读取文本数据

4.2.2 存储数据框

4.2.3 Pandas读取excel文件

4.2.4 将数据框存储为excel文件

4.3 数据框与数据框元素

4.3.1 构建数据框

4.3.2 查看数据框得常用属性

4.3.3 按行列顺序访问数据框中的元素

4.3.4 按行列名称访问数据框中的元素

4.3.5 修改数据框中的元素

4.3.6 删除数据框中的元素

4.3.7 描述分析数据框中的元素

4.4 转换与处理时间序列数据

4.4.1 转换成时间类型数据

4.4.2 时间类型数据的常用操作

4.5 使用分组聚合进行组内计算

4.5.1 groupby分组操作

4.5.2 agg聚合操作

4.6 创建透视表与交叉表

4.6.1 生成透视表

4.6.2 生成交叉表

5 使用Pandas进行数据预处理

5.1 合并数据

5.1.1 表堆叠

5.1.2 主键合并

5.1.3 重叠合并

5.2 清洗数据

5.2.1 检测与处理重复值

5.2.2 检测与处理缺失值

5.2.3 检测与处理异常值

5.3 标准化数据

5.4 转换数据

5.4.1 哑变量处理

5.4.2 离散化连续型数据

泰迪云课堂
核心课程篇
时间课程内容学习平台

2022年1月16日

18:30 - 22:00

主讲:冯国灿

主题内容:计算机视觉技术及其应用

主讲:郝志峰

讲座主题:大数据视角下数字孪生与元宇宙的思考

泰迪云课堂
第一课 Python机器学习算法原理与实现

2022年1月16日

18:30 - 22:00

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量Python实现

3 回归分析

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

4.1 单个神经元介绍

4.2 经典网络结构介绍

4.3 神经网络工作流程演示

4.4 如何修正网络参数-梯度下降法

4.5 网络工作原理推导

4.6 网络搭建准备

4.7 样本从输入层到隐层传输的Python实现

4.8 网络输出的Python实现

4.9 单样本网络训练的Python实现

4.10 全样本网络训练的Python实现

4.11 网络性能评价

4.12 调用sklearn实现神经网络算法

泰迪云课堂
操作演练个人PC
在线答疑微信群
第二课 TensorFlow2实战

2022年1月17日

18:30 - 22:00

1 任务1:构建一个线性模型

1.1 TensorFlow介绍

1.2 TensorFlow2常用数据类型和操作

1.3 初始化模型

1.4 构建损失函数

1.5 模型训练及可视化

1.6 使用高阶API-Keras

2 任务2:MNIST手写数字识别

2.1 数据读取及探索

2.2 交叉熵

2.3 模型构建及训练

2.4 调用保存好的模型对新样本进行预测

泰迪云课堂
操作演练个人PC
在线答疑微信群
第三课 TensorFlow2 深度学习原理及实现

2022年1月18日

18:30 - 22:00

1.1 深度神经网络-引言

2 卷积神经网络CNN

2.1 浅层神经网络的局限

2.2 卷积操作

2.3 卷积操作的优势

2.4 池化及全连接

2.5 高维输入及多filter卷积

2.6 实现卷积操作

2.7 实现池化操作

2.8 作业:使用CNN实现

泰迪云课堂
操作演练个人PC
在线答疑微信群
拓展自学篇
自行安排

3 循环神经网络RNN

3.1 循环神经网络简介

3.2 循环神经网络的常见结构

4 长短时记忆网络LSTM

4.1 LSTM的三个门

4.2 LSTM三个门的计算示例

4.3 利用RNN&LSTM实现MNIST手写数字识别

5.1 生成对抗神经网络简介

5.2 生成对抗神经网络训练流程

5.3 生成手写数字照片-数据准备&定义生成器网络

5.4 生成手写数字照片-判别器网络结构

5.5 生成手写数字照片-网络传输及网络损失值

5.6 生成手写数字照片-模型训练及效果展示

泰迪云课堂
第四课 计算机视觉实战

2022年1月19日

18:30 - 22:00

1 概述

1.1 计算机视觉与深度学习

1.1.1 计算机视觉

1.1.2 深度学习

1.2 应用领

1.3 相关Python库

1.3.1 深度学习框架

1.3.2 图像处理

2 图像处理基本操作

2.1 读写图像

2.1.1 常用图像类型

2.1.2 读入图像

2.1.3 显示图像

2.1.4 写出图像

2.2 图像几何变换

2.2.1 图像平移

2.2.2 图像缩放

2.2.3 图像旋转

2.3 图像增强

2.3.1 灰度级修正

2.3.2 图像平滑

2.3.3 图像锐化

泰迪云课堂
操作演练个人PC
在线答疑微信群

2022年1月20日

18:30 - 22:00

3 图像文件数据批量读取

3.1 opencv读取

3.1.1 读取文件下所有图像路径

3.1.2 统计各个类别的图像数量

3.1.3 批量获取各个图片数组和标签

3.2 图像文件夹读取

3.2.1 image_dataset_from_directory读取文件

3.2.2 批次数据查看

3.3 图像增强

3.3.1 模型中的数据增强处理

3.3.2 ImageDataGenerator数据读取时增强

泰迪云课堂
操作演练个人PC
在线答疑微信群
第五课 图像处理实战:水产养殖水质智能识别

2022年1月21日

18:30 - 22:00

1.1 案例背景与目标

1.2 读取一张图片数据

1.3 获取图片数据的像素值矩阵

1.4 截取图像的有效区域

1.5 水质图像特征-颜色矩

1.6 三个颜色矩的Python实现

1.7 如何进行批量化数据转换

1.8 自定义函数获取指定路径中的所有图片名称

1.9 处理所有图片数据

1.10 数据处理代码整理

1.11 模型构建与性能评估

泰迪云课堂
操作演练个人PC
在线答疑微信群
第六课 计算机视觉实战:动态人脸智能识别

2022年1月22日

18:30 - 22:00

1 背景与目标

2.1 调用电脑摄像头拍照

2.2 实现批量拍照

2.3 封装拍照操作的代码

3.1 人脸检测介绍

3.2 实现照片中人脸检测

3.3 过滤人脸不全的照片

3.4 人脸照片的灰度转换及存储

3.5 批量照片处理及存储

3.6 将拍照及数据处理代码封装成类

4.1 获取人名及对应文件夹路径

4.2 自定义独热编码函数

4.3 确认样本和标签对应关系

4.4 定义照片数据转数组数据的函数

4.5 将数据整理代码封装成类

5.1 建模介绍

5.1.1 模型训练代码实现

5.1.2 执行模型训练

5.1.3 模型性能调优

5.2 定义模型搭建所需的常用方法

5.3 搭建第一个卷积层结构

5.4 测试网络结构

5.5 搭建第二个和第三个卷积层

5.6 搭建一个全连接层

5.7 搭建网络输出层

5.8 定义模型训练的损失函数-交叉熵

5.9 模型训练准备

6.1 调用保存好的模型

6.2 模型性能评价结果

泰迪云课堂
操作演练个人PC
在线答疑微信群
第七课 实战案例:基于GAN的图像风格转换

2022年1月23日

18:30 - 22:00

1 背景与目标

2 过程与步骤

2.1 数据读取

2.2 数据预处理

2.3 数据集整理

3 模型构建

3.1 GAN网络搭建

3.2 定义GAN损失函数

3.3 训练网络

3.4 结果分析

4 小结

泰迪云课堂
操作演练个人PC
在线答疑微信群
第八课 在线考试

2022年1月24日

19:00 - 21:00

高级机器学习工程师职业技术在线考试泰迪云课堂


附件九  人工智能实战(自然语言处理方向)课程大纲

基础篇(报名成功后即可开始学习)
时间课程内容学习平台
正式培训前

Python编程基础

1 Python 编程基础

1 准备工作

2 列表操作

3 程序流程控制语句

4 字符串操作

4.1 字符串及其索引&切片

4.2 字符串的常见方法

4.3 字典的创建及索引

4.4 字典常用操作

4.5 字典推导式

5 Python 文件读取操作

5.1 Python 读取文件

5.2 练习3:统计小说中的单词频次

6 函数

6.1Python 函数自定义

6.2 练习4:自定义求序列偶数个数的函数

7 面向对象与模块

7.1 Python 方法与函数对比介绍

7.2 Python 面向对象示例

7.3 Python 模块使用

7.4 第三方库的安装与调用

8 注意事项

8.1 Python 工作路径说明

8.2 模块命名及存放路径的注意事项

8.3 结语

泰迪云课堂
正式培训前

Python数据分析与应用

1 Python数据分析概述

1.1 认识数据分析

1.2 熟悉Python数据分析的工具

1.3 安装anaconda与启动Jupyter Notebook

1.4 掌握Jupyter Notebook常用功能

2 NumPy数值计算基础

2.1 掌握NumPy数组对象

2.1.1 NumPy简介

2.1.2 数组创建及基础属性

2.1.3 初识数组的特点

2.1.4 创建常用数组

2.1.5 数组数据类型

2.1.6 生成随机数

2.1.7 一维数组的索引

2.1.8 逻辑型索引

2.1.9 多维数组的索引

2.1.10 求解距离矩阵

2.1.11 变化数组shape

2.2 掌握NumPy矩阵与通用函数

2.2.1 NumPy矩阵介绍

2.2.2 NumPy通用函数介绍

2.2.3 通用函数的广播机制

2.3 利用NumPy进行统计分析

2.3.1 NumPy读写二进制文件

2.3.2 NumPy读写txt文件

2.3.3 利用NumPy对数据进行简单统计分析

3 Matplotlib数据可视化基础

3.1 掌握绘图基础语法与常用参数

3.1.1 Matplotlib介绍

3.1.2 基础图形绘制

3.1.3 常用参数设置

3.2 分析特征间关系

3.2.1 绘制散点图

3.2.2 散点图参数设置

3.2.3 绘制折线图

3.3 分析特征内部数据分布与分散情况

3.3.1 绘制直方图

3.3.2 绘制饼图

3.3.3 绘制箱线图

4 Pandas统计分析基础

4.1 Pandas简介

4.2 读写不同数据源得数据

4.2.1 Pandas读取文本数据

4.2.2 存储数据框

4.2.3 Pandas读取excel文件

4.2.4 将数据框存储为excel文件

4.3 数据框与数据框元素

4.3.1 构建数据框

4.3.2 查看数据框得常用属性

4.3.3 按行列顺序访问数据框中的元素

4.3.4 按行列名称访问数据框中的元素

4.3.5 修改数据框中的元素

4.3.6 删除数据框中的元素

4.3.7 描述分析数据框中的元素

4.4 转换与处理时间序列数据

4.4.1 转换成时间类型数据

4.4.2 时间类型数据的常用操作

4.5 使用分组聚合进行组内计算

4.5.1 groupby分组操作

4.5.2 agg聚合操作

4.6 创建透视表与交叉表

4.6.1 生成透视表

4.6.2 生成交叉表

5 使用Pandas进行数据预处理

5.1 合并数据

5.1.1 表堆叠

5.1.2 主键合并

5.1.3 重叠合并

5.2 清洗数据

5.2.1 检测与处理重复值

5.2.2 检测与处理缺失值

5.2.3 检测与处理异常值

5.3 标准化数据

5.4 转换数据

5.4.1 哑变量处理

5.4.2 离散化连续型数据

泰迪云课堂
核心课程篇
时间课程内容学习平台

2022年1月16日

18:30 - 22:00

主讲:方海涛

主题内容:随机最优控制与人工智能

主讲:郝志峰

讲座主题:大数据视角下数字孪生与元宇宙的思考

泰迪云课堂
第一课 Python机器学习算法原理与实现

2022年1月16日

18:30 - 22:00

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量Python实现

3 回归分析

3.1 线性回归基本形式

3.2 线性回归模型的Python实现

3.3 波士顿房价预测的Python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的Python实现

4.1 单个神经元介绍

4.2 经典网络结构介绍

4.3 神经网络工作流程演示

4.4 如何修正网络参数-梯度下降法

4.5 网络工作原理推导

4.6 网络搭建准备

4.7 样本从输入层到隐层传输的Python实现

4.8 网络输出的Python实现

4.9 单样本网络训练的Python实现

4.10 全样本网络训练的Python实现

4.11 网络性能评价

4.12 调用sklearn实现神经网络算法

泰迪云课堂
操作演练个人PC
在线答疑微信群
第二课 TensorFlow2实战

2022年1月17日

18:30 - 22:00

1 任务1:构建一个线性模型

1.1 TensorFlow介绍

1.2 TensorFlow2常用数据类型和操作

1.3 初始化模型

1.4 构建损失函数

1.5 模型训练及可视化

1.6 使用高阶API-Keras

2 任务2:MNIST手写数字识别

2.1 数据读取及探索

2.2 交叉熵

2.3 模型构建及训练

2.4 调用保存好的模型对新样本进行预测

泰迪云课堂
操作演练个人PC
在线答疑微信群
第三课 TensorFlow2 深度学习原理及实现

2022年1月18日

18:30 - 22:00

1.1 深度神经网络-引言

2 卷积神经网络CNN

2.1 浅层神经网络的局限

2.2 卷积操作

2.3 卷积操作的优势

2.4 池化及全连接

2.5 高维输入及多filter卷积

2.6 实现卷积操作

2.7 实现池化操作

泰迪云课堂
操作演练/作业个人PC
在线答疑微信群

2022年1月19日

18:30 - 22:00

3 循环神经网络RNN

3.1 循环神经网络简介

3.2 循环神经网络的常见结构

4 长短时记忆网络LSTM

4.1 LSTM 的三个门

4.2 LSTM 三个门的计算示例

4.3 利用RNN&LSTM 实现mnist 手写数字识别

泰迪云课堂
操作演练/作业个人PC
在线答疑微信群
拓展自学篇
自行安排

5.1 生成对抗神经网络简介

5.2 生成对抗神经网络训练流程

5.3 生成手写数字照片-数据准备&定义生成器网络

5.4 生成手写数字照片-判别器网络结构

5.5 生成手写数字照片-网络传输及网络损失值

5.6 生成手写数字照片-模型训练及效果展示

泰迪云课堂

操作演练/作业个人PC

在线答疑微信群
第四课 自然语言处理实战

2022年1月20日

18:30 - 22:00

1 绪论

1.1 自然语言处理概述
1.2NLP 基本流程
2 中文分词技术
2.1          中文分词简介
2.2 基于规则的分词
2.2.1 正向最大匹配法
2.2.2          逆向最大匹配法
2.2.3 双向最大匹配法
2.3 基于统计的分词
2.4          中文分词工具jieba 库
2.4.1 基本步骤
2.4.2 分词模式

泰迪云课堂
操作演练/作业个人PC
在线答疑微信群

2022年1月21日

18:30 - 22:00

3 文本向量化
3.1 文本向量化简介
3.2 文本离散表示
3.2.1 one-hot 表示
3.2.2 词袋模型
3.2.3 TF-IDF 表示
3.3 分布式表示
3.3.1 Word2Vec 模型
3.3.2 基于Word2Vec 的相似度计算
3.3.3 Doc2Vec 模型
3.3.4 基于Doc2Vec 的相似度计算

泰迪云课堂
操作演练/作业个人PC
在线答疑微信群
第五课 文本处理实战:路透社新闻分类

2022年1月22日

18:30 - 22:00

1.项目背景与目标
2.数据探索分析
2.1 读取新闻数据
2.2 了解数据的基本情况
3.词嵌入(Word Embedding)
3.1word embedding 的基本概念
3.2word2vec 介绍
3.3CBOW 词向量训练过程
3.4《鹿鼎记》word2vec 介绍
3.5《鹿鼎记》word2vec 实现-读取数据
3.6《鹿鼎记》word2vec 实现-数据预处理
3.7《鹿鼎记》word2vec 实现-词向量训练
3.8《鹿鼎记》word2vec 实现-获取词向量矩阵
4.构建模型
4.1 数据padding
4.2 网络结构中的Embedding 层
4.3 构建RNN 网络模型
4.4 模型训练及评估
5.模型优化
5.1 词向量预训练
5.2 模型优化

泰迪云课堂
操作演练/作业个人PC
在线答疑微信群
第六课 案例实战:搭建一个属于自己的聊天机器人

2022年1月23日

18:30 - 22:00

1 案例背景与目标
1.1 背景与目标
1.2 流程介绍
2 语料库预处理
2.1 语料库介绍
2.2 工程和数据准备
2.3 语料分词处理
2.4 预处理结果保存
2.5 语料预处理代码整理
3 模型构建
3.1 模型介绍
3.2 构建哈希表
3.3 问答数据向量化
3.4 问答向量长度填充
3.5 模型准备
3.6 模型编译
3.7 训练步
3.8 迭代训练
3.9 模型预测的句子分词
3.10 模型预测输入输出
3.11 模型整理、类化
4 网页前端展示
5 拓展思考

泰迪云课堂
操作演练/作业个人PC
在线答疑微信群
第七课 实战案例:基于深度学习的推荐系统受众性别预测

2022年1月24日

18:30 - 22:00

1 任务1-了解背景与目标
2 数据探索
2.1 任务2 说明-数据探索
2.2 项目文件结构及编辑环境介绍
2.3 数据获取与探索分析
3 获取用户单击流数据
3.1 任务3 说明-获取用户单击流数据
3.2 理解用户单击流相关概念
3.3 获取用户的各单击流数据
4 实现词嵌入操作-1
4.1 任务4 说明-实现词嵌入操作-1
4.2 对各单击流数据进行探索
5 实现词嵌入操作-2
5.1 任务5 说明-实现词嵌入操作-2
5.2 对用户单击流数据进行预处理
5.3 进行词向量训练
5.4 对用户的单击流进行编码及padding 操作
5.5 将词向量矩阵做相应排序并储存
5.6 将单击流数据转化为二维样本数据并存储
6 模型构建
6.1 任务6 说明-模型构建
6.2 建模前数据整理
6.3 模型训练及性能评估
7 模型优化
7.1 任务7 说明-模型优化
7.2 模型优化-并行网络结构介绍
7.3 模型优化

泰迪云课堂
操作演练/作业个人PC
在线答疑微信群
第八课 在线考试

2022年1月25日

19:00 - 21:00

高级机器学习工程师职业技术在线考试泰迪云课堂