为满足企业日益增长的数据人才需求,帮助更多有志从事于此却苦于各种条件限制的人顺利进入大数据及人工智能行业,泰迪科技特开设“Hadoop+Spark大数据开发工程师”和“Python数据分析与机器学习工程师”就业培训班。
培训目标
1.学员掌握并能够熟练使用Hadoop+Spark/Python等大数据与机器学习核心开发工具,并应用于实际工作;
2.熟知大数据开发或数据分析挖掘项目的基本流程,建立良好的数据思维;
3.熟悉常见数据分析和机器学习算法原理及编程实现,掌握聚类、分类、回归、决策树、SVM、神经网络等常见算法及深度学习算法和开源框架TensorFlow等;
4.通过集中培训和项目实训,能够独立完成一个企业级项目,满足企业实际用人需求;
5.符合大数据/数据分析与机器学习岗位要求,顺利进入大数据/数据分析或人工智能行业。
面向对象
有志于从事大数据或数据分析与机器学习相关岗位工作的人士。
培训方案及课程安排
3个月脱产集中培训加项目实战,系统学习大数据或数据分析与机器学习方法、工具及实战案例,具备Hadoop+Spark编程开发/Python数据分析+机器学习能力。
Python数据分析与机器学习课程安排
Linux&MySQL | 大数据数学基础 | Python与机器学习 | ||
1 Linux简介与安装 2 Linux目录与权限管理 3文件基础操作与vim 程序编辑器 4 Bash简介及功能介绍、Shell Script编程 5 数据库概述 6 MySQL基本知识与体系结构 7 MySQL基础语句与编程 8 数据库和表的创建及增删改查操作 | 1 准备工作 1.1 认识Python 1.2 搭建Python环境 1.3 安装PyCharm并创建一个应声虫程序 2 Python基础知识 2.1 掌握Python固定语法 2.2 创建字符串变量并提取里面的数值 2.3 计算圆形的各参数 3 Python数据结构 3.1 创建一个列表(list)并进行增删改查操作 3.2 转换一个元组(tuple)并进行取值操作 3.3 创建一个字典(dict)并进行增删改查操作 3.4 将两个列表转换为集合(set)并进行集合运算 4程序流程控制语句 4.1实现考试成绩划分 4.2实现一组数的连加与连乘 4.3使用冒泡排序法排序 4.4实训(猜数字游戏) 5 函数 5.1自定义函数实现输出方差 5.2使用匿名函数添加列表元素 5.3存储并导入函数模块 6 面向对象 6.1 认识面向对象编程 6.2 创建Car类 6.3 创建Car对象 6.4 迭代Car对象 6.5 产生Land_Rover对象(子类) 7 文件基础 7.1 认识文件 7.2 读取txt文件中的数据 7.3 保存数据为csv格式文件 7.4 认识os模块 | 1 微积分基础 2 概率论与数理统计 3 线性代数 4 数值计算基础 | 1 Python数据分析概述 1.1认识数据分析 1.2熟悉Python数据分析的工具 1.3安装Python3的Anaconda发行版 1.4掌握Jupyter Notebook常用功能 2 NumPy数值计算基础 2.1认识NumPy数组对象ndarray 2.2认识NumPy矩阵与通用函数 2.3利用NumPy进行统计分析 3 Matplotlib数据可视化基础 3.1了解绘图基础语法与常用参数 3.2分析特征间的关系 3.3分析特征内部数据分布与分散状况 4 Pandas统计分析基础 4.1读写不同数据源的数据 4.2掌握DataFrame的常用操作 4.3转换与处理时间序列数据 4.4使用分组聚合进行组内计算 4.5创建透视表与交叉表 5 使用Pandas进行数据预处理 5.1合并数据 5.2清洗数据 5.3标准化数据 5.4转换数据 6使用scikit-learn构建模型 6.1使用sklearn转换器处理数据 6.2构建并评价聚类模型 6.3构建并评价分类模型 6.4构建并评价回归模型 7 航空公司客户价值分析 7.1了解航空公司现状与客户价值分析 7.2预处理航空客户数据 7.3使用K-Means算法进行客户分群 | 1机器学习绪论 1.1 引言 1.2 基本术语 1.3 假设空间 1.4 归纳偏好 2 模型评估与选择 2.1 经验误差与过拟合 2.2 评估方法 2.3 性能度量 2.4 偏差与方差 3 回归分析(Regression Analysis) 3.1 基本形式 3.2 线性模型 3.3 逻辑回归 4 决策树(Decision Tree) 4.1 基本流程 4.2 划分选择 4.3 剪枝 5 人工神经网络(Artificial Neural Network) 5.1 神经元模型 5.2 感知机与多层网络 5.3 误差逆传播 5.4 BP神经网络 6 最近邻算法(KNN) 7 朴素贝叶斯分类(Naive Bayesian) 8 聚类分析(Cluster Analysis) 8.1 聚类任务 8.2 性能度量 8.3 距离计算 8.4 常用聚类算法 9 关联规则(Apriori) 10 支持向量机(Support Vector Machine) 10.1 间隔与支持向量 10.2 对偶问题 10.3 核函数 10.4 软间隔与正则化 11 智能推荐(Collaborative Filtering) 12 深度学习介绍(Deep Learning) |
Python自然语言处理 | Python机器视觉与图像处理 | 综合案例 | 项目实训 | |
1 文本挖掘全流程概述 2文本挖掘预处理技术 3 中文分词介绍(jieba) 4 词云介绍(wordcloud) 5 正则表达式 6 文本特征提取 7 文本聚类 8 主题分析 | 1 图像数据处理 2 水质图像识别 3 TensorFlow入门与应用 4 图像识别与卷积神经网络 5 MNIST数字识别 | 1 电力窃漏电用户自动识别 2 垃圾短信分类与识别 3 电商产品评论数据情感分析 4 电子商务智能推荐服务 5 基于微博数据的网络舆情分析 | 1 家用电器用户行为分析及事件识别 2 金融广告精准投放 3 基于图片处理的机器人智能抓取 …… |
Hadoop+Spark大数据开发课程安排
Linux基础 | 数据库SQL基础 | Java基础 | Hadoop编程开发 | Hive大数据分析 |
1.Linux操作系统简介、安装及使用; 2.Linux档案权限与目录配置、档案与目录管理、用户账号管理; 3.文件操作、文本编辑、vim 程序编辑器; 4.Bash简介及功能介绍、Shell Script编程; | 1.数据库概述、数据库系统、管理系统; 2.MySQL安装配置、基本操作、MySQL连接工具的使用; 3.数据库基础知识概述:数据库、表结构、字段及其数据类型、运算符; 4.SQL概述,数据库及表的创建基本操作; 5.增删改查语句,使用Java程序进行增删改查。 | 1.Java基础程序设计:数据类型、运算符、表达式、判断循环语言; 2.数组定义与使用、方法定义与重载; 3.面向对象(基础); 4.面向对象(高级); 5.异常概念与编程;包概念与导入;泛型概念与编程应用; 6.Java类集:Collection接口主要操作方法:List、Set、Map常用子类与使用,集合操作与遍历方法; 7.多线程编程及应用; 8.Java EE编程实战;JavaEE基础,HTML,JavaScript,Java Web,Tomcat,JSP。 | 1.Hadoop简介、架构、原理; 2.集群配置及安装(JDK、SSH); 2. Hadoop IDE开发环境配置(Eclipse配置); 3. Hadoop MapReduce实战:单词计数; 4. Hadoop命令(hadoop fs , hadoop job, Hadoop jar); 5.分布式文件系统HDFS Java API实战:创建目录,上传,下载,删除; 5. Hadoop基础编程(Mapper、Reducer、Driver); 6. Hadoop高级编程(Combiner/Partitioner原理实战及自定义,FileInputFormat、FileOutputFormat); 8. Hadoop高级编程(自定义键值对); 9. Hadoop高级编程(开发环境直接运行MapReduce程序); 10. Hadoop案例1:基于KNN的鸢尾花分类预测; 11. Hadoop案例2:基于Kmeans的客户价值分析。 | 1. Hive产生背景、概念,Hive架构、原理; 2. Hive安装、配置; 3.Hive与RDBMS区别,Hive应用场景; 4. Hive HQL命令,数据库,表创建;数据导入、导出,HQL查询; 5.Hive内置函数,自定义函数(UDF); 6.Hive与Java交互; 7.基于Hive的航空公司客户价值分析项目案例。 |
HBase数据快速读写 | Spark大数据分析与编程 | 实战案例 | 项目实训 | |
1.HBase简介、架构原理; 2.HBase集群安装配置(Zookeeper简介、Zookeeper安装配置、配置文件解读); 3.HBase架构与数据模型(组件原理功能、Rowkey设计、Schema设计); 4.HBas命令行(hbase shell)表操作; 5.HBase开发环境配置; 6.Java API操作HBase删/建表、HBase增删改查; 7.HBase与Hadoop Mapreduce交互(HBase to HDFS, HDFS to HBase,HBase to HBase); 9.基于HBase的冠字号查询系统(案例背景、架构、数据处理、建表、导入表数据实现); 10.基于HBase的冠字号查询系统Java Web实现。 | 1.Spark 简介(Spark简介、应用场景); 2.Spark安装配置(资源管理器YARN/Spark Standalone); 3. Spark整合Hive及传统数据库; 3.原理与架构(组件功能、RDD原理); 4.Spark编程基础(Scala及编程简介); 5.Spark Transformation/Action编程; 6.Spark Intellij IDEA开发环境配置; 7.基于Spark ALS算法的电影推荐系统(案例背景、系统架构); 8.基于Spark ALS算法的电影推荐系统(Spark Shell简单实现& Java Web远程调用Spark集群实现); | 一、基于Hadoop、Spark的法律网智能推荐 1.法律网案例背景,架构设计; 2.数据预处理:异常数据探索、数据剔除; 3.系统数据预处理实现; 4.推荐算法简介、评估与选型; 5.系统模型建立、预研、调优; 6.系统模型完整实现。 二、基于Spark FPGrowth的餐饮智能菜品推荐 1.餐饮案例背景、架构设计; 2.数据预处理:上传、数据探索、异常处理; 3.推荐模型预研、评估与选型; 4.MLlib FPGrowth调用与编码实现; 5.系统模型建立、评价、调优; 6.系统模型完整实现。 | 项目实训 |
就业方向
1.大数据开发、大数据分析、大数据运维、数据挖掘、数据分析
2.机器学习、算法工程师、数据挖掘、数据分析、人工智能、大数据分析、自然语言处理、图片处理
讲师团成员
讲师为系列图书作者和高校教授,兼具工程和教学经验,祥见附件。
培训特色
1.课程内容从企业实际需求出发,以满足企业用人需求为标准;
2.培训设置以实际项目为驱动,实施鱼骨教学法,从实战中来到实战中去;
3.讲师为系列图书作者和高校教授,兼具工程和教学经验;
5.五大经典案例深入剖析,掌握客户分析、推荐系统、文本挖掘、图片识别等业务场景数据分析和建模方法;
6.通过全真项目实战获得宝贵的项目经验,助力收获高薪offer;
7.企业面试官、职场老司机的职场经验分享,助你在面试中游刃有余;
8.视频课程免费看,整个培训课程都会进行视频录制,并免费提供给学员观看,以便复习巩固;
9.提供完善的就业保障措施。
就业保障
我们将为您提供如下就业保障措施:
1.泰迪科技内部吸收,泰迪科技作为一家专注于大数据挖掘的公司,发展迅速,每年都需要补充大量新鲜血液,部分毕业学员可以直接成为泰迪科技正式员工;
2.联合推送,泰迪科技及其合作伙伴与多家大数据领域专业公司签有人才服务协议,定期输出人才,促进毕业学员对口就业;
3.学生自由选择,泰迪科技将提供企业面试官、职场老司机的职场经验分享,助你在面试中游刃有余;
4.对于极少部分毕业后暂时未就业学生,可以免费跟下期班重学。