泰迪科技第四届“Spark+Python集训营”开幕通知

2018-10-26 泰迪智能科技 2297
分享到:

秋去秋来,一年时间过去了,泰迪科技的“Python集训营”也已顺利开展三期,各位小伙伴们,在这一年的时间你为自己充电了吗?在这个瞬息万变的社会中,每个人都如逆水行舟,不学习不进步就得被淘汰。

这次我们还是聊聊学习的事,当下什么领域最热?无疑是大数据、人工智能、区块链,大数据不用说,它已经渗透至我们生活的方方面面,如今每个人都是一个移动数据源,电商购物、地图导航、移动社交等等,无一不在实时产生种类繁多的大量数据;人工智能的落地应用则相对少见,除了机器视觉和语音处理技术外,包括自动驾驶、医学影像等在内的绝大部分目前都处于实验室或探索阶段;区块链则就更飘渺一些。

那这三者的关系是什么呢?抛开区块链不谈,大数据与人工智能/机器学习/数据挖掘的关系是密不可分的,大数据像一座矿山,而各种算法和模型则是挖矿的技术和设备,两者相辅相成。在实际项目中我们经常会遇到大数据集(几十几百G的数据很常见),所以想要从中进行数据挖掘或训练学习出规则,我们必须掌握处理这些大数据集的能力,也就是说在大部分情况下一名合格的数据挖掘或机器学习工程师,从技术方面来看,除了要会算法还要会管理大量数据。所以,这次集训营我们为大家带来的就是“大数据(基于Spark)+人工智能(基于Python)”课程。

本课程是结合企业需求而设计出的全新课程,我们相信如果你想从事数据/算法方向的工作,这会是当前最贴合你需求的内容。

你是数据挖掘工程师?那就快来看看之前你遇到的大数据该如何处理;

你是大数据工程师?那就快来了解数据中的价值到底是怎么提炼出来的;

你是没有基础的新人?那就快来和我们一起玩转这个数据世界!

第四届“Spark+Python集训营”课程模块
序号课程模块价格(元)前置能力课时/天备注
1Spark课程基础免费Python、Linux、Hadoop3
2Spark编程、核心API与架构原理168.8Spark课程基础8
3Spark案例208.8Spark编程8

三个模块打包价358.8元,另外向前1000个报名者免费提供Python快速入门课程哟,快来学习吧!

培训内容
Spark课程基础
(11.20-11.22)
Spark编程、核心API与架构原理
(11.26-12.6)

Spark案例
(12.10-12.20)

1 Linux基础

1.1 课程使用虚拟机配置

1.2  Linux及虚拟机介绍

1.3 常用命令使用

1.4 文本编辑工具vi


2 Python基础知识

2.1  Python编程基础

2.2 开发工具PyCharm


3 大数据Hadoop简介

3.1 Hadoop基础

3.2 虚拟机Hadoop集群使用

3.3 HDFS常用命令

3.4 练习: 文件从Windows到HDFS


4 Spark基础

4.1 Spark简介

4.2 Spark安装配置/参数介绍

4.3 Spark基本概念:RDD、DataFrame、DataSet及其优势劣势

4.4 Spark 客户端(spark-shell、spark-submit)使用(Python、Scala)


5 Spark Python开发环境搭建

1 Spark编程API及进阶

1.1 Spark编程API介绍

1.2 Spark Python 基础RDD API

1.3 Spark Python DataFrame API实战

1.4 Spark Python DataFrame API进阶

1.4 实例:实现推荐算法的评估模块

1.5 思考:Python和PySpark的区别?


2 Spark架构及原理实战

2.1 Spark核心原理RDD cache,RDD Stages, RDD Lineage;

2.2 如何使用实例来验证原理?

2.3 任务调度流程解析

2.4 部署模式实战

2.5 广播变量和累加器

2.6 性能调优

3 Spark与机器学习库


3.1  MLlib及各个模块简介

3.2 探索分析

3.3  数据预处理

3.4  聚类、分类、回归、推荐

3.5 模型选择与调优

3.6 PipeLine介绍

3.7 PipeLine整合预处理、建模、调优、评估过程实例

1 案例:大数据法律服务智能推荐

1.1 背景介绍

1.2 数据描述与目标分析

1.3 系统架构分析

1.4 Sqoop使用入门

1.5 数据传输

1.6 数据探索

1.6.1 轨迹聚类主题探索

1.6.2 基于FP关联规则推荐主题探索

1.6.3 协同过滤推荐主题探索

1.7 数据处理

1.8 基于关联规则修正的协同过滤推荐模型构建与评估

1.8.1 基于协同过滤ALS的模型

1.8.2 Spark实现推荐模型评估

1.8.3 基于FP的关联规则模型

1.8.4 整合关联规则到最优ALS模型

1.8.5 模型评估及推荐


2 广电大数据用户画像及推荐

2.1案例背景介绍

2.1.1案例背景

2.1.2系统架构及流程

2.1.3数据介绍及分析目标

2.2 数据读取及处理

2.2.1Spark读取ES数据

2.2.2数据预处理

2.3 统计用户地区分布数

2.4 用户画像

2.4.1 用户画像规则构建

2.4.2 用户画像实现

2.5实时统计用户数

2.5.1 kafka简介

2.5.2 Spark Streaming简介

2.5.3 整合kafka和Spark Streaming

2.6 用户挽留预测

2.6.1 用户挽留指标构建说明

2.6.2 使用SVM来预测用户价值

开课时间

1.开营时间:2018年11月19日20:00
2.每日上课时间:20:00-21:30

报名方式

图片1.png

联 系 人:13246821827(曾老师)
咨询方式:3324859589(QQ)   020-22205718
报名邮箱:zengaizhi@tipdm.com
机构网址:www.tipdm.com

支付方式:
银行账户:

名:黄震均
开户行:建设银行广州萝岗支行
号:6236 6833 2001 2370 920

开票对公账户:

公司名称:广州泰迪智能科技有限公司
 开 户 行:中国建设银行股份有限公司广州萝岗支行
银行账号:44050 14700 42090 12501

支付宝账户:

户名:广州泰迪智能科技有限公司
账号:290676811@qq.com

微信支付码:

QQ图片20181026174024.png


广州泰迪智能科技有限公司
2018 年 10 月 26日