曙海科技
全国报名免费热线:4008699035 微信:shuhaipeixun
或15921673576/13918613812(微信同号) QQ:1299983702
首页 课程表 在线聊 报名 讲师 品牌 QQ聊 活动 就业
 
Spark Streaming企业级项目实战以及深度源码剖析课程

 
  班级规模及环境--热线:4008699035 手机:15921673576/13918613812( 微信同号)
      每个班级的人数限3到5人,互动授课, 保障效果,小班授课。
  上间和地点
上部份地点:【上海】同济大学(沪西)/新城金郡商务楼(11号线白银路站)【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院【北京分部】:北京中山/福鑫大楼【南京分部】:金港大厦(和燕路)【武汉分部】:佳源大厦(高新二路)【成都分部】:领馆区1号(中和大道)【沈阳分部】:沈阳理工大学/六宅臻品【郑州分部】:郑州大学/锦华大厦【石家庄分部】:河北科技大学/瑞景大厦
近开间(周末班/连续班/晚班):即将开课,详情请咨询客服。(欢迎您垂询,视教育质量为生命!)
  实验设备
    ◆小班教学,教学效果好
       
       ☆注重质量☆边讲边练

       ☆合格学员免费推荐工作
       ★实验设备请点击这儿查看★
  质量保障

       1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听;
       2、课程完成后,授课老师留给学员手机和Email,保障培训效果,免费提供半年的技术支持。
       3、培训合格学员可享受免费推荐就业机会。☆合格学员免费颁发相关工程师等资格证书,提升职业资质。专注高端技术培训15年,曙海学员的能力得到大家的认同,受到用人单位的广泛赞誉,曙海的证书受到广泛认可。

部份程大纲
 

第一部份:Spark Streamin深度源码剖析(上)
(1)Spark Streaming整体架构剖析
(2)基于Receiver+Kafka接收数据的源码剖析
(3)基于DStream生成RDD的源码剖析
(4)基于JobGenerator生成Job的源码剖析

第二部份:Spark Streaming深度源码剖析(下)
(1)Spark Streaming Driver容错的源码剖析
(2)Spark Streaming Executor容错的源码剖析
(3)Spark Streaming State相关操作的源码剖析
(4)Spark Streaming Window相关操作的源码剖析

第三部份:互联网公司用户流量实时大盘实战
(1)互联网用户流量分析业务介绍
(2)互联网用户流量分析架构设计:Spark Streaming+Kafka+HBase
(3)完成互联网用户流量指标体系的开发
(4)实时计算作业上线运维:部署、代码升级以及监控
(5)对Spark Streaming作业进行初步的性能优化
(6)基于前端展示用户流量分析大盘

第四部份:广告系统实时数据平台架构实战(上)
(1)广告系统实时数据平台的业务介绍以及架构设计
(2)完成广告用户与客户价值的实时数据指标体系开发
(3)完成广告运营与营销活动的实时数据指标体系开发
(4)基于广告实时数据支持的点击率预测
(5)基于广告实时数据支持的精准广告营销

第五部份:广告系统实时数据平台架构实战(下)
(1)广告系统实时数据平台架构优化设计
(2)基于Spark Streaming checkpoint实现全流程的容错机制
(3)基于Spark Streaming实现全流程的exatcly once语义
(4)基于Kafka实现数据不丢失的技术方案
(5)基于前端页面展示广告数据分析

第六部份:微博热点话题实时探测系统架构实战(上)
(1)微博热点话题探测业务介绍
(2)微博热点话题探测系统架构设计
(3)基于Flume+Kafka完成实时微博数据的接入
(4)自己动手改进FP-Growth频繁集挖掘算法
(5)基于改进后的繁集挖掘算法完成热点话题的实时探测

第七部份:微博热点话题实时探测系统架构实战(下)
(1)基于Spark自己动手实现word2vec算法
(2)基于自己实现的Spark word2vec算法实现关联热点话题挖掘
(3)基于Spark Streaming完成实时计算作业开发
(4)基于前端页面展示微博热点话题

第八部份:微博社交关系实时挖掘平台实战(上)
(1)微博社交关系实时数据分析平台业务介绍以及架构设计
(2)Titan分布式图数据库介绍
(3)Cassandra分布式NoSQL数据库介绍
(4)Elasticsearch分布式搜索引擎介绍
(5)基于Spark Streaming+GraphX+Titan完成微博社交关系挖掘

第九部份:微博社交关系实时挖掘平台实战(下)
(1)基于Spark Streaming+文本挖掘完成微博用户的情感分析
(2)基于Spark Streaming完成微博用户群分析
(3)基于Spark Streaming完成用户城市地图分析
(4)基于Spark Streaming完成热门话题趋势分析
(5)基于前端页面展示微博社交数据

第十部份:股票交易分析实时大盘系统实战
(1)股票分析业务介绍
(2)实时股票分析大盘系统架构设计
(3)Druid分布式OLAP引擎介绍
(4)结合Spark Streaming + Druid完成股票数据实时分析
(5)结合Spark Streaming完成实时热门股票排行
(6)结合Spark Streaming完成实时股票走势预测
(7)基于前端页面展示股票分析数据

第十一部份:实时用户画像系统架构实战
(1)实时用户画像组成分析
(2)实时用户画像的标签数据字典
(3)实时用户画像的兴趣度模型
(4)基于Spark Streaming实现一套实时用户画像系统
(5)基于ElasticSearch对实时用户画像数据进行分析

第十二部份:实时个性化推荐系统架构实战(上)
(1)基于Flume+Kafka实现用户行为的实时采集与清洗
(2)基于实时用户画像构建数据仓库
(3)针对元数据库构建实时索引
(4)基于Spark Streaming完成第一个版实时个性化推荐系统

第十三部份:实时个性化推荐系统架构实战(下)
(1)基于频繁模式的选择性集成分类算法
(2)基于选择性集成分类算法和网页对用户进行分类以及兴趣组构建
(3)基于Spark Streaming+协同过滤算法实现的实时推荐系统
(4)基于相关性算法实现的实时个性化推荐冷启动优化方案

 

-

 

  备案号:沪ICP备08026168号 .(2014年7月11)...................
友情链接:Cadence培训 ICEPAK培训 EMC培训 电磁兼容培训 sas容培训 罗克韦尔PLC培训 欧姆龙PLC培训 PLC培训 三菱PLC培训 西门子PLC培训 dcs培训 横河dcs培训 艾默生培训 robot CAD培训 eplan培训 dcs培训 电路板设计培训 浙大dcs培训 PCB设计培训 adams培训 fluent培训系列课程 培训机构课程短期培训系列课程培训机构 长期课程列表实践课程高级课程学校培训机构周末班培训 南京 NS3培训 OpenGL培训 FPGA培训 PCIE培训 MTK培训 Cortex训 Arduino培训 单片机培训 EMC培训 信号完整性培训 电源设计培训 电机控制培训 LabVIEW培训 OPENCV培训 集成电路培训 UVM验证培训 VxWorks培训 CST培训 PLC培训 Python培训 ANSYS培训 VB语言培训 HFSS培训 SAS培训 Ansys培训 短期培训系列课程培训机构 长期课程列表实践课程高级课程学校培训机构周末班 曙海 教育 企业 培训课程 系列班 长期课程列表实践课程高级课程学校培训机构周末班 短期培训系列课程培训机构 曙海教育企业培训课程 系列班