曙海培训
全国报名免费热线:4008699035 微信:shuhaipeixun
或15921673576/13918613812(微信同号) QQ:1299983702
首页 课程表 在线聊 报名 讲师 品牌 QQ聊 活动 就业
 

大数据与数据挖掘应用培训课程

 
   班级规模及环境--热线:4008699035 手机:15921673576/13918613812( 微信同号)
       坚持小班授课,为保证培训效果,增加互动环节,每期人数限3到5人。
   上课时间和地点
上课地点:【上海】:同济大学(沪西)/新城金郡商务楼(11号线白银路站) 【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院 【北京分部】:北京中山/福鑫大楼 【南京分部】:金港大厦(和燕路) 【武汉分部】:佳源大厦(高新二路) 【成都分部】:领馆区1号(中和大道) 【沈阳分部】:沈阳理工大学/六宅臻品 【郑州分部】:郑州大学/锦华大厦 【石家庄分部】:河北科技大学/瑞景大厦 【广州分部】:广粮大厦 【西安分部】:协同大厦
近开课时间(周末班/连续班/晚班):即将开课,详情请咨询客服。(欢迎您垂询,视教育质量为生命!)
   实验设备
     ☆资深工程师授课
        
        ☆注重质量 ☆边讲边练

        ☆合格学员免费推荐工作
        ★实验设备请点击这儿查看★
   质量保障

        1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听;
        2、课程完成后,授课老师留给学员手机和Email,保障培训效果,免费提供半年的技术支持。
        3、培训合格学员可享受免费推荐就业机会。

课程大纲
 
 
第一部分除了Hadoop框架以外,大数据界的现状与展望,机遇与挑战,开源项目的注意事项(尤其对大型企业)也会在课程中介绍和研讨,内容以思路,框架和架构为主
第二部分边学变练,内容以应用编程为主,掌握基本的Hadoop编程原理
第三部分边学边练,了解MapReduce之上的封装Pig以及Hive,以及数据跨平台传输工具Sqoop,研讨关系型数据库与大数据框架的主要应用差异
第四部分边学边练,了解NOSQL计算框架HBase,流计算框架Storm,了解高可用配置管理工具ZooKeeper

课程大纲:

第1部分
大数据基础与Hadoop框架 数据分析概述
数据的演变
传统数据库面临的挑战
大数据处理的机遇
业务分析经典案例:啤酒与尿布
IT分析经典场景:数据中心容量规划
IBM Watson——基于大数据的认知计算
大数据的人才需求:大数据方案 ≠ Hadoop
大数据的人才需求:大数据总体架构 
大数据的人才培养:从云计算起源说起 
大数据的人才培养:理论结合实践 
Hadoop概述
数据存储与分析
数据的并行访问
Hadoop的核心组件
Hadoop的基本特征
Hadoop的生态圈
Hadoop与大数据
Hadoop与关系型数据库
Hadoop发展简史
开源项目注意事项
组织结构
技术路线把控
协议与授权
构建Hadoop集群
集群安装与配置
SSH的配置
Hadoop的配置
安全相关的考虑
集群性能指标
云上的Hadoop


第2部分

MapReduce与HDFS MapReduce
什么是MapReduce
使用MapReduce进行数据分析
MapReduce横向扩展
MapReduce数据流
Combine函数
MapReduce 2.0
非Java语言支持
实践:基于Eclipse的Hadoop开发环境搭建
实践:使用MapReduce编写北京市小汽车摇号中签姓名统计程序
实践:编写MapReduce程序的单元测试程序
实践:编写MapReduce程序的驱动程序
实践:在单机环境下运行MapReduce程序
实践:使用Ant脚本部署MapReduce程序并在分布式环境下运行
实践:使用Hadoop Web控制台查看作业输出
HDFS(2小时讲授)
什么是HDFS
HDFS的优势与劣势
HDFS的数据块
Namenode与Datanode
Hadoop客户端
Namenode的高可用
Hadoop支持的各种文件系统
Hadoop支持的各种接口
文件读取的数据流
文件写入的数据流
网络拓扑与hadoop
CAP定理在Hadoop中的展现:一致性模型与应用注意事项
distcp并行复制
集群的均衡
文件的归档
实践:编写Hadoop程序打印系统配置
实践:编写Hadoop程序将本地文件拷贝到HDFS上
实践:编写Hadoop程序显示文件内容
实践:编写Hadoop程序列出文件状态


第3部分
Pig,Hive,Sqoop Pig Latin及其使用
Pig 设计的目标
Pig Latine介绍
Pig关键性技术
Pig的实用案例
HIVE:分布式环境下的数据分析平台
MapReduce与关系型数据模型
什么是HIVE
HIVE系统架构
HIVE数据模型
HIVE数据类型
HIVE查询语言
HIVE查询实例与应用场景
HIVE列存储的优劣
HIVE的扩展属性
Sqoop
什么是Sqoop
导入数据的数据流
导入数据的查询划分
直接模式数据导入
使用导入的数据
导入数据到HIVE
大对象
导出数据的数据流
导出与事物
关系型数据库与大数据系统进行数据迁移的注意事项
  
第4部分

流数据处理,
高可用配置管理与跨平台数据迁移工具 HBASE:非结构化数据NOSQL平台
Hbase概述
HBase的数据模型
HBase的实现
HBase的运行时
服务器的写操作与宕机恢复
服务器的读操作
使用hbase shell进行表相关操作
通过Java客户端实现表相关操作
通过MapReduce程序实现数据处理
将数据加载到HBase中
数据加载的性能
HBase与关系型数据库
Hadoop用户在HBase的常见问题
分布式流数据处理
Storm概述
Storm的拓扑组成
Storm的简单实例与应用
Spark概述
Spark计算模型
Spark工作机制
Spark实例
ZooKeeper:分布式环境下的高可用架构
什么是ZooKeeper
分布式环境的部分失效
ZooKeeper的特点
一个分布式的问题
ZooKeeper的组、成员与节点
实践:编写程序创建组、加入组、列出组成员与删除组
分布式问题的回顾
ZooKeeper服务的数据模型
ZooKeeper服务的操作类型
ZooKeeper服务的高可用
ZooKeeper服务的一致性
实践:编写程序使用ZooKeeper构建高可靠的分布式配置服务
使用ZooKeeper时的异常处理
使用ZooKeeper实现锁服务
更多的分布式数据结构和协议



 

android开发板
linux_android开发板
fpga图像处理
曙海培训实验设备
fpga培训班
 
本课程部分实验室实景
曙海实验室
实验室
曙海培训优势
 
  备案号:沪ICP备08026168号 .(2014年7月11)...................
友情链接:Cadence培训 ICEPAK培训 EMC培训 电磁兼容培训 sas容培训 罗克韦尔PLC培训 欧姆龙PLC培训 PLC培训 三菱PLC培训 西门子PLC培训 dcs培训 横河dcs培训 艾默生培训 robot CAD培训 eplan培训 dcs培训 电路板设计培训 浙大dcs培训 PCB设计培训 adams培训 fluent培训系列课程 培训机构课程短期培训系列课程培训机构 长期课程列表实践课程高级课程学校培训机构周末班培训 南京 NS3培训 OpenGL培训 FPGA培训 PCIE培训 MTK培训 Cortex训 Arduino培训 单片机培训 EMC培训 信号完整性培训 电源设计培训 电机控制培训 LabVIEW培训 OPENCV培训 集成电路培训 UVM验证培训 VxWorks培训 CST培训 PLC培训 Python培训 ANSYS培训 VB语言培训 HFSS培训 SAS培训 Ansys培训 短期培训系列课程培训机构 长期课程列表实践课程高级课程学校培训机构周末班 曙海 教育 企业 培训课程 系列班 长期课程列表实践课程高级课程学校培训机构周末班 短期培训系列课程培训机构 曙海教育企业培训课程 系列班