曙海科技
全国报名免费热线:4008699035 微信:shuhaipeixun
或15921673576/13918613812(微信同号) QQ:1299983702
首页 课程表 在线聊 报名 讲师 品牌 QQ聊 活动 就业
 
大数据分析师培训课程

 
  班级规模及环境--热线:4008699035 手机:15921673576/13918613812( 微信同号)
      每个班级的人数限3到5人,互动授课, 保障效果,小班授课。
  上间和地点
上部份地点:【上海】同济大学(沪西)/新城金郡商务楼(11号线白银路站)【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院【北京分部】:北京中山/福鑫大楼【南京分部】:金港大厦(和燕路)【武汉分部】:佳源大厦(高新二路)【成都分部】:领馆区1号(中和大道)【沈阳分部】:沈阳理工大学/六宅臻品【郑州分部】:郑州大学/锦华大厦【石家庄分部】:河北科技大学/瑞景大厦
近开间(周末班/连续班/晚班):即将开课,详情请咨询客服。(欢迎您垂询,视教育质量为生命!)
  实验设备
    ◆小班教学,教学效果好
       
       ☆注重质量☆边讲边练

       ☆合格学员免费推荐工作
       ★实验设备请点击这儿查看★
  质量保障

       1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听;
       2、课程完成后,授课老师留给学员手机和Email,保障培训效果,免费提供半年的技术支持。
       3、培训合格学员可享受免费推荐就业机会。☆合格学员免费颁发相关工程师等资格证书,提升职业资质。专注高端技术培训15年,曙海学员的能力得到大家的认同,受到用人单位的广泛赞誉,曙海的证书受到广泛认可。

部份程大纲
 

01章大数据前沿应用与Hadoop环境搭建
01-01大数据行业前沿应用与知识介绍
01-02大数据分析师课程安排
01-03Linux入门基础
01-04Hadoop入门介绍
01-05Hadoop单机环境搭建
01-06Hadoop伪分布式集群搭建
01-07Hadoop完全分布式集群搭建
02章Hadoop核心组建使用方法
01-01分布式文件系统HDFS架构原理及常用指令
01-02HDFS编程入门
01-03Hbase编程入门
01-04分布式数据仓库Hive架构原理及HQL语法介绍
01-05分布式计算引擎MapReduce架构原理及基本使用方法
01-06资源调度器YARN基本原理
01-07ETL工具Sqoop使用方法
03章分布式计算引擎Spark入门
01-01Scala语法知识介绍
01-02 Spark架构特点及基本原理
01-03Spark入门及安装部署方法
01-04Spark Core介绍
01-05Spark SQL介绍与数据读取、保存方法
01-06Spark GraphX入门及基本使用方法
01-07Spark GraphX图计算算法案例
04章Spark核心组件的使用方法
01-01日志采集系统Flume和分布式消息队列Kafka入门
01-02流式计算框架Spark Streaming基本原理及使用方法
01-03流式计算框架Structured Streaming基本原理及使用方法
01-04分布式算法库Spark MlLib入门介绍
01-05Spark ML与Spark MLLib
01-06机器学习工作流
05章Python入门与数据清洗
01-01Python编程基础:基本数据结构
01-02Python编程基础:常用控制语句
01-03NumPy基本数据结构和常用操作
01-04Pandas基本数据结构和常用操作
01-05Python数据清洗综合案例
06章大数据分析之数据统计学基础
01-01概率论与数理统计基础知识
01-02数据探索与描述性统计分析
01-03常用统计量的解释与使用
01-04参数估计方法:点估计和区间估计
01-05假设检验基本原理和应用
01-06方差分析基本原理和应用
07章Pyspark基础知识
01-01Spark数据结构及编程语言接口
01-02PySpark开发环境搭建
01-03PySpark编程入门:Spark基本数据结构
01-04PySpark编程入门:PySpark常用语句
01-05Spark与分布式数据库和分布式数据仓库的集成方法
01-06采用PySpark读取分布式数据库中数据
01-07 PySpark数据清洗案例
08章PySpark机器学习-Part1
01-01机器学习入门
01-02PySpark基于Spark ML的特征抽取、转化和选择方法
01-03近邻分类器KNN基本原理及ML实现
01-04聚类分析基本原理
01-05K-Means快速聚类基本原理
01-06K-Means快速聚类的Spark ML实现方法
01-07高斯混合模型(GMM)聚类算法的Spark实现
09章PySpark机器学习-Part2
01-01Spark MLLib统计分析
01-02线性回归基本原理
01-03线性回归的Spark ML实现方法
01-04对数几率分布于Sigmoild函数
01-05逻辑回归基本原理
01-06逻辑回归的Spark ML实现方法
10章PySpark机器学习-Part3
01-01决策树模型的基本原理
01-02决策树的Spark ML实现方法
01-03随机森林基本原理
01-04随机森林的Spark ML实现方法
01-05关联规则算法入门:Apriori算法基本原理
01-06利用FP-Growth挖掘关联规则
01-07FP-Growth算法的Spark ML实现方法
01-08带时序关系的关联规则挖掘算法Pre-FixSpan基本原理
01-09Pre-FixSpan的Spark ML实现方法
11章PySpark机器学习-Part4与综合案例
01-01协同过滤在Spark ML中的实现方法
01-02Spark机器学习流构建方法
01-03Spark机器学习模型超参数调优方法
01-04Spark机器学习模型自动选择方法
01-05PySpark综合案例

 

-

 

  备案号:沪ICP备08026168号 .(2014年7月11)...............