曙海科技
全国报名免费热线:4008699035 微信:shuhaipeixun
或15921673576/13918613812(微信同号) QQ:1299983702
首页 课程表 在线聊 报名 讲师 品牌 QQ聊 活动 就业
 
Spark机器学习库 大数据开发培训

 
  班级规模及环境--热线:4008699035 手机:15921673576/13918613812( 微信同号)
      每个班级的人数限3到5人,互动授课, 保障效果,小班授课。
  上间和地点
上部份地点:【上海】同济大学(沪西)/新城金郡商务楼(11号线白银路站)【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院【北京分部】:北京中山/福鑫大楼【南京分部】:金港大厦(和燕路)【武汉分部】:佳源大厦(高新二路)【成都分部】:领馆区1号(中和大道)【沈阳分部】:沈阳理工大学/六宅臻品【郑州分部】:郑州大学/锦华大厦【石家庄分部】:河北科技大学/瑞景大厦
近开间(周末班/连续班/晚班):2019年1月26日
  实验设备
    ◆小班教学,教学效果好
       
       ☆注重质量☆边讲边练

       ☆合格学员免费推荐工作
       ★实验设备请点击这儿查看★
  质量保障

       1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听;
       2、课程完成后,授课老师留给学员手机和Email,保障培训效果,免费提供半年的技术支持。
       3、培训合格学员可享受免费推荐就业机会。☆合格学员免费颁发相关工程师等资格证书,提升职业资质。专注高端技术培训15年,曙海学员的能力得到大家的认同,受到用人单位的广泛赞誉,曙海的证书受到广泛认可。

部份程大纲
 
  • 第1章 初识机器学习
    在本章中将带领大家概要了解什么是机器学习、机器学习在当前有哪些典型应用、机器学习的核心思想、常用的框架有哪些,该如何进行选型等相关问题。
  • 1-1 导学
    1-2 机器学习概述
    1-3 机器学习核心思想
    1-4 机器学习的框架与选型..
    第2章 初识MLlib
    本章中,将介绍Spark的机器学习库,对比Spark当前两种机器学习库(MLLib/ML)的区别,同时介绍Spark机器学习库的应用场景以及行业应用优势。
  • 2-1 MLlib概述
    2-2 MLlib的数据结构
    2-3 MLlib与ml
    2-4 MLlib的应用场景
    第3章 实战环境搭建
    本章中,将介绍如何进行实战环境搭建。包括如何完成Spark环境安装配置、如何通过Spark Shell进行编程,并通过 Wordcount 入门程序,完成部署和测试。
  • 3-1 Spark环境安装
    3-2 Spark配置若干要点
    3-3 学习Spark shell
    3-4 实战Wordcount
    第4章 数据可视化
    本章中,将对数据可视化进行介绍,告诉大家什么是数据可视化,我们通过数据可视化能对大数据系统起到怎样的作用,并结合 Echars 介绍了如何实现常见的数据可视化图表(折线图、柱状图、散点图)。
  • 4-1 数据可视化的作用及常用方法
    4-2 初识Echarts
    4-3 通过Echarts实现图表化数据展示
    第5章 Spark的矩阵与向量
    本章中,将讲解矩阵与向量的一些基本运算,并介绍Spark的矩阵与向量的操作,帮助数据基础薄弱的同学补齐短板。
  • 5-1 矩阵与向量介绍
    5-2 Spark中实践向量的使用
    5-3 Spark中实践矩阵的使用
    第6章 Spark基础统计模块
    本章中,将概要介绍Spark的基础统计模块、简单的统计学知识、相关系数以及假设检验的知识,拓展大家的技术视野。
  • 6-1 基础统计模块及常用统计学知识介绍
    6-2 实战统计汇总
    6-3 学习相关系数
    6-4 学习假设检验
    第7章 Spark实现回归算法
    本章中,将讲解几种常见的回归算法,并以预测房价模型为例,教大家如何使用回归算法来实现简单的预测。
  • 7-1 回归分析概述
    7-2 线性回归算法概述
    7-3 线性回归算法原理
    7-4 小二乘法
    7-5 随机梯度下降
    7-6 实战Spark预测房价---项目展示及代码概览
    7-7 实战Spark预测房价---数据加载及转换
    7-8 实战Spark预测房价--训练与预测
    7-9 逻辑回归算法及原理概述
    7-10 正则化原理
    7-11 实战Spark逻辑回归
    7-12 保序回归算法概述
    7-13 保序回归算法原理
    7-14 实战一个保序回归数据分析
    第8章 Spark实现分类算法
    本章中,将几种常见的分类算法,并结合鸢尾花数据集为例,讲解分类算法在Spark上的实践。同时,比较各种分类算法的区别,使大家能够合理选择应该使用的算法。
  • 8-1 朴素贝叶斯算法及原理概述
    8-2 实战朴素贝叶斯的分类
    8-3 支持向量机概述
    8-4 实战基于SVM的分类
    8-5 决策树算法及原理概述
    8-6 实战基于决策树的分类--案例1
    8-7 实战基于决策树的分类--案例2
    8-8 本章小结
    8-9 关于数据归一化的介绍
    第9章 Spark实现聚类算法
    本章中,将介绍聚类算法,并通过比较聚类算法与分类算法的区别,帮助大家了解聚类算法的内在含义。此处,仍然使用鸢尾花数据集应用聚类算法进行分析,便于大家对比发现聚类算法与分类算法的区别与联系,以便于后期灵活运用。...
  • 9-1 Kmeans算法概述
    9-2 Kmeans算法原理
    9-3 Kmeans算法实战
    9-4 LDA算法概述
    9-5 LDA算法原理
    9-6 LDA算法实践
    9-7 本章小结
    第10章 Spark实现降维
    本章中,将通过讲解PCA算法的原理,使大家明白降维算法的大致原理,以及能够实现怎么样的功能。结合应用降维算法在分类算法使用之前进行预处理的实践,帮助大家体会算法的作用。
  • 10-1 PCA算法及原理概述
    10-2 实战PCA算法实现降维
    10-3 本章小结
    第11章 Spark实践文本情感分类
    本章中,将结合前述知识进行综合实战,以达到所学即所用。文本情感分类这个项目会将分类算法、文本特征提取算法等进行关联,使大家能够对Spark的具体应用有一个整体的感知与了解。
  • 11-1 项目总体概况
    11-2 数据集概述
    11-3 数据预处理
    11-4 文本特征提取
    11-5 训练分类模型
    11-6 本章小结
    第12章 Spark实践推荐系统
    本章中,将结合前述知识进行综合实战,以达到所学即所用。在推荐系统项目中,讲解了推荐系统基本原理以及实现推荐系统的架构思路,有其他相关研发经验基础的同学可以结合以往的经验,实现自己的推荐系统。
  • 12-1 推荐系统简介
    12-2 推荐系统原理
    12-3 推荐系统实战(上)
    12-4 推荐系统实战(下)
 

-

 

  备案号:沪ICP备08026168号 .(2014年7月11)..............