4

分钟

让你了解什么是云计算&大数据
错过2009年Android强势崛起,与高薪失之交臂
误判2012年iOS大火,与高薪迎面不相逢
云计算大潮席卷全球IT行业,云计算人才千金难求
如果再次错失尚学堂云计算班,活该你拿不到高薪 咨询解决方案
2013
2014
2015
621亿元
1098亿元
1404亿元
已达
已达
已达
作为中国官方重点扶持的战略性新兴产业,云计算产业已逐步从 概念走向落地,“大数据,虚拟化,高并发”三大热门领域得到 了广泛关注和重视,90%企业都在用云计算。 咨询职业规划方案
内容覆盖广
要学-就要学全!别的培训机构学习大数据只是单纯的去学习Hadoop,而在尚学堂,你不但要深入学习Hadoop,你还要学习高并发,storm,spark,
openstack,nosql等高新技术
真实实战项目
要学-就要会用!我们的课程设计贴近企业使用需求,采用真实企业项目案例,在架构案例中,真正学会怎么去使用这些技术。
老师真实演练
要学-就要学会!我们全套课程授课方式采用真实实战演练讲解,代码手把手传授,不是照着ppt念。保证学员打下坚实基础,进入企业迅速上手工作。
学员未毕业就拿到多份月薪过万offer,我们的学员就是这么任性!
  • http://www.liepin.com
  • http://www.zhaopin.com
  • http://www.zhaopin.com
姓名
就业单位
月薪
地点
就业时间
  • 杨*
    上海**星科技有限公司
    15000
    上海
    曲阜师范大学
  • 王*
    杭州**信息技术有限公司
    11000
    杭州
    安阳工学院
  • 刘**
    中科****方案事业部·
    16000
    上海
    佳木斯大学
  • 栗**
    上海**软有限公司
    12000
    上海
    燕山大学
  • 霍**
    中**有限公司事业部
    13000
    上海
    洛阳理工学院
  • 于**
    杭州**科技有限公司
    14000
    杭州
    河北工程职业技术学院
  • 李*
    上海中**科技信息有限公司
    16000
    上海
    山西大同大学
  • 王**
    中***解决事业部
    13000
    上海
    廊坊燕京职业技术学校
  • 高**
    中科***有限公司
    13000
    上海
    周口师范学院
  • 常**
    中***解决事业部
    16000
    上海
    山西大同大学
  • 佟*
    上海**软件有限公司
    13000
    上海
    秦皇岛职业技术学校
  • 吴**
    上海联*软件有限公司
    15000
    上海
    西安航空学院
  • 张*
    上海**软件有限公司
    14000
    杭州
    天津农学院
  • 张**
    杭州**财产保险股份有限公司
    12000
    杭州
    江南大学
  • 李**
    ***业信息技术有限公司
    13000
    上海
    河南理工大学
  • 张**
    文**辉信息技术有限公司
    11000
    上海
    吉林建筑大学城建学院
  • 路**
    上海**科技有限公司
    12000
    上海
    北京建筑大学
  • 穆**
    西安**软件科技有限责任公司
    12000
    上海
    石家庄铁道大学
  • 陈*
    龙道明易
    14000
    上海
    非应届
  • 连**
    龙道明易
    13000
    杭州
    非应届
  • 张**
    "中**际
    15000
    上海
    非应届
  • 王*
    中**华
    16000
    杭州
    非应届
  • 赵*
    北****
    26000
    杭州
    非应届
  • 李**
    "央**限公司
    14000
    上海
    非应届
  • 庞*
    上海东**通事业部
    15000
    上海
    非应届
  • 张*
    猎**
    18000
    上海
    非应届
  • 冯**
    "上海***有限公司
    15000
    上海
    非应届
  • 刘*
    "央**有限公司
    12000
    上海
    非应届
  • 王**
    招**公司
    13000
    上海
    非应届
  • 谢**
    杭州联**公司
    13000
    杭州
    非应届
  • 李**
    杭州***有限公司
    13000
    杭州
    非应届
  • 吴**
    马****融
    13000
    上海
    非应届
  • 刘*
    智**技有限公司
    14000
    上海
    非应届
  • 朱**
    加****
    12000
    上海
    非应届
  • 祁**
    博**软
    14000
    杭州
    非应届
  • 刘**
    中***
    16000
    杭州
    非应届
  • 李**
    杭州影****科技有限公司
    15000
    杭州
    非应届
  • 冯**
    天****
    12000
    杭州
    非应届
  • 毕**
    招****有限公司
    13000
    上海
    非应届
  • 李*
    仁****通
    13000
    上海
    非应届
  • 吴**
    北****博
    14000
    杭州
    非应届
  • 赵**
    中国****信息中心
    14000
    上海
    非应届
  • 贾**
    "亚****公司
    14000
    上海
    非应届
  • 谭*
    ****嘉科技
    16000
    上海
    非应届
  • 刘**
    "****辉科技有限公司
    14000
    上海
    非应届
  • 张*
    金******讯有限公司
    14000
    上海
    非应届
  • 刘**
    公司保密
    20000
    上海
    非应届
  • 师**
    公司保密
    12000
    杭州
    大学应届生
  • 严**
    公司保密
    14000
    上海
    大学应届生
  • 刘**
    深圳****卡世纪
    15000
    深圳
    非应届
  • 荣**
    公司保密
    16000
    上海
    非应届
  • 杨**
    公司保密
    16000
    上海
    大学应届生
  • 郭**
    炎黄新********科技有限公司
    15000
    上海
    大学应届生
  • 房**
    中******国际
    14000
    上海
    大学应届生
  • 纪**
    东华******件
    14000
    上海
    非应届
  • 孙**
    中融****信
    13000
    杭州
    大学应届生
  • 刘**
    京****东
    15000
    杭州
    非应届
  • 刘**
    东****信
    16000
    上海
    非应届
  • 梁**
    寻****药网
    16000
    上海
    大学应届生
  • 赵**
    上海索为****统技术有限公司
    15000
    上海
    非应届
  • 候**
    电信****天翼
    16000
    上海
    大学应届生
  • 肖**
    深圳彩易****网络技术有限公司
    14000
    深圳
    大学应届生
  • 李**
    即买送******有限责任公司
    15000
    杭州
    大学应届生
  • 徐**
    上海******博润科技
    13000
    上海
    大学应届生
  • 赵**
    天****大数据
    13000
    上海
    非应届
  • 蔡**
    杭州集****聚合
    17000
    杭州
    非应届
  • 范**
    蓝汛******科技
    13000
    上海
    非应届
  • 张**
    中恒****格科技
    16000
    杭州
    大学应届
  • 李**
    上海华夏威***软件科技有限公司
    13000
    上海
    大学应届
  • 张**
    上海融***思惟科技发展有限公司
    14000
    上海
    非应届
由于就业同学在公司担任要职,属于隐私,部分信息隐藏。
大数据高手班课程大纲

第一阶段:Linux + 高并发 + Hadoop体系

 
Linux基础 shell编程 高并发架构 hadoop体系 HDFS mapreduce Zookeeper hive Hbase Flume Sqoop CM+CDH集群管理 项目实战一
 

第二阶段:分布式搜索

 
Lucence Elasticsearch 项目实战二
 

第三阶段:storm流式计算

 
kafka storm Redis 项目实战三
 

第四阶段:spark内存计算

 
scala编程 spark core spark sql SparkStream 项目实战四
 

第五阶段:机器学习

 
Python SparkMLlib 机器学习算法 项目实战五 总复习 就业辅导
 
 
第一阶段:linux+搜索+hadoop体系
Linux 这章是基础课程,帮大家进入大数据领域打好Linux基础,以便更好地学习Hadoop,hbase,NoSQL,Spark,Storm,docker,kvm,openstack等众多课程。因为企业中无一例外的是使用Linux来搭建或部署项目。
1) Linux的介绍,Linux的安装:VMware Workstation虚拟软件安装过程、CentOS虚拟机安装过程
2) 了解机架服务器,采用真实机架服务器部署linux
3) Linux的常用命令:常用命令的介绍、常用命令的使用和练习
4) Linux系统进程管理基本原理及相关管理工具如ps、pkill、top、htop等的使用;
5) Linux启动流程,运行级别详解,chkconfig详解
6) VI、VIM编辑器:VI、VIM编辑器的介绍、VI、VIM扥使用和常用快捷键
7) Linux用户和组账户管理:用户的管理、组管理
8) Linux磁盘管理,lvm逻辑卷,nfs详解
9) Linux系统文件权限管理:文件权限介绍、文件权限的操作
10) Linux的RPM软件包管理:RPM包的介绍、RPM安装、卸载等操作
11) yum命令,yum源搭建
12) Linux网络:Linux网络的介绍、Linux网络的配置和维护
13) Shell编程:Shell的介绍、Shell脚本的编写
14) Linux上常见软件的安装:安装JDK、安装Tomcat、安装mysql,web项目部署
大型网站
高并发处理
通过本章的学习大家将会了解大数据的源头,数据从何而来,继而更好的了解大数据。并且通过学习何果处理大型网站高并发问题反向更深入的学习了Linux,同时站在了更高的角度去触探了架构。
1) 负载均衡
    a) Nginx    b) Apache
2) Tomcat、jvm优化提高并发量
3) 缓存优化
    a) Java缓存框架
        i. Oscache,ehcache
    b) 缓存数据库
        i. Redis,Memcached
4) nginx+tomcat+redis|memcache构建负载均衡千万并发处理
Hadoop
离线计算大纲
一、初识hadoop 听过大数据,必听过hadoop,此部分带领大家了解hadoop的用途,在大数据中的用途,以及快速搭建一个hadoop的实验环境,在本过程中不仅将用到前面的Linux知识,而且会对hadoop的架构有深入的理解,并为你以后架构大数据项目打下坚实基础。
1) Hadoop生态环境介绍
2) Hadoop云计算中的位置和关系
3) 国内外Hadoop应用案例介绍
4) Hadoop 概念、版本、历史
5) Hadoop 核心组成介绍及hdfs、mapreduce 体系结构
6) Hadoop 的集群结构
7) Hadoop 伪分布的详细安装步骤
8) 通过命令行和浏览器观察hadoop
二、 HDFS体系结构和shell以及java操作 详细剖析HDFS,从知晓原理到开发网盘的项目让大家打好学习大数据的基础,大数据之于分布式,分布式学习从学习分布式文件系统(HDFS)开始。
1) HDFS底层工作原理
2) HDFS datanode,namenode详解
3) Hdfs shell
4) Hdfs java api
三、 详细讲解Mapreduce Mapreduce可以说是任何一家大数据公司都会用到的计算框架,也是每个大数据工程师应该熟练掌握的,此处的学习除了老师详细的讲解理论外,会通过大量的案例让大家彻底掌握。
1) Mapreduce四个阶段介绍
2) Writable
3) InputSplit和OutputSplit
4) Maptask
5) Shuffle:Sort,Partitioner,Group,Combiner
6) Reducer
四、 Mapreduce案例案例
1) 二次排序
2) 倒排序索引
3) 最优路径
4) 电信数据挖掘之-----移动轨迹预测分析(中国棱镜计划)
5) 社交好友推荐算法
6) 互联网精准广告推送 算法
7) 阿里巴巴天池大数据竞赛 《天猫推荐算法》案例
8) Mapreduce实战pagerank算法
五、 Hadoop2.x集群搭建 前面带领大家开发了大量的MapReduce程序,此部分将带来大家让开发的程序运行在分布式集群中,并且运行在健壮高可用的集群中。
1) Hadoop2.x集群结构体系介绍
2) Hadoop2.x集群搭建
3) NameNode的高可用性(HA)
4) HDFS Federation
5) ResourceManager 的高可用性(HA)
6) Hadoop集群常见问题和解决方法
7) Hadoop集群管理
分布式数据库
Hbase
大数据中使用Hbase的案例多的举不胜举,也可凸显大家学习的必要性。即使工作多年的大数据工程师Hbase的优化也是需要好好学习的重点。
1) HBase定义
2) HBase与RDBMS的对比
3) 数据模型
4) 系统架构
5) HBase上的MapReduce
6) 表的设计
7) 集群的搭建过程讲解
8) 集群的监控
9) 集群的管理
10) HBase Shell以及演示
11) Hbase 树形表设计
12) Hbase 一对多 和 多对多 表设计
13) Hbase 微博 案例
14) Hbase 订单案例
15) Hbase表级优化
16) Hbase 写数据优化
17) Hbase 读数据优化
数据仓库Hive Hive是使用sql进行计算的hadoop框架,工作中最常用到的部分,也是面试的重点,此部分大家将从方方面面来学习Hive的应用,任何细节都将给大家涉及到。
1) 数据仓库基础知识
2) Hive定义
3) Hive体系结构简介
4) Hive集群
5) 客户端简介
6) HiveQL定义
7) HiveQL与SQL的比较
8) 数据类型
9) 外部表和分区表
10) ddl与CLI客户端演示
11) dml与CLI客户端演示
12) select与CLI客户端演示
13) Operators 和 functions与CLI客户端演示
14) Hive server2 与jdbc
15) 用户自定义函数(UDF 和 UDAF)的开发与演示
16) Hive 优化
数据迁移工具
Sqoop
sqoop适用于关系型数据库和HDFS分布式数据系统之间进行数据转换,在企业中,是构建数据仓库的一大工具。
1) 介绍 和 配置Sqoop
2) Sqoop shell使用
3) Sqoop-import
    a) DBMS-hdfs     b) DBMS-hive     c) DBMS-hbase
4) Sqoop-export
Flume分布式
日志框架
Flume最早是Cloudera提供的日志收集系统,目前是Apache下的一个孵化项目,Flume支持在日志系统中定制各类数据发送方,用于收集数据。大家学习完此节后不但可以掌握Flume的使用,而且可以进行对于Flume的开发。
1) flume简介-基础知识
2) flume安装与测试
3) flume部署方式
4) flume source相关配置及测试
5) flume sink相关配置及测试
6) flume selector 相关配置与案例分析
7) flume Sink Processors相关配置和案例分析
8) flume Interceptors相关配置和案例分析
9) flume AVRO Client开发
10) flume 和kafka 的整合
Zookeeper
开发
Zookeeper在分布式集群(Hadoop生态圈)中的地位越来越突出,对分布式应用的开发也提供了极大便利,这也是这里我们带领大家深入学习 Zookeeper的原因。本课程主要内容包括Zookeeper深入、客户端开发(Java编程,案例开发)、日常运维、Web界面监控。大家这里学好Zookeeper,对后面学习其他技术至关重要。
1) Zookeeper java api开发
2) Zookeeper rmi高可用分布式集群开发
3) Zookeeper redis高可用监控实现
4) Netty 异步io通信框架
5) Zookeeper实现netty分布式架构的高可用
项目实战 某大型电商日志分析和订单管理 在实战中学习,技术点非常多,怎么样实际运用这些点是我们在自学过程中体验不到的。电商日志分析包括:pv、uv,跳出率,二跳率、广告转化率、搜索引擎优化等,订单模块有:产品推荐,商家排名,历史订单查询,订单报表统计等。
项目技术架构体系:
a) Web项目和云计算项目的整合
b) Flume通过avro实时收集web项目中的日志
c) 数据的ETL
d) Hive 批量 sql执行
e) Hive 自定义函数
f) Hive和hbase整合。
g) Hbase 数据支持 sql查询分析
h) Mapreduce数据挖掘
i) Hbase dao处理
j) Sqoop 在项目中的使用。
k) Mapreduce 定时调用和监控
 
 
第二阶段:分布式搜索
Lucene
机器学习
在大数据里面文本数据的搜索是很重要的一块,特别是里面的分词技术,是后面机器学习里面文本挖掘的基石,我们需要深入学习java领域里面的搜索核心技术lucene,同时也可以了解到百度 google这样的搜索系统是怎么架构实现的。
1) Lucene介绍
2) Lucene 倒排索引原理
3) 建索引 IndexWriter
4) 搜索 IndexSearcher
5) Query
6) Sort和 filter
7) 索引优化和高亮
ElasticSearch 把lucene技术比如为发动机,那ES就是一辆成型的汽车了。学习完ES可以帮助你在企业里面快速的架构搜索系统。首先ES是基于Lucene做的,Lucene是一套信息检索工具包,但并不包含搜索引擎系统,它包含了索引结构、读写索引工具、相关性工具、排序等功能,因此在使用Lucene时你仍需要关注搜索引擎系统,例如数据获取、解析、分词等方面的东西。而ES的目标是打造一款企业级的搜索引擎系统,因此它更接近于我们认识到的搜索引擎系统,它是一个搜索引擎服务,通过各种API可以让你的应用使用搜索服务,而不需要将搜索逻辑耦合在应用中。
1) es简介与部署
2) es的restfulAPI使用
3) es的head插件安装与使用
4) es的kibana插件安装与使用
5) 中文分词器介绍
6) API介绍
7) es脑裂问题
8) es性能优化
项目实战 百度网站搜索项目模拟百度实现在亿级别的海量数据中快速检索出网页(秒级别),并结合hbase 实现二级索引功能。
项目技术架构体系:
a) 分布式搜索 elasticsearch
b) 数据采集 使用wget进行爬取(爬虫)
c) 数据库 Hbase
d) Web框架 SpringMVC 和 Spring
 
 
第三阶段:storm流式计算
redis缓存
1) redis特点、与其他数据库的比较
2) 如何安装redis
3) 如何使用命令行客户端
4) redis的字符串类型
5) redis的散列类型
6) redis的列表类型
7) redis的集合类型
8) 如何使用java访问redis【a.python访问redis,scala访问redis】
9) redis的事务(transaction)
10) redis的管道(pipeline)
11) redis持久化(AOF+RDB)
12) redis优化
13) redis的主从复制
14) redis的sentinel高可用
15) twemproxy,codis实战
16) redis3.x集群安装配置
Kafka课程 Kafka是当下流行的队列,可以说是从数据采集到大数据计算承上启下的重要环节,大家在此部分将会详细学习它的架构,kafka在大家大数据的项目中几乎都会涉及到。
1) kafka是什么
2) kafka体系结构
3) kafka配置详解
4) kafka的安装
5) kafka的存储策略
6) kafka分区特点
7) kafka的发布与订阅
8) zookeeper协调管理
9) java编程操作kafka
10) scala编程操作kafka
11) flume 和kafka 的整合
12) Kafka 和storm 的整合
Storm
实时数据处理
本部分学习过后,大家将全面掌握Storm内部机制和原理,通过大量项目实战,让大家拥有完整项目开发思路和架构设计,掌握从数据采集到实时计算到数据存储再到前台展示,所有工作一个人搞定!譬如可以一个人搞定淘宝双11大屏幕项目!不光从项目的开发的层次去实现,并可以从架构的层次站在架构师的角度去完成一个项目。
项目技术架构体系:
1) Storm的基本概念
2) Storm的应用场景
3) Storm和Hadoop的对比
4) Storm集群的安装的linux环境准备
5) zookeeper集群搭建
6) Storm集群搭建
7) Storm配置文件配置项讲解
8) 集群搭建常见问题解决
9) Storm常用组件和编程API:Topology、 Spout、Bolt
10) Storm分组策略(stream groupings)
11) 使用Strom开发一个WordCount例子
12) Storm程序本地模式debug、Storm程序远程debug
13) Storm事物处理
14) Storm消息可靠性及容错原理
15) Storm结合消息队列Kafka:消息队列基本概念(Producer、Consumer、Topic、Broker等)、消息队列Kafka使用场景、Storm结合Kafka编程API
16) Storm Trident概念
17) Trident state 原理
18) Trident开发实例
19) Storm DRPC(分布式远程调用)介绍
20) Storm DRPC实战讲解
21) Storm和Hadoop 2.x的整合:Storm on Yarn
Storm开发实战: Kafka+Storm+Hbase+redis项目实战,以及多个案例
项目实战 中国移动基站保障平台 一个市级移动公司,每天的产生海量话务数据(一线城市更高),通过大数实时分析,监控每个基站的掉话率,基站通话总数,基站掉话总数,基站告警,3g/4g上网流量实时监控。对以上维度进行实时分析以达到对基站工作情况的监控。
项目技术架构体系:
Storm+hbase+kafka+flume+echarts
a) flume实时采集日志
b) kafka缓冲队列
c) storm实时处理
d) Hbase dao存储处理结果
e) 前端Web实时展示报表
 
 
第四阶段:spark内存计算
Scala课程 在此部分内,将更注重scala的各种语言规则与简单直接的应用,而不在于其是如何具体实现,通过学习本课程能具备初步的Scala语言实际编程能力。本部分课程也可以视为大家下面学习Spark课程的铺垫,供大家扫盲熟悉Scala,提前进行热身运动。
1) scala解释器、变量、常用数据类型等
2) scala的条件表达式、输入输出、循环等控制结构
3) scala的函数、默认参数、变长参数等
4) scala的数组、变长数组、多维数组等
5) scala的映射、元组等操作
6) scala的类,包括bean属性、辅助构造器、主构造器等
7) scala的对象、单例对象、伴生对象、扩展类、apply方法等
8) scala的包、引入、继承等概念
9) scala的特质
10) scala的操作符
11) scala的高阶函数
12) scala的集合
13) scala数据库连接
Spark SQL
1)SparkSQL介绍
2) Spark On Hive 和 Hive On Spark 区别
3) DataFrame 与 DataFrame的几种创建方式
4)序列化问题
5) Spark On Hive 配置
6) 自定义函数(UDF与UDAF)
7) 开窗函数
Spark Streaming
实时计算
1) Spark Streaming:数据源和DStream
2) 无状态transformation与有状态transformation
3) Streaming Window的操作
4) sparksql 编程实战
5) spark的多语言操作
6) spark最新版本的新特性
项目实战 智慧城市大数据分析项目 城市中每时每刻都会产生海量数据,应用数据挖掘、机器学习和可视化技术,分析出的数据可以改进城市规划,缓解交通拥堵,抓捕罪犯。项目会使用真实的数据。 涉及到所学知识如下:
项目技术架构体系:
a) 实时流处理 Kafka,Spark Streaming
b) 分布式运算 Hadoop,Spark
c) 数据库 Hbase,Redis
d) 前台web展示数据 Struts2,echart
 
 
第五阶段:机器学习
Python 课程 Python语言的部分大家在学习后可以完全掌握Python的精髓,并通过这部分的学习给大家打好一个基础,在其他计算框架中多语言的使用上都会涉及到Python这门流行的语言。大数据开发中也会经常用到python语言写脚本
1) 介绍Python以及特点
2) Python的安装
3) Python基本操作(注释、逻辑、字符串使用等)
4) Python数据结构(元组、列表、字典)
5) 使用Python进行批量重命名小例子
6) Python常见内建函数
7) 更多Python函数及使用常见技巧
8) 异常
9) Python函数的参数讲解
10) Python模块的导入
11) Python中的类与继承
12) 数据库连接,以及pip安装模块
Spark MLlib
机器学习
这里大家将会学习机器学习工具MLlib,大家不仅将会了解MLlib的组件及其调用,而且会通过Spark的项目深入了解MLlib的现实使用。通过此部分大家也可以看出课程不仅着眼于现在,更是着眼于大家的未来在行业中的发展。
1) 介绍
    a) Spark MLlib组件介绍    b) 基本数据类型
2) 回归算法
    c) 广义线性模型    d) 逻辑回归
3) 分类算法
    e) 朴素贝叶斯    f) 决策树    g) 随机森林
4) 聚类算法
    h) Kmeans    i) Sparse kmeans    j) Kmeans++    k) Kmeans II     l) Streaming kmeans
5) 关联规则
    m) Apriori    n) FPGrowth
项目实战 手机软件推荐系统项目使用数据来自某互联网平台手机助手,项目目标通过机器学习所学知识挖掘平台手机用户喜好,给用户准确推荐手机软件,类似360手机助手、华为手机助手、百度手机助手推荐功能
项目技术架构体系:
a) 分布式平台 Hadoop,Spark
b) 数据清洗 Hive
c) 特征转换与抽取 python
d) 模型训练 Mllib中的机器学习算法
e) 推荐服务 Dubbox

电话咨询

客服热线服务时间

周一至周五 9:00-21:00

周六至周日 9:00-18:00

咨询电话

021-67690939
15201841284

微信扫一扫