全套大数据视频教程

2020年,零基础就学这些

  • 大数据Hadoop教程入门
  • 云计算大数据Linux教程
  • 大数据之轻松学会Scala
  • 大数据之Zookeeper教程
  • 网站数据分析实战课程
  • 大数据Flink从入门到精通

大数据就业领域

  • 大数据开发工程师

  • 大数据架构师

  • BI开发工程师

  • 大数据算法工程师

  • Hadoop工程师

  • ETL工程师

  • 数据仓库工程师

  • Spark/Flink工程师

适合哪些人群学习

  • 应届大学毕业生

    缺乏工作经验和技能,对未来没有明确的规划,期望通过学习大数据跻身IT行业的人员

  • 预转行人员

    目前工作待遇不理想,上升空间有限或已进入职业瓶颈期,想要突破转行的人员

  • 有基础寻求提升

    具有一定的大数据技术理论基础,需要了解大数据技术在实际中如何使用的人员

  • 大数据技术爱好者

    有较强的思维逻辑能力,应对复杂业务场景处理,对大数据技术感兴趣的人员

尚学堂大数据课程

Java基础 NIO MySQL JDBC HTML5与CSS3 jQuery AJAX&JSON Servlet JSP Cookie&Session Spring SpringMVC MyBatis Maven Redis Git/Git Hub Shell Linux Hadoop Hive
Zookeeper Java8 Scala Spark Core Spark SQL Spark Streaming ElasticSearch Kafka
HBase Java9 Java10 MySQL优化 JVM原理 JUC多线程 CDH版Hadoop Impala Flume Sqoop Azkaban Oozie HUE Kettle Kylin Spark Mllib机器学习 Flink Python SpringBoot Hadoop3.x新特性 ClickHouse Kudu Presto Druid Ambari DataX Logstash Kibanna 数据结构
  • 一般机构

  • 较好机构

  • 尚学堂教育

六大企业实训项目

  • 中国银行
    审计数据集市平台新增
  • 大型电商日志分析
    和数据挖掘综合项目
  • 电信CMCC基站
    掉话率分析系统
  • 酷狗音乐
    数据中心平台新增
  • 商品推荐系统
    综合项目实施方案项目
  • Flink智慧城市
    交通数据平台新增

中国银行审计数据集市平台

项目介绍:

中国银行审计数据集市平台项目是一个集在线大数据分析、疑点扫描、风险评估、事件预警、跟踪预警、线索聚集、数据表级操作为一体的通用平台。其中主要内容包含数据仓库的建设,数据集市建设,数据流转分析等功能。本项目可以让我们学习到真正的大数据公司如何对数据仓库及数据集市平台进行设计和搭建,如何对数据进行模型化分析,此项目基于同学们掌握的大数据基础知识进行实战化训练,强化同学们对数据模型的建立。

技术架构:

  • sqoop
  • Flume
  • HDFS
  • CDH
  • Azkaban
  • Hive
  • Hbase
  • Zookeeper

大型电商日志分析和数据挖掘综合项目

项目介绍:

用户在访问 Web 站点的过程中,服务器会记录这些访问形成访问日志。对访问日志进行必要的处理可以获取大量的决策数据。就电子商务网站而言,处理网站访问日志有助于为网站的管理者提供决策支持进而指导网站运营,如改善网站结构提升用户体验;进行关键词营销提升流量、促进转化、提升效益;分析用户行为进行个性化的推荐和营销来提高网站的核心竞争力,在激烈的市场竞争中保持优势。

技术架构:

  • CDH
  • flume
  • sqoop
  • HDFS
  • Mapreduce
  • Hive
  • Hbase
  • Zookeeper
  • mysql
  • oozie

电信CMCC基站掉话率分析系统

项目介绍:

移动用户在使用移动通信的过程中,电信基站服务器会记录这些访问形成访问日志。对访问日志进行必要的处理可以获取大量的决策数据。就移动通信公司而言,处理移动通信访问日志有助于为移动通信公司的管理者提供决策支持进而指导网络运营,如改善基站部署结构提升用户体验;进行定点营销提升网络利用率、促进转化、提升效益;分析用户行为进行个性化的推荐和营销来提高移动网络的核心竞争力,在激烈的市场竞争中保持优势。

技术架构:

  • storm
  • kafka
  • flume
  • javaee

酷狗音乐数据中心平台

项目介绍:

用户在选择播放音乐或者搜索音乐时,数据平台会对用户产生的行为进行记录,同时获取操作日志详细信息,对用户行为进行必要的处理可以获取大量的决策数据。就公司核心模块而言,处理用户产生的行为事件,有助于公司产品的改良,用户体验感的提升,提高产品的核心竞争力。

技术架构:

  • CDH
  • Flume
  • sqoop
  • HDFS
  • Spark
  • Hive
  • Hbase
  • Zookeeper
  • mysql
  • yarn
  • superset
  • kylin

商品推荐系统综合项目实施方案项目

项目介绍:

根据电子商务网站推荐系统的应用场景,结合电子商务应用场景介绍推荐系统的核心问题:用户、商品以及用户和商品的关联方法,对现有的推荐算法进行总结,分析各自的优缺点和适用场景,以及常用到的数据挖掘算法。一个实际的电子商务网站中设计和实现了推荐系统,并且达到了良好的效果,提升了网站整体的转化率和用户体验。

技术架构:

  • sqoop
  • Flume
  • HDFS
  • CDH
  • Azkaban
  • Hive
  • Hbase
  • Zookeeper

Flink智慧城市交通数据平台

项目介绍:

Flink作为新兴的大数据流式计算框架,是阿里巴巴首选新一代流式计算业务场景,目前企业中对Flink流式处理技术应用正在处于快速转型过程。智慧城市交通数据平台可实现与公安交通管理综合应用平台、机动车缉查布控系统等对接,实时实现车辆登记信息查询、假牌车比对,违法证据录入后上传六合一平台,实现实时卡口及特征车牌数据上传缉查布控系统,做到数据统一分析。

技术架构:

  • Kafka
  • Flink
  • Streaming
  • Hadoop
  • Flink
  • Hbase
  • Redis
  • SSM
  • echarts

大数据优培班课程大纲

第一阶段
基础班
  • HTML
  • >
  • CSS
  • >
  • 12306案例
  • >
  • 初识Java
  • >
  • Jshell
  • >
  • 数据类型和运算符
  • >
  • idea
  • >
  • 方法
  • >
  • >
  • 对象
  • >
  • 属性
  • >
  • 构造器
  • >
  • this
  • >
  • static
  • >
  • 控制语句
  • >
  • 数组
  • >
  • 双色球案例
第二阶段
JavaSE基础架构
  • 面向对象编程
  • >
  • lambda
  • >
  • 异常机制
  • >
  • Java常用类
  • >
  • 数据结构和算法
  • >
  • 集合(容器)
  • >
  • Stream
  • >
  • IO流
  • >
  • 多线程
  • >
  • NIO
  • >
  • AIO
  • >
  • Netty
  • >
  • 网络编程
  • >
  • 服务器
  • >
  • git
  • >
  • Linux内核
  • >
  • Liunx命令操作
  • >
  • Linux Shell编写
  • >
  • Linux文件系统
  • >
  • 文本分析
  • >
  • 用户管理
  • >
  • 系统权限管理
  • >
  • 网络管理
  • >
  • Linux系统软件安装
  • >
  • Linux进程管理
  • >
  • Net网络
  • >
  • LVS
  • >
  • keepalive
  • >
  • Nginx
  • >
  • IO模型
  • >
  • DML
  • >
  • DQL
  • >
  • DCL
  • >
  • DDL
  • >
  • 简单查询
  • >
  • 连接查询和子查询
  • >
  • 索引
  • >
  • 视图
  • >
  • 事务
  • >
  • JDBC
  • >
  • DBUtil
  • >
  • 反射
  • >
  • MyBatis
  • >
  • 核心配置文件
  • >
  • Mapper
  • >
  • 动态sql+sql片段
  • >
  • 关系处理
  • >
  • 缓存
  • >
  • generator逆向工程
  • >
  • 设计模式
  • >
  • 京东商城订单管理
第三阶段
JavaEE平台
  • Bootstrap
  • >
  • Jquery
  • >
  • Vue2/3
  • >
  • Vue模板
  • >
  • Vue组件
  • >
  • Vue 路由
  • >
  • Vue Axios
  • >
  • Vue Element
  • >
  • Tomcat与HTTP
  • >
  • Maven
  • >
  • Servlet基础
  • >
  • 会话技术与Servlet域对象
  • >
  • JSP基本语法
  • >
  • JSP内建对象
  • >
  • EL+JSTL
  • >
  • Filter&Listener
  • >
  • MVC架构
  • >
  • JSON与Ajax
  • >
  • 分页技术
  • >
  • 文件上传/下载
  • >
  • SXTOA办公系统
  • >
  • Spring
  • >
  • Bean
  • >
  • IOC
  • >
  • AOP
  • >
  • 作用域
  • >
  • 整合MyBatis
  • >
  • 整合Junit
  • >
  • MVC架构
  • >
  • 手写MVC
  • >
  • Springmvc原理
  • >
  • 视图解析器
  • >
  • 拦截器
  • >
  • 容器
  • >
  • 异常处理
  • >
  • springboot
  • >
  • Spring Boot实现Spring MVC
  • >
  • 整合MyBatis
  • >
  • Druid
  • >
  • PageHelper
  • >
  • logback
  • >
  • Thymeleaf
  • >
  • 异常显示页面
  • >
  • Junit4
  • >
  • Quartz
  • >
  • 云易办
  • >
  • 项目打包部署
第四阶段
Hadoop生态体系
  • Hadoop文件处理
  • >
  • HDFS架构
  • >
  • Hadoop权限管理
  • >
  • HDFS分布式搭建
  • >
  • Hadoop3新特性
  • >
  • MapReduce
  • >
  • Yarn资源调度和任务调度
  • >
  • MapReduce源码分析
  • >
  • 案例分析
  • >
  • Hive架构原理
  • >
  • Hive集群搭建
  • >
  • HiveDML操作
  • >
  • 分区分桶
  • >
  • 拉链表
  • >
  • Hive事务
  • >
  • Hive安全管理
  • >
  • Hive存储与压缩
  • >
  • Hbase架构
  • >
  • Hbase操作
  • >
  • Hbase Java api
  • >
  • Hbase压缩与存储
  • >
  • Flume架构
  • >
  • Flume Source
  • >
  • Flume Channel
  • >
  • Flume Sink
  • >
  • Sqoop架构
  • >
  • Sqoop操作数据
  • >
  • zookeeper架构原理
  • >
  • zookeeper分布式搭建
  • >
  • ElasticSearch
  • >
  • Lucene
  • >
  • CDH
  • >
  • ClouderaManager安装与部署
  • >
  • Hue架构及原理
  • >
  • Impala机构及原理
  • >
  • Oozie架构和原理
  • >
  • bonapp餐饮数仓
第五阶段
Spark计算框架体系
  • Scala
  • >
  • Scala IDE使用
  • >
  • 类型推断
  • >
  • Scala函数与方法
  • >
  • 柯里化
  • >
  • 集合可变与不可变
  • >
  • 元组
  • >
  • 样例类
  • >
  • 模式匹配
  • >
  • Trait
  • >
  • 隐式转换
  • >
  • 隐式参数
  • >
  • 隐式值
  • >
  • 隐式类
  • >
  • Actor通信模型
  • >
  • Scala迭代器模式
  • >
  • Spark运行模式
  • >
  • Spark核心RDD
  • >
  • Spark容错
  • >
  • Spark算子操作
  • >
  • Spark持久化
  • >
  • SparkCheckpoint
  • >
  • Standalone模式资源调度和任务调度原理
  • >
  • Yarn模式资源调度和任务调度原理
  • >
  • Spark术语
  • >
  • 宽窄依赖
  • >
  • SparkStage
  • >
  • Pipeline计算模式
  • >
  • 粗粒数与细粒度资源调度
  • >
  • 推测执行
  • >
  • 二次排序
  • >
  • 分组取topN
  • >
  • Spark源码分析
  • >
  • 广播变量
  • >
  • 累加器
  • >
  • WEBUI
  • >
  • Master HA
  • >
  • SparkShuffle
  • >
  • Spark文件寻址
  • >
  • 内存管理
  • >
  • Shark
  • >
  • SparkSQL
  • >
  • 谓词下推
  • >
  • DataFrame操作
  • >
  • Spark on Hive
  • >
  • UDF
  • >
  • UDAF
  • >
  • 开窗函数
  • >
  • SparkStreaming 原理
  • >
  • 流式框架对比分析
  • >
  • 数据流程
  • >
  • 算子操作
  • >
  • 窗口操作
  • >
  • 状态管理
  • >
  • DriverHA
  • >
  • SparkStreaming与 Kafka 整合方式及版本变化对比
  • >
  • Receiver模式
  • >
  • Direct 模式
  • >
  • 手动维护offset
  • >
  • 参数配置
  • >
  • 反压机制
  • >
  • 大型电商日志分析
第六阶段
Flink框架体系
  • Flink架构原理
  • >
  • Flink实时计算框架
  • >
  • Flink计算模型
  • >
  • 无界数据流
  • >
  • 有界数据流
  • >
  • Flink-checkpoint
  • >
  • savePoint
  • >
  • Flink窗口操作
  • >
  • 容错检查点
  • >
  • Flink任务提交
  • >
  • 算子链
  • >
  • Flink集群搭建
  • >
  • Flink HA
  • >
  • 任务槽
  • >
  • Flink dataSet
  • >
  • Flink DataStream
  • >
  • Flink SQL
  • >
  • Flink on Yarn
  • >
  • Flink+Kafka整合
  • >
  • Flink广播变量
  • >
  • Flink累加器
  • >
  • Flink Time
  • >
  • Watermark
  • >
  • 并行度设置,Flink CEP
  • >
  • 智慧城市交通数据平台
第七阶段
高薪面试
  • 经典面试题讲解
  • >
  • 1V1顾问式模拟面试
  • >
  • 简历编写
  • >
  • 高薪就业
  • QQ空间

      扫描二维码
      关注上海尚学堂QQ空间

  • 微信订阅号

      扫描二维码
      关注尚学堂微信公众号

  • 在线咨询

      单老师
      15201841284

上海尚学堂校区地址:上海市浦东新区城丰路650号    咨询电话:15201841284    
上海尚学堂智能科技有限公司  版权所有Copyright 2006-2020     沪ICP备16053543号