比屋教育 大数据高薪实战班(1、2、3期)
内容简介
比屋教育,秉承“活学活用”的教育理念,集合资深专家讲师团队,依托完善的线上教学管控平台,专注于大数据、云计算、互联网架构师等领域的职业技能培训,着力培养满足互联网企业实际需求的高端人才。
资源目录
00-大数据免费课
第1章-大数据概况及Hadoop生态系统
1.什么是大数据和大数据分析.mp4
10.hdfs组件和数据备份策略.mp4
11.hdfs文件读写原理和常用命令使用.mp4
12.HDFS的java客户端.mp4
13.代码测试.mp4
14.课堂总结.mp4
2.分布式运算原理.mp4
3.hadoop的基本介绍.mp4
4.hadoop基本架构.mp4
5.hadoop生态圈介绍.mp4
6.hadoop环境搭建.mp4
7.安装环境测试和hdp环境介绍.mp4
8.Namnode和SNameNode .mp4
9.DataNode讲解.mp4
第2章-MapReduce原理及编程
1.mapreduce的基本介绍.mp4
10.hadoop数据类型.mp4
11.Mapper和Reducer讲解.mp4
12.分布式缓存和Speculative.mp4
13作业讲解.mp4
14.作业测试和总结.mp4
2.mapreduce数据分析详细介绍.mp4
3.mapreduce-wordCount需求讲解.mp4
4.mapreduce实战mapper开发.mp4
5.mapreduce实战reduce和job开发.mp4
6.程序打包运行和总结.mp4
7.案例总结和原理剖析.mp4
8.分区原理和源码分析.mp4
9.什么是逻辑块.mp4
第3章-Apache Hive基础实战
1.hive简介.mp4
10.hive的严格模式和动态分区.mp4
11.Hive数据分桶.mp4
2.hive实现WordCount及元数据管理.mp4
3.hive体系结构.mp4
4.hive数据类型和数据库操作.mp4
5.内部表和外部表的区别.mp4
6.hive外部表的详细操作.mp4
7.CTAS和CTE.mp4
8.临时表及对表的基本操作.mp4
9.hive静态分区讲解.mp4
第4章 Apache Spark基础及架构
1.Spark基本介绍.mp4
2.ApacheSpark安装配置.mp4
3.RDD的基本介绍.mp4
4.Spark案例入门.mp4
5.Spark执行流程和组建介绍.mp4
6.分区,SC,SparkSession,核心数据集.mp4
7.RDD分区,宽窄数据变换.mp4
8.windows平台配置Spark开发环境.mp4
9.RDD算子操作.mp4
第5章 Spark SQL精华及与实战
1.SparkSQL历史发展.mp4
10.自定义UDF和UDAF.mp4
2.SparkSQL执行优化策略.mp4
3.SparkSQL程序入口.mp4
4.SparkSQL案例讲解.mp4
5.DataSet案例演示.mp4
6.RDD转换DataFrame.mp4
7.RDD转换DataFrame方式二.mp4
8.加载多种数据源.mp4
9.读取mysql和hive的数据.mp4
第6章-基于Spark Streaming的流数据处理和分析
1.SparkStreming简介.mp4
2.saprkStream运行机制.mp4
3.SparkStreaming处理流程和入口.mp4
4.自定义数据源.mp4
5.updateStateByKey算子讲解.mp4
6.MapWithState算子讲解.mp4
第7章-Apache Flink基础及架构
1.ApacheFlink的简介.mp4
2.Flink架构和入门案例开发.mp4
3.Flink案例进阶之代码抽取.mp4
4.Flink核心概念行度运算和WEB监控.mp4
5.Flink集群构建.mp4
6.Flink集群模式发布和TaskSlot原理.mp4
7.Flink四种数据传输策略和四层结构图.mp4
第8章-Apache Flink高阶之状态存储-容错-数据恢复
1.状态数据丢失处理之StateBackend概述.mp4
2.StateBackends三种实现方式.mp4
3.如何实现容错和仅一次语义.mp4
4.程序自动恢复数据与核心参数剖析.mp4
5.集群模式下数据容错剖析和多备份.mp4
01-授课视频(试看)
直播授课
Video_2021-09-07_220009.mp4
线下授课
Apache Flink高阶之window分类-自定义窗口
1.window的概述和四种类型.wmv
2.window的源码理解和会话窗口案例实践.wmv
3.底层原理之自定义widnwo.wmv
4.基于Trigger和Evictor自定义窗口函数.wmv
5.增量聚合及aggregate的使用.wmv
6.全量聚合和window的4种Join实现.wmv
视频录制
Apache Hive基础实战
1.hive简介.wmv
10.hive的严格模式和动态分区.wmv
11.Hive数据分桶.wmv
2.hive实现WordCount及元数据管理.wmv
3.hive体系结构.wmv
4.hive数据类型和数据库操作.wmv
5.内部表和外部表的区别.wmv
6.hive外部表的详细操作.wmv
7.CTAS和CTE.wmv
8.临时表及对表的基本操作.wmv
9.hive静态分区讲解.wmv
大数据概况及Hadoop生态系统
1.什么是大数据和大数据分析.wmv
10.hdfs组件和数据备份策略.wmv
11.hdfs文件读写原理和常用命令使用.wmv
12.HDFS的java客户端.wmv
13.代码测试.wmv
14.课堂总结.wmv
2.分布式运算原理.wmv
3.hadoop的基本介绍.wmv
4.hadoop基本架构.wmv
5.hadoop生态圈介绍.mp4
6.hadoop环境搭建.mp4
7.安装环境测试和hdp环境介绍.wmv
8.Namnode和SNameNode .wmv
9.DataNode讲解.wmv
02-大数据架构课(1期)
第一阶段(大数据生态圈核心技术)
第10章-Apache Sqoop介绍及数据迁移
第10章-Apache Sqoop介绍及数据迁移.pdf
第12章-离线数据仓库项目实战开发
code
imgs
1.jpg
10.jpg
11.jpg
12.jpg
13.jpg
14.png
15.png
16.png
17.png
18.png
19.png
2.jpg
20.png
3.jpg
4.jpg
5.jpg
6.jpg
7.jpg
8.jpg
9.jpg
resources
数据文件1.zip
数据文件2.rar
video
1.数据仓库概述和原理.wmv
2.基于大数据构建数据仓库.wmv
3.数据仓库构建流程.wmv
4.数据仓库建模基本理论.wmv
5.完整数据仓库案例演示.wmv
第1章数据仓库项目开发.md
第1章数据仓库项目开发.pdf
第13章-离线数据仓库项目实战开发
code
imgs
1.jpg
2.jpg
3.jpg
4.jpg
5.jpg
6.jpg
resources
video
1.PB级数据仓库构建步骤.wmv
2.创建表的流程和规范.wmv
3.企业级开发规范详解.wmv
4.平台架构设计和资源评估.wmv
第2章-离线数据仓库开发.md
第2章-离线数据仓库开发.pdf
第14章-离线数据仓库项目实战开发
code
imgs
1.jpg
2.jpg
3.jpg
4.jpg
5.jpg
6.jpg
resources
video
1.ODS层数据表创建.wmv
2.ODS层数据导入.wmv
3.DWD层表创建和数据ETL.wmv
4.DWS层用户行为宽表创建.wmv
5.ADS层数据指标分析.wmv
6.ADS层数据指标分析2.wmv
7.订单拉链表设计.wmv
第3章数据仓库项目开发.md
第3章数据仓库项目开发.pdf
第1章-大数据概况及Hadoop生态系统
1.什么是大数据和大数据分析.wmv
10.hdfs组件和数据备份策略.wmv
11.hdfs文件读写原理和常用命令使用.wmv
12.HDFS的java客户端.wmv
13.代码测试.wmv
14.课堂总结.wmv
2.分布式运算原理.wmv
3.hadoop的基本介绍.wmv
4.hadoop基本架构.wmv
5.hadoop生态圈介绍.mp4
6.hadoop环境搭建.mp4
7.安装环境测试和hdp环境介绍.wmv
8.Namnode和SNameNode .wmv
9.DataNode讲解.wmv
img
1.png
10.png
11.png
12.png
13.png
14.png
15.png
2.png
3.png
4.png
5.png
6.png
7.png
8.png
9.png
第一章 大数据概况及Hadoop生态系统.md
第一章 大数据概况及Hadoop生态系统.pdf
第2章-MapReduce原理及编程
1.mapreduce的基本介绍.wmv
10.hadoop数据类型.wmv
11.Mapper和Reducer讲解.wmv
12.分布式缓存和Speculative.wmv
13作业讲解.wmv
14.作业测试和总结.wmv
2.mapreduce数据分析详细介绍.wmv
3.mapreduce-wordCount需求讲解.wmv
4.mapreduce实战mapper开发.wmv
5.mapreduce实战reduce和job开发.wmv
6.程序打包运行和总结.wmv
7.案例总结和原理剖析.wmv
8.分区原理和源码分析.wmv
9.什么是逻辑块.wmv
img
1.jpg
10.png
11.png
12.png
13.png
14.png
15.png
16.png
17.png
18.png
2.jpg
3.png
4.jpg
5.jpg
6.jpg
7.png
8.jpg
9.jpg
第二章-MapReduce原理及编程.md
第二章-MapReduce原理及编程.pdf
第3章-Apache Hive基础实战
1.hive简介.wmv
10.hive的严格模式和动态分区.wmv
11.Hive数据分桶.wmv
2.hive实现WordCount及元数据管理.wmv
3.hive体系结构.wmv
4.hive数据类型和数据库操作.wmv
5.内部表和外部表的区别.wmv
6.hive外部表的详细操作.wmv
7.CTAS和CTE.wmv
8.临时表及对表的基本操作.wmv
9.hive静态分区讲解.wmv
imgs
1.png
10.png
11.png
2.png
3.png
4.png
5.png
6.png
7.png
8.png
9.png
hive的作用.png
内部表和外部表的区别.png
案例数据结构讲解.png
第三章-Apache Hive基础实战.md
第三章-Apache Hive基础实战.pdf
第4章-Apache Hive进阶实战
1.explode和lateralView讲解.wmv
10.Hive的集合set,list.wmv
11.数据分片.wmv
12.PERCENT_RANK讲解.wmv
13.FIRST_VALUE,LAST_VALUE.wmv
14.窗口函数-行类窗口的讲解.wmv
15.范围类窗口函数.wmv
2.hive的select虚拟列和基本的Join.wmv
3.hive虚拟列和基本的数据Join.wmv
4.hive的基本join操作.wmv
5.hive的LOAD和insert的使用.wmv
6.hive的数据迁移.wmv
7.按照position进行排序.wmv
8.sortBy,DistributeBy.wmv
9.GroupBy和having.wmv
Apache Hive进阶实战.pdf
第5章-Apache Hive高级实战
1.hive的事务讲解.wmv
2.MERGE语法的使用.wmv
3.hive的自定义 函数.wmv
4.hive性能优化.wmv
5.本地运行和JVM重用.wmv
6.总结.wmv
Apache Hive高级实战.pdf
第6章-项目实战-日志数据分析
1.需求讲解和环境准备.wmv
2.日志数据ETL开发(1).mp4
3.日志数据ETL开发(2).wmv
4.日志数据ETL开发(3).wmv
5.日志数据ETL开发(4).wmv
第六章-项目实战-日志数据分析.pdf
第7章-项目实战-用户消费行为数据分析
1.项目需求和数据模型讲解.wmv
10.交易维度指标分析(6).wmv
11.商家维度指标分析(7).wmv
12.评分维度指标分析(8).wmv
13.数据可视化.wmv
2.数据清洗之数据加密和过滤.wmv
3.数据清洗2.wmv
4.客户维度数据分析.wmv
5.交易维度指标分析(1).wmv
6.交易维度指标分析(2).wmv
7.交易维度指标分析(3).wmv
8.交易维度指标分析(4).wmv
9.交易维度指标分析(5).wmv
项目实战-案例分析之消费数据_带分层.pdf
第8章-NoSQL综述和Apache HBase基础
1.NoSql的基本概念.wmv
2.Nosql的分类和存储区别.wmv
3.Hbaes介绍.wmv
4.Hbase的用例.wmv
5.Hbase的物理架构.wmv
6.Hbase表和RegionServer的关系.wmv
7.hbase的rows.wmv
8.Hbase数据管理和体系结构优势.wmv
9.Hbase的Shell操作和总结.wmv
第9章-Apache HBase API介绍及性能优化
1.Hbase的javaAPI.wmv
10.Minor和Major压缩测路,总结.wmv
2.使用java客户端插入数据.wmv
3.使用java客户端扫描数据.wmv
4.使用Java客户端删除操作.wmv
5.代码测试.wmv
6.RestAPI的使用.wmv
7.Phoenix的使用.wmv
8.使用Hive关联Hbase表.wmv
9.名称空间,授权,数据压缩.wmv
第九章-Apache HBase API介绍及性能优化.pdf
第二阶段(大数据高级开发核心技术)
kafka
1.KafkaProducer原理.wmv
1.kafka集群版安装.wmv
1.读取kafka数据消费到hbase.wmv
2.Kafka的ISR和ACKS.wmv
2.kafka集群构建.wmv
2.UserConsumer业务代码编写.wmv
3.consuler的机制.wmv
3.Kafka的主题介绍.wmv
3.代码测试.wmv
4.Kafka高效读写.wmv
5.Producer案例实现1.wmv
6.Producer案例实现2.wmv
7.代码测试.wmv
第10章-Apache Flink基础及架构
1.ApacheFlink的简介.wmv
2.Flink架构和入门案例开发.wmv
3.Flink案例进阶之代码抽取.wmv
4.Flink核心概念行度运算和WEB监控.wmv
5.Flink集群构建.wmv
6.Flink集群模式发布和TaskSlot原理.wmv
7.Flink四种数据传输策略和四层结构图.wmv
第11章-Apache Flink进阶之算子和状态管理
1.Flink自定义数据源.wmv
10.基于状态的数据合并案例开发.wmv
2.Flink常规算子讲解.wmv
3.Flink核心算子讲解.wmv
4.Sink操作及托管状态和原始状态.wmv
5.OperatorState和KeyedState.wmv
6.ValueState状态案例演示.wmv
7.KeyedState之ListState案例演示.wmv
8.KeyedState之MapState案例演示.wmv
9.Reduc和Aggregat案例演示.wmv
第12章-Apache Flink高阶之状态存储-容错-数据恢复
1.状态数据丢失处理之StateBackend概述.wmv
2.StateBackends三种实现方式.wmv
3.如何实现容错和仅一次语义.wmv
4.程序自动恢复数据与核心参数剖析.wmv
5.集群模式下数据容错剖析和多备份.wmv
第13章-Apache Flink高阶之WaterMark原理剖析与应用
1.TimeWindow的窗口运行机制.wmv
2.Time的三种类型和EventTime案例实践.wmv
3.引入WaterMark解决案例的遗留问题.wmv
4.Watermark触发机制与核心原理.wmv
5.基于watermark数据丢失的三种解决方案.wmv
6.多并行度watermark的触发机制.wmv
第14章-Apache Flink高阶之window分类-自定义窗口-源码剖析-Join
1.window的概述和四种类型.wmv
2.window的源码理解和会话窗口案例实践.wmv
3.底层原理之自定义widnwo.wmv
4.基于Trigger和Evictor自定义窗口函数.wmv
5.增量聚合及aggregate的使用.wmv
6.全量聚合和window的4种Join实现.wmv
第15章-Apache Flink实时报表案例开发
1.FLink企业实战之需求讲解.wmv
2.FLink企业实战之业务代码实现.wmv
3.多并行度情况下数据传输策略引发的问题.wmv
4.多并行度情况下数据缺失解决方案.wmv
5.企业实战-实时报表需求讲解.wmv
6.企业实战-实时报表业务代码实现.wmv
7.FlinkOnYarn启动程序的二中方案.wmv
第1章 Scala编程基础
1.scala基本介绍.wmv
10.数组的操作.wmv
11.Set和Map的操作.wmv
12.枚举和Null.wmv
13.Noting,Nil,None,Option.wmv
14.Success,Failure.wmv
15.SuccessAndFailure.wmv
16.高阶函数.wmv
17.嵌套函数.wmv
18.柯里化.wmv
19.函数赋值和下划线的使用.wmv
2.scala输出hello World!.wmv
3.变量和常量.wmv
4.函数.wmv
5.循环.wmv
6.map和filter方法讲解.wmv
7.break代码块.wmv
8.数据类型和Tuple的讲解.wmv
9.collection的介绍.wmv
第2章 Scala编程进阶
1.Trait讲解.wmv
10.scala中嵌入Java代码.wmv
11.scala总结.wmv
2.Class和伴生对象.wmv
3.caseClass定义.wmv
4.CaseClass和Enumeration的区别.wmv
5.apply和unapply.wmv
6.Mixin多继承调用关系.wmv
7.列表生成式.wmv
8.正则表达式讲解.wmv
9.匹配分组.wmv
第3章 Apache Spark基础及架构
1.Spark基本介绍.wmv
2.ApacheSpark安装配置.wmv
3.RDD的基本介绍.wmv
4.Spark案例入门.wmv
5.Spark执行流程和组建介绍.wmv
6.分区,SC,SparkSession,核心数据集.wmv
7.RDD分区,宽窄数据变换.wmv
8.windows平台配置Spark开发环境.wmv
9.RDD算子操作.wmv
第4章 Apache Spark分布式计算原理
1.Lineage和DAG的介绍.wmv
2.RDD的Lineage和DAG和数据迁移.wmv
3.Spark的cache和checkpoint.wmv
4.广播变量的使用.wmv
5.分区的控制和数据倾斜.wmv
6.spark加载CSV和Json数据文件.wmv
第5章 Spark SQL精华及与实战(1)
1.SparkSQL历史发展.wmv
10.自定义UDF和UDAF.wmv
2.SparkSQL执行优化策略.wmv
3.SparkSQL程序入口.wmv
4.SparkSQL案例讲解.wmv
5.DataSet案例演示.wmv
6.RDD转换DataFrame.wmv
7.RDD转换DataFrame方式二.wmv
8.加载多种数据源.wmv
9.读取mysql和hive的数据.wmv
第6章 Spark SQL精华及与实战(2)
11.自定义函数案例.wmv
12.窗口函数案例讲解.wmv
13.案例实现1.wmv
14.案例实现2.wmv
第7章-基于Spark Streaming的流数据处理和分析(1)
1.SparkStreming简介.wmv
2.saprkStream运行机制.wmv
3.SparkStreaming处理流程和入口.wmv
4.自定义数据源.wmv
5.updateStateByKey算子讲解.wmv
6.MapWithState算子讲解.wmv
第8章-基于Spark Streaming的流数据处理和分析(2)
10.Streaming程序的容错处理.wmv
7.transform案例讲解.wmv
8.窗口计算.wmv
9.foreachRDD案例讲解.wmv
第9章-基于Spark Streaming的流数据处理和分析(3)
1.如何保证数据不丢失和优化机制.wmv
2.kafka整合0.8版本方案一.wmv
3.kafka整合0.8版本方案二.wmv
4.kafka整合0.8版本手动管理偏移量.wmv
5.kafka整合10版本手动管理偏移量.wmv
6.如何保证Exactly-Once.wmv
03-大数据架构课(2期)
Flink实时运营系统
Video_2021-11-27_215949.wmv
Video_2021-11-28_115409.wmv
Video_2021-11-29_213337.mp4
第10章-Hive-数据仓库高阶精讲
Video_2021-07-28_220239.wmv
第11章-Hive-数据仓库高阶精讲
Video_2021-07-31_221020.mp4
第12章-项目实战-日志数据分析
Video_2021-08-01_221056.wmv
第13章-项目实战-用户消费行为数据分析01
Video_2021-08-02_220253.wmv
第14章-项目实战-用户消费行为数据分析02
Video_2021-08-07_220619.wmv
第15章-Nosql综述和ApacheHBase集群构建
Video_2021-08-08_222632.wmv
第16章-ApacheHBase基础和核心组件
Video_2021-08-09_220455.wmv
第17章-Apache Hbase 进阶及性能优化
Video_2021-08-14_220523.wmv
第18章-Apache Sqoop介绍及数据迁移
Video_2021-08-15_220638.wmv
第19章-ZooKeeper的核心设计和企业级应用
Video_2021-08-16_220727.wmv
第1章-开班典礼
Video_2021-07-05_214925.wmv
第20章-企业级离线数据仓库项目实战开发01
Video_2021-08-21_220233_剪辑.wmv
第21章-企业级离线数据仓库项目实战开发02
Video_2021-08-22_220736.wmv
第22章-企业级离线数据仓库项目实战开发03
Video_2021-08-23_220339.wmv
第23章-hadoop源码调优课程
Video_2021-08-28_220405.wmv
第24章-企业级离线数据仓库项目实战开发04
Video_2021-08-29_220553.wmv
第25章-企业级离线数据仓库项目实战开发05
Video_2021-08-30_214432.wmv
第26章-精通Scala编程语言01
Video_2021-08-30_220558.wmv
第27章-精通Scala编程语言02
Video_2021-09-04_220805.wmv
第28章-精通Scala编程语言03
Video_2021-09-05_220855.wmv
第29章-hadoop源码调优课程
Video_2021-09-07_220009.wmv
第2章-大数据概况及Hadoop生态系统
Video_2021-07-10_222441.wmv
第30章-精通Scala编程语言04
Video_2021-09-11_220147.wmv
第31章-精通Scala编程语言05
Video_2021-09-12_220249.wmv
第32章-精通Scala编程语言06
Video_2021-09-13_215340.wmv
第33章-ApacheSpark基础及架构
Video_2021-09-15_220058.wmv
无标题.png
无标题2.png
第34章-ApacheSpark基础及架构
Video_2021-09-16_220132.wmv
第35章-ApacheSpark基础及架构
Video_2021-09-17_220729.wmv
第36章-ApacheSpark进阶及优化
rdd执行顺序.png
Video_2021-09-25_220301.wmv
第37章-ApacheSpark分布式计算原理
Video_2021-09-26_221503.wmv
Video_2021-09-26_2215031.mp4
第38章-ApacheSpark企业级项目实战
Video_2021-09-27_215844.wmv
Video_2021-09-27_2158440.mp4
第39章-SparkSQL精华及实战基础
Video_2021-10-02_220126.wmv
第3章-Hadoop集群构建&核心模块讲解
Video_2021-07-11_221926.wmv
第40章-SparkSQL精华及实战进阶
Video_2021-10-03_220232.wmv
第41章-SparkSQL企业级项目实战
Video_2021-10-07_220925.wmv
第42章-Kafka基础
Video_2021-10-09_220106.wmv
第43章-Kafka进阶
Video_2021-10-10_220241.wmv
第44章-Spark Streaming的流数据处理和分析
Video_2021-10-11_220644.wmv
第45章-Spark Streaming的流数据进阶
Video_2021-10-15_220209.wmv
第46章-Apache Flume 基础及使用案例
Video_2021-10-16_220352.mp4
第47章-河马物流数据仓库
Video_2021-10-18_230203.wmv
第48章-河马物流数据仓库
Video_2021-10-23_225724.mp4
第49章-河马物流数据仓库
Video_2021-10-25_215945.wmv
第4章-MapReduce原理&优化&企业级案例实战
Video_2021-07-12_220536.wmv
第50章-河马物流数据仓库
Video_2021-10-26_220241.wmv
第51章-河马物流数据仓库
Video_2021-10-30_214402.wmv
第52章-Flink精品课程
Video_2021-10-31_220624.wmv
第53章-Flink精品课程
task和taskSlots的关系.png
Video_2021-11-01_220108.wmv
第54章-Flink精品课程
Video_2021-11-06_215800.wmv
第55章-Flink精品课程
Video_2021-11-07_220041.mp4
第56章-Flink精品课程
Video_2021-11-08_220134.mp4
第57章-Flink精品课程
Video_2021-11-13_221833.mp4
第58章-Flink精品课程
Video_2021-11-14_220326.wmv
第59章-Flink精品课程
Video_2021-11-15_220143.mp4
第5章-Hive-数据仓库基础精讲
Video_2021-07-17_221319.wmv
第60章-Flink精品课程
Video_2021-11-20_220230.mp4
第61章-Flink精品课程
Video_2021-11-21_220546.wmv
第6章-Hive-数据仓库基础精讲
Video_2021-07-18_220142.wmv
第7章-Hive-数据仓库进阶精讲
Video_2021-07-19_215651.wmv
第8章-Hive-数据仓库进阶精讲
Video_2021-07-24_221515.wmv
第9章-Hive-数据仓库高阶精讲
Video_2021-07-25_220412.wmv
配套画图
day01
day02
day03
dataNode保存数据块.png
mapreduce工作的机制.png
namenode.png
SecondaryNameNode理论.png
机架感知.png
笔记.txt
day04
mapreduce运行原理.png
map到redcue过程.png
map和reduce概要.png
图 3.png
day05
mapreduce分区.png
为什么要学习Hive.png
分布式缓存.png
day06
1.png
2.png
day07
1.png
2.png
day08
day11
数据倾斜.png
数据倾斜1.png
04-大数据架构课(3期)
1.大数据概况及Hadoop生态系统.wmv
10.源码理解和自定义分区.wmv
11.分布式缓存和Speculative机制.wmv
12.Hive的基本简介和集群构建.wmv
13.Hive元数据管理.wmv
14.Hive的数据类型CTE和CTAS.wmv
15.Hive的动态分区和静态分区.wmv
16.Hive的分桶和视图讲解.wmv
17.Hive的进阶查询和数据迁移.wmv
18.Hive的进阶查询语法1.wmv
19.分析函数和窗口函数的使用.wmv
2.OLAP&OLTP&Hadoop组件讲解&基本配置.wmv
20.分析函数和窗口函数和窗口函数子句.wmv
21.Hive的事务和自定义函数.wmv
22.Hive的数据据倾斜和性能优化.wmv
23.项目需求分析和数据清洗.wmv
24.日志数据清洗过程1.wmv
25.日志数据清洗过程2.wmv
26.数据分析之常用指标计算.wmv
27.用户消费行为数据分析-1.wmv
28.用户消费行为数据分析-2.wmv
29.用户消费行为数据分析-3.wmv
3.HDFS上传数据原理剖析和单机版配置.wmv
30.用户消费行为数据分析-4.wmv
31.Nosql的综述.wmv
32.Aapache Hbase的简介和环境构建.wmv
33.HBase的存储机制.wmv
34.HBase的客户端操作.wmv
35.HBase数据操作详解.wmv
36.HBase的SQL支持和Hive支持.wmv
37.sqoop的基础入门.wmv
38.Sqoop数据迁移的实现.wmv
39.zookeeper的安装和基本参数解析.wmv
4.Hadoop环境BUG解决和集群配置.wmv
40.zookeeper数据数据结构和基本操作.wmv
41.zookeeper的Java客户端操作.wmv
42.zookeeper的基本代码结构和监听器应用.wmv
43.Zookeeper案例剖析.wmv
44.企业级数据仓库项目实战-1.wmv
45.企业级数据仓库项目实战-2.wmv
5.NameNode&DataNode&SNN进程原理剖析.wmv
6.Hadoop的存储和安全模式.wmv
7.MapReduce的基本介绍.wmv
8.MapReduce流程剖析.wmv
9.mapreduce案例编写和剖析.wmv
课程配图
第3章课堂画图
19.png
mapreduce的处理流程.png
保存小文件的问题.png
并行度和分布.png
无标题.png
无标题2.png
节点之间的关系.png
第4章课堂画图
画图
1.png
2.png