Spark+ClickHouse实战企业级数据仓库,进军大厂必备(6章)
内容简介
现阶段的数据开发领域,数据仓库作为企业战略决策的“大脑”,地位日益凸显,对数仓技术的掌握程度也成了大厂面试必考的一环。本课程结合ClickHouse+Spark 这一对数据处理的“黄金搭档”,选取“大数据量企业数据仓库“这一典型场景,实战大数据量下数仓的建模、设计与调优等实用技巧,快速掌握ClickHouse+Spark核心技能,为晋级大数据架构师铺路!
资源目录
\计算机教程\01MOOC\171-591-Spark+ClickHouse实战企业级数据仓库,进军大厂必备(6章)
目录.txt -1.#INDB
第1章 从0到1搭建项目开发环境,快速上手大数据开发
1-1 大数据时代,你还不知道数据仓库么?.mp4 43.06MB
1-2 本章概览.mp4 4.37MB
1-3 基于IDEA + Maven构建Spark工程.mp4 103.92MB
1-6 源码、启动脚本、配置等自动构建打包.mp4 114.01MB
1-7 项目多模块规划与自动构建打包.mp4 134.39MB
第2章 项目关键技术准备,学习通用的数据处理技术
2-1 本章概览.mp4 7.63MB
2-10 在Spark中集成Grok.mp4 81.95MB
2-11 Grok的序列化问题与源码修改.mp4 48.96MB
2-2 IPv4和数值转换.mp4 74.79MB
2-3 IP地址简写和全写的格式转换.mp4 36.6MB
2-4 IP地址二分查找.mp4 105.91MB
2-5 Spark自定义IP函数.mp4 37.24MB
2-6 初识Grok通用数据解析器.mp4 129.73MB
2-7 在程序中解析Grok.mp4 62.1MB
2-8 自定义Grok表达式.mp4 56.27MB
2-9 Grok工具类封装.mp4 49.42MB
第3章 项目数据准备,操练基于Spark的数据开发与优化
3-1 本章概览.mp4 3.14MB
3-2 项目业务数据.mp4 32.58MB
3-3 生成IP、域名、IP位置的中间数据(上).mp4 76.89MB
3-4 生成IP、域名、IP位置的中间数据(下).mp4 117.28MB
3-5 生成域名备案、IP位置、违规实体数据.mp4 80.61MB
3-6 基于Grok模拟安全访问日志.mp4 144.52MB
3-7 安全访问日志生成之广播变量优化.mp4 24.21MB
第4章 初识OLAP数仓架构
4-1 本章概览.mp4 2.33MB
4-2 基于Lambda架构的数仓.mp4 25.02MB
4-3 基于Kappa架构的数仓.mp4 11.14MB
4-4 基于实时OLAP架构的数仓.mp4 18.64MB
第5章 详解数据仓库基础理论,掌握数据仓库的实施流程
5-1 本章概览.mp4 5.37MB
5-2 数据仓库的定义.mp4 16.48MB
5-3 3NF范式建模.mp4 19.46MB
5-4 Kimball和Inmon数据仓库架构.mp4 18.08MB
5-5 数据仓库建模方法.mp4 30.76MB
5-6 事实表与维度表.mp4 23.26MB
5-7 星型、雪花和星座维度模型.mp4 19.51MB
5-8 数据仓库构建流程.mp4 31.48MB
5-9 数据仓库分层模型.mp4 47.94MB
第6章 [项目实战第一篇]项目业务流程与ODS层数据同步
6-1 课程目录.mp4 3.24MB
6-2 项目业务流程与技术架构.mp4 19.05MB
6-3 ODS数据同步技术架构.mp4 16.9MB
6-4 基于HDFS API的数据同步.mp4 148.93MB
6-5 基于HDFS API的数据同步工具封装.mp4 150.36MB