架构师兼大数据开发工程师
哪吒 2020/1/1
点击勘误issues (opens new window),哪吒感谢大家的阅读

# 架构师兼大数据开发工程师
架构师兼大数据开发工程师
第一部分:了解大数据
第一周:学好Linux
第一章:大数据初始
第二章:Liunx虚拟机安装配置
第三章:Liunx上手
第四章:Liunx与shell实战
第五章:Liunx总结
第二周:了解Hadoop
第一章:认识Hadoop
第二章:Hadoop的两种安装方式
第三周:Hadoop的HDFS的使用
第一章:HDFS介绍
第二章:HDFS基础操作
第三章:Java操作HDFS
第四周:HDFS的核心剖析
第一章:初始NameNode
第二章:NameNode进阶
第三章:HDFS高级
第五周:认识MR
第一章:了解MapReduce
第二章:实战WordCount
第三章:深入MapReduce
第四章:Shuffle执行过程及源码分析
第二部分:PB离线数据计算分析
第六周:企业级解决方案
第一章:剖析肖文杰问题
第二章:数据倾斜问题
第三章:YARN实战
第四章:Hadoop文档指南
第五章:Hadoop核心复盘
第七周:Flume从0到1实战
第一章:入门Flume
第二章:Flume的使用
第三章:Flume高级组件
第四章:Flume出神入化
第五章:Flume核心复盘
第八周:数据仓库Hive入门到大牛
第一章:快速聊了解Hive
第二章:数据库与数据仓库的区别
第三章:Hive基础使用
第四章:Hive核心实战
第五章:Hive高级函数实战
第六章:Hive技巧与核心复盘
第三部分:数据仓库设计与开发+Spark+实战项目
第九周:7天掌握Scala语言
第一章:入门Scala
第二章:Scala基础语法
第三章:Scala面向对象
第四章:Scala函数式编程
第五章:Scala高级特性
第六章:Scala核心复盘
第十周:Spark快速上手
第一章:初始Spark
第二章:解读Spark工作与架构原理
第三章:Spark实战单词统计
第四章:Transformation与Action开发实战
第五章:RDD持久化
第六章:TopN主播统计
第七章:面试与核心复盘
第十一周:Spark性能优化
第一章:Spark三种任务提交模式
第二章:Shuffle机制分析
第三章:Spark的checkpoint
第四章:Spark程序性能优化
第五章:Spark性能优化算子优化
第六章:快速上手SparkSql
第七章:Spark实战与核心复盘
第十二周:电商数据仓库的用户行为数仓
第一章:电商数据仓库效果
第二章:数据仓库前置技术
第三章:电商数仓技术选型
第四章:数据生成与采集
第五章:用户行为数仓设计
第六章:项目核心复盘
第十三周:电商数据仓库的商品订单数仓
第一章:商品订单数仓需求分析
第二章:需求设计与实战
第三章:订单拉链表
第四章:数据可视化和任务调度
第十四周:消息队列kafka
第一章:了解Kafka
第二章:Kafka使用初体验
第三章:Kafka核心存储和容错机制
第四章:Kafka技巧篇
第五章:Kafka小试牛刀
第六章:Kafka核心复盘
第十五周:上手内存数据库Redis
第一章:快速了解Redis
第二章:Redis核心实战
第三章:Redis封装工具类
第四章:Redis核心复盘
第四部分:实时数据处理方案
第十六周:Flink快速上手
第一章:初始Flink
第二章:Flink集群安装部署
第三章:Flink核心API-DataStreamAPI
第四章:Flink核心API-DataSetAPI
第五章:Flink核心API-TableAPI和SQL
第十七周:Flink高级进阶
第一章:Flink高阶
第十八周:直播平台三度关系推荐
第一章:项目内容
第五部分:实战项目:三度关系推荐系统+数据中台
第十九周:直播平台三度关系推荐
第一章:深入项目
第六部分:代码实操
第二十周:代码演练