架构师兼大数据开发工程师

2020/1/1

点击勘误issues (opens new window),哪吒感谢大家的阅读

# 架构师兼大数据开发工程师

架构师兼大数据开发工程师

第一部分:了解大数据
    第一周:学好Linux
        第一章:大数据初始
        第二章:Liunx虚拟机安装配置
        第三章:Liunx上手
        第四章:Liunx与shell实战
        第五章:Liunx总结
    第二周:了解Hadoop
        第一章:认识Hadoop
        第二章:Hadoop的两种安装方式
    第三周:Hadoop的HDFS的使用
        第一章:HDFS介绍
        第二章:HDFS基础操作
        第三章:Java操作HDFS
    第四周:HDFS的核心剖析
        第一章:初始NameNode
        第二章:NameNode进阶
        第三章:HDFS高级
    第五周:认识MR
        第一章:了解MapReduce
        第二章:实战WordCount
        第三章:深入MapReduce
        第四章:Shuffle执行过程及源码分析

第二部分:PB离线数据计算分析
    第六周:企业级解决方案
        第一章:剖析肖文杰问题
        第二章:数据倾斜问题
        第三章:YARN实战
        第四章:Hadoop文档指南
        第五章:Hadoop核心复盘
    第七周:Flume从0到1实战
        第一章:入门Flume
        第二章:Flume的使用
        第三章:Flume高级组件
        第四章:Flume出神入化
        第五章:Flume核心复盘
    第八周:数据仓库Hive入门到大牛
        第一章:快速聊了解Hive
        第二章:数据库与数据仓库的区别
        第三章:Hive基础使用
        第四章:Hive核心实战
        第五章:Hive高级函数实战
        第六章:Hive技巧与核心复盘

第三部分:数据仓库设计与开发+Spark+实战项目
    第九周:7天掌握Scala语言
        第一章:入门Scala
        第二章:Scala基础语法
        第三章:Scala面向对象
        第四章:Scala函数式编程
        第五章:Scala高级特性
        第六章:Scala核心复盘
    第十周:Spark快速上手
        第一章:初始Spark
        第二章:解读Spark工作与架构原理
        第三章:Spark实战单词统计
        第四章:Transformation与Action开发实战
        第五章:RDD持久化
        第六章:TopN主播统计
        第七章:面试与核心复盘
    第十一周:Spark性能优化
        第一章:Spark三种任务提交模式
        第二章:Shuffle机制分析
        第三章:Spark的checkpoint
        第四章:Spark程序性能优化
        第五章:Spark性能优化算子优化
        第六章:快速上手SparkSql
        第七章:Spark实战与核心复盘
    第十二周:电商数据仓库的用户行为数仓
        第一章:电商数据仓库效果
        第二章:数据仓库前置技术
        第三章:电商数仓技术选型
        第四章:数据生成与采集
        第五章:用户行为数仓设计
        第六章:项目核心复盘
    第十三周:电商数据仓库的商品订单数仓
        第一章:商品订单数仓需求分析
        第二章:需求设计与实战
        第三章:订单拉链表
        第四章:数据可视化和任务调度
    第十四周:消息队列kafka
        第一章:了解Kafka
        第二章:Kafka使用初体验
        第三章:Kafka核心存储和容错机制
        第四章:Kafka技巧篇
        第五章:Kafka小试牛刀
        第六章:Kafka核心复盘
    第十五周:上手内存数据库Redis
        第一章:快速了解Redis
        第二章:Redis核心实战
        第三章:Redis封装工具类
        第四章:Redis核心复盘

第四部分:实时数据处理方案
    第十六周:Flink快速上手
        第一章:初始Flink
        第二章:Flink集群安装部署
        第三章:Flink核心API-DataStreamAPI
        第四章:Flink核心API-DataSetAPI
        第五章:Flink核心API-TableAPI和SQL
    第十七周:Flink高级进阶
        第一章:Flink高阶
    第十八周:直播平台三度关系推荐
        第一章:项目内容

第五部分:实战项目:三度关系推荐系统+数据中台
    第十九周:直播平台三度关系推荐
        第一章:深入项目

第六部分:代码实操
    第二十周:代码演练