各有关单位:
日程
|
培训模块
|
培训要点
|
第一天
上午
|
Hadoop入门,了解什么是hadoop
|
1、 Hadoop产生背景
2、 Hadoop在大数据、云计算中的位置和关系
3、 国内外Hadoop应用案例介绍
4、 国内Hadoop的就业情况分析及课程大纲介绍
5、 分布式系统概述
6、 Hadoop生态圈以及各组成部分的简介
7、 Hadoop核心MapReduce例子说明
|
分布式文件系统HDFS,是数据库管理员的基础课程
|
1、 分布式文件系统DFS简介
2、 HDFS的系统组成介绍
3、 HDFS的组成部分详解
4、 副本存放策略及路由规则
5、 NameNode Federation
6、 命令行接口
7、 Java接口
8、 客户端与HDFS的数据流讲解
9、 HDFS的可用性(HA)
|
|
第一天
下午
|
初级MapReduce,成为Hadoop开发人员的基础课程
|
1、 如何理解map、reduce计算模型
2、 剖析伪分布式下MapReduce作业的执行过程
3、 Yarn模型
4、 序列化
5、 MapReduce的类型与格式
6、 MapReduce开发环境搭建
7、 MapReduce应用开发
8、 更多示例讲解,熟悉MapReduce算法原理
|
第二天
上午
|
高级MapReduce,高级Hadoop开发人员的关键课程
|
1、 使用压缩分隔减少输入规模
2、 利用Combiner减少中间数据
3、 编写Partitioner优化负载均衡
4、 如何自定义排序规则
5、 如何自定义分组规则
6、 MapReduce优化
7、 编程实战
|
Hadoop集群与管理,是数据库管理员的高级课程
|
1、 Hadoop集群的搭建
2、 Hadoop集群的监控
3、 Hadoop集群的管理
4、 集群下运行MapReduce程序
|
|
ZooKeeper基础知识,构建分布式系统的基础框架
|
1、 ZooKeeper体现结构
2、 ZooKeeper集群的安装
3、 操作ZooKeeper
|
|
第二天
下午
|
HBase基础知识,面向列的实时分布式数据库
|
1、 HBase定义
2、 HBase与RDBMS的对比
3、 数据模型
4、 系统架构
5、 HBase上的MapReduce
6、 表的设计
|
HBase集群及其管理
|
1、 集群的搭建过程讲解
2、 集群的监控
3、 集群的管理
|
|
HBase客户端
|
1、 HBase Shell以及演示
2、 Java客户端以及代码演示
|
|
第三天
上午
|
Pig基础知识,进行hadoop计算的另一种框架
|
1、 Pig概述
2、 安装Pig
3、 使用Pig完成手机流量统计业务
|
Hive,使用sql进行计算的hadoop框架
|
1、 数据仓库基础知识
2、 Hive定义
3、 Hive体系结构简介
4、 Hive集群
5、 客户端简介
6、 HiveQL定义
7、 HiveQL与SQL的比较
8、 数据类型
9、 表与表分区概念
10、表的操作与CLI客户端演示
11、数据导入与CLI客户端演示
12、查询数据与CLI客户端演示
13、数据的连接与CLI客户端演示
14、用户自定义函数(UDF)的开发与演示
|
|
第三天
下午
|
Sqoop,hadoop与rdbms进行数据转换的框架
|
1、配置Sqoop
2、使用Sqoop把数据从mysql导入到HDFS中
3、使用Sqoop把数据从HDFS导出到mysql中
|
大数据实战
|
大数据完整项目架构和开发过程练习
|
报名程序:
课程名称: | 时间/地点: | ||||
公司名称: | |||||
公司地址: | 邮编: | ||||
经办人姓名: | 手机: | 部门及职务: | |||
电话: | 传真: | E-mail: | |||
参加人姓名 | 性别 | 职务 | 手 机/电话 | E-mail: | |
课程费用: | 费用总计: |
010-88558946 010-88558946