
正在学习大数据的你,相信对Hadoop的概念并不陌生。
Hadoop本身不是一个产品,而是由多个软件产品组成的一个生态系统。这些软件产品共同实现全面功能和灵活的大数据分析。
要学习Hadoop的环境搭建,HDFS的基本操作,甚至Mapreduce的基础入门,就不得不从Hadoop的基本概念说起,并了解其生态圈的组成。
本期直播课,就为大家重点介绍了Hadoop的概念,特性和核心,
并对Hadoop生态圈做简要说明。

留言获取听课地址
主讲人及课程梗概
红松教育 徐爱玲
资深大数据讲师,多年数据挖掘算法类经验,从事过人工智能相关领域工作,华为大数据专家级讲师,获得华为云服务中级认证(HCDP)和大数据高级认证(HCIE),有丰富的培训授课经验。
课程大纲
一、Hadoop概述
1、什么是Hadoop
2、Hadoop的发展历史
3、Hadoop的优势
4、Hadoop生态系统的优点
二、Hadoop生态圈
1、Hadoop1.0~Hadoop2.0
2、Hadoop四层结构
3、重要组件介绍
讲稿分享


Hadoop起源
2006年,Hadoop由雅虎创建,主要被用于Web搜索。这时的Hadoop 还是一个分布式系统基础架构,可以使用户在不了解分布式底层细节的情況下开发分布式程序。后来逐渐成为雅虎最重要的底层技术之一。

2007年起,国内开始引入Hadoop
2007年,百度开始使用Hadoop做离线处理。
2007年,中国移动开始在“大云”研究中使用Hadoop技术。
2008年,淘宝开始投入研究基于Hadoop的系统——云梯,并将其用于处理电子商务相关数据。
2008年1月,Hadoop成为Apache顶级项目。
2011年7月,Yahoo!和硅谷风险投资公司 Benchmark Capital创建了Hortonworks 公司,旨在让Hadoop更加可靠,并让企业用户更容易安装、管理和使用Hadoop。
Hadoop生态圈

项目应用的话,建议尽量往高版本走。稳健一点的话稍低于最高版本的一个稳定版本即可。


Hadoop重要组件简介






补充学习
Hadoop的企业应用上有什么案例?
现在使用Hadoop的企业以及靠Hadoop赚钱的企业已经成千上万。几乎大的企业或多或少的已经使用或者计划尝试使用Hadoop技术。就对Hadoop定位和使用不同,可以将Hadoop业界公司划分为四类:
第一梯队:这类公司已经将Hadoop当作大数据战略*器武**。
第二梯队:这类公司将Hadoop 产品化。
第三梯队:这类公司创造对Hadoop整体生态系统产生附加价值的产品。
第四梯队:这类公司消费Hadoop,并给规模比第一类和第二类小的公司提供基于Hadoop的服务。

在之后的课程中,我们也会陆续介绍Hadoop的环境搭建,实际应用以及相关组件的入门知识,感兴趣的小伙伴,欢迎关注我们每周的推送哦!
