Hadoop的诞生历史
创始人:Doug Cutting,被誉为Hadoop之父,Apache软件基金会主席,Lucene、Nutch、Hadoop等项目的发起人。
起初Hadoop只是Apache Lucene的子项目Nutch的一部分。
Lucene是全球第一个开源的全文搜索引擎工具包,想必做过Javaweb搜索功能的同学都接触过。
它有一个完整的查询引擎和一些文本分析引擎。
Nutch基于Lucene,具有网页抓取和解析功能,可以实现一个搜索引擎的开发。但如果投入使用,必须在极短的时间内做出响应,短时间内可以分析处理上亿的网页,这就需要考虑分布式任务处理、故障恢复和负载均衡等问题。
后来Doug Cutting借鉴了Google的两篇论文Google File System和MapReduce:简化大型集群上的数据处理,移植了该技术,并命名为Hadoop。