大数据为什么要选择Spark？

“一栈定天下”的大数据计算框架Spark，期望用一个技术栈完美解决大数据领域的各类计算任务。Apache官方，对Spark的定义是:一个通用的大数据快速处理引擎。除了一站式的特性，Spark还有一个最重要的特性就是基于内存的计算，这样它的速度可以达到MapReduce和Hive的几倍甚至几十倍！现在许多大公司都在生产环境中深度使用Spark作为大数据的计算框架，包括易贝和雅虎！、BAT、网易、JD.COM、华为、大众点评、优酷土豆、搜狗等等。

超级多功能

Spark提供了Spark RDD、Spark SQL、SparkStreaming、Spark MLlib、Spark GraphX等技术组件。，可以完成离线批处理、交互查询、流计算、机器学习、图计算等常见任务。一站式大数据领域。

东师大数据学习java语言基础，java面向对象，spring mvc，web前端，Linux入门，hadoop开发，Spark等等。