自从Hadoop的出现,大数据的主要技术是什么?

栏目: 服务器 · 发布时间: 7年前

内容简介:自从Hadoop的出现,引领大数据的浪潮越来越热。大数据存储的主要技术路线有几种:1.Hadoop

自从Hadoop的出现,大数据的主要技术是什么?

自从Hadoop的出现,引领大数据的浪潮越来越热。大数据存储的主要技术路线有几种:

1.Hadoop

2.Cassandra

3.MongoDB

Hadoop是Apache的开源项目,同时有很多商业公司对Hadoop进行版本发行和商业支持,参见:http://wiki.apache.org/hadoop/Distributions%20and%20Commercial%20Support

其中在最有名为人所知的三家:

1.Cloudera

自从Hadoop的出现,大数据的主要技术是什么?

2.Hortonwork

自从Hadoop的出现,大数据的主要技术是什么?

3.MapR

自从Hadoop的出现,大数据的主要技术是什么?

这三个厂商之中,MapR最为封闭;Hortonworks最为开放,产品线全开源,在线文档比较丰富。国内使用Cloudera CDH和Hortonworks的应该是最多的。

准实时计算框架/即席查询

1.CDH的框架有:Impala + Spark;

2.HDP的框架有:Tez + Spark;

3.MapR的框架有:Drill + Tez + Spark。

关于Spark:

2014年大数据最热门的技术路线就是算是Spark了,而且得力于Spark不遗余力的推广和快速成长。Cloudera是最早支持Spark,也是最激进的。下图即是Spark在Cloudera产品线中的定位:

自从Hadoop的出现,大数据的主要技术是什么?

实际上快速计算框架的发展才刚刚开始,社区中已经有如下几种:

1.Spark/Shark

2.Hortonworks Tez/Stinger

3.Cloudera Impala

4.Apache Drill

5.Apache Flink

6.Apache Nifi

7.Facebook Presto


以上所述就是小编给大家介绍的《自从Hadoop的出现,大数据的主要技术是什么?》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

趣学算法

趣学算法

陈小玉 / 人民邮电出版社 / 2017-7-1 / 89.00元

本书内容按照算法策略分为7章。 第1章从算法之美、简单小问题、趣味故事引入算法概念、时间复杂度、空间复杂度的概念和计算方法,以及算法设计的爆炸性增量问题,使读者体验算法的奥妙。 第2~7章介绍经典算法的设计策略、实战演练、算法分析及优化拓展,分别讲解贪心算法、分治算法、动态规划、回溯法、分支限界法、线性规划和网络流。每一种算法都有4~10个实例,共50个大型实例,包括经典的构造实例和实......一起来看看 《趣学算法》 这本书的介绍吧!

html转js在线工具
html转js在线工具

html转js在线工具

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试