hadoop中的三大组件分别是什么

这篇文章主要介绍hadoop中的三大组件分别是什么,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!

成都创新互联公司专注于企业成都营销网站建设、网站重做改版、鄞州网站定制设计、自适应品牌网站建设、html5购物商城网站建设、集团公司官网建设、外贸营销网站建设、高端网站制作、响应式网页设计等建站业务,价格优惠性价比高,为鄞州等各大城市提供网站开发制作服务。

hadoop三大组件:1、HDFS,一个高可靠、高吞吐量的分布式文件系统;2、MapReduce,一个分布式的离线并行计算框架;3、Yarn,分布式资源管理框架。

hadoop三大组件:

1、HDFS

一个高可靠、高吞吐量的分布式文件系统

存储海量数据

分布式

安全性

副本数据

数据是以block的方式进行存储的,128M

比如:200M—128M 72M

2、MapReduce

一个分布式的离线并行计算框架

对海量数据的处理

分布式

思想:

分而治之

大数据集分为小的数据集

每个数据集进行逻辑业务处理(map)

合并统计数据结果(reduce)

3、Yarn

分布式资源管理框架

管理整个集群的资源(内存、CPU核数)

分配调度集群的资源

以上是“hadoop中的三大组件分别是什么”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注创新互联行业资讯频道!


分享名称:hadoop中的三大组件分别是什么
标题来源:http://scyanting.com/article/iiosji.html