Hadoop是什么?能不能给点具体的解释?怎么用?
答案:4 悬赏:70 手机版
解决时间 2021-02-26 04:28
- 提问者网友:沉默的哀伤
- 2021-02-25 15:10
Hadoop是什么?能不能给点具体的解释?怎么用?
最佳答案
- 五星知识达人网友:过活
- 2021-02-25 15:59
Hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streaming access)文件系统中的数据。
全部回答
- 1楼网友:毛毛
- 2021-02-25 18:12
hadoop是apache的子项目,不过它下面又有很多子项目,简单的说就是用大量的廉价机器组成的集群去执行大规模运算,主要是海量数据的处理。
常用的就是hdfs(分布式存储)、MapReduce(分布式计算)、HBase(Nosql数据库)
hdfs:分块存储文件(默认是64M),并且每个块默认有3个备份。
MapReduce:简单来说就是分治的思想,对不同的数据块执行各自的map输出key-value,再在reduce阶段将结果做合并(中间会有sort,partition,merge等阶段)
hadoop目前在各互联网公司的应用非常广泛
- 2楼网友:你哪知我潦倒为你
- 2021-02-25 17:33
由于datanode比较多,且各个datanode之间的namespace id一般不会错, 所以一般来说,是修改namonode上面的namespace id。 先查看某个datanode下面的namenode id 信息,比如我的默认fs路径是 /hadoop,那么就到datanode下面/hadoop/dfs/data/current/下面查看version文件,内容如下: #tue jul 31 17:31:22 jst 2012 namespaceid=590008784 storageid=ds-230267979-192.168.3.209-50010-1342056014871 ctime=0 然后查看namenode下面的/hadoop/dfs/name/current/version文件,格式如下: #fri aug 03 15:36:51 jst 2012 namespaceid=590008784 ctime=0 storagetype=name_node layoutversion=-18 如果两者namespaceid值不一样的话,修改namenode中的namespaceid值为datanode中的 namespaceid值,保持一致即可。然后重新启动集群。
- 3楼网友:深街酒徒
- 2021-02-25 16:45
由于datanode比较多,且各个datanode之间的namespace id一般不会错,
所以一般来说,是修改namonode上面的namespace id。
先查看某个datanode下面的namenode id 信息,比如我的默认fs路径是
/hadoop,那么就到datanode下面/hadoop/dfs/data/current/下面查看version文件,内容如下:
#tue jul 31 17:31:22 jst 2012
namespaceid=590008784
storageid=ds-230267979-192.168.3.209-50010-1342056014871
ctime=0
然后查看namenode下面的/hadoop/dfs/name/current/version文件,格式如下:
#fri aug 03 15:36:51 jst 2012
namespaceid=590008784
ctime=0
storagetype=name_node
layoutversion=-18
如果两者namespaceid值不一样的话,修改namenode中的namespaceid值为datanode中的
namespaceid值,保持一致即可。然后重新启动集群。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
推荐资讯