永发信息网

分布式文件系统hdfs主要由哪些功能模块构成

答案:1  悬赏:50  手机版
解决时间 2021-02-23 20:34
分布式文件系统hdfs主要由哪些功能模块构成
最佳答案
Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的。HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架构而开发的。HDFS是Apache Hadoop Core项目的一部分。

Hadoop分布式文件系统架构
1 NameNode(名称节点)
  HDFS命名空间采用层次化(树状——译者注)的结构存放文件和目录。
2 映像和日志
  Inode和定义metadata的系统文件块列表统称为Image(映像).NameNode将整个命名空间映像保存在RAM中。而映像的持久化记录则保存在NameNode的本地文件系统中,该持久化记录被称为Checkpoint(检查点)。NameNode还会记录HDFS中写入的操作,并将其存入一个记录文件,存放在本地文件系统中,这个记录文件被叫做Journal(日志)。
3 数据节点
  DataNode上的每一个块(block)副本都由两个本地文件系统上的文件共同表示。其中一个文件包含了块(block)本身所需包含的数据,另一个文件则记录了该块的元数据,包括块所含数据大小和文件生成时间戳。数据文件的大小等于该块(block)的真实大小,而不是像传统的文件系统一样,需要用额外的存储空间凑成完整的块。因此,如果一个块里只需要一半的空间存储数据,那么就只需要在本地系统上分配半块的存储空间即可。
4 HDFS客户端
  用户应用程序通过HDFS客户端连接到HDFS文件系统,通过库文件可导出HDFS文件系统的接口。像很多传统的文件系统一样,HDFS支持文件的读、写和删除操作,还支持对目录的创建和删除操作。与传统的文件系统不同的是,HDFS提供一个API用以暴露文件块的位置。这个功能允许应用程序。
5 检查点节点
  HDFS中的NameNode节点,除了其主要职责是相应客户端请求以外,还能够有选择地扮演一到两个其他的角色,例如做检查点节点或者备份节点。该角色是在节点启动的时候特有的。
6 备份节点
  HDFS的备份节点是最近在加入系统的一项特色功能。就像CheckpintNode一样,备份节点能够定期创建检查点,但是不同的是,备份节点一直保存在内存中,随着文件系统命名空间的映像更新和不断更新,并与NameNode的状态随时保持同步。
7 系统更新和文件系统快照
  在软件更新的过程中,由于软件的bug或者人为操作的失误,文件系统损坏的几率会随之提升。在HDFS中创建系统快照的目的,就在于把系统升级过程中可能对数据造成的隐患降到最低。快照机制让系统管理员将当前系统状态持久化到文件系统中,这样以来,如果系统升级后出现了数据丢失或者损坏,便有机会进行回滚操作,将HDFS的命名空间和存储状态恢复到系统快照进行的时刻。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
太原哪有卖仿冒耐克
摩托车需要年检吗
好多多购物广场东门在哪里啊,我有事要去这个
豹子垅这个地址在什么地方,我要处理点事
【重阳节是哪天】三年级上册语文重阳节那天王
已知日本获得的奖牌中,金牌47枚,银牌数是日
写穿越小说的话,最好用第几人称?
cad中复线是什么意思复线包括多段线样条
关爱和爱你有什么区别
买电脑去哪买比较好呢?我是常州的
流量用超了扣话费了,再买加油包可以把话费还
皇盛四季雪清店在哪里啊,我有事要去这个地方
深圳泰海客栈地址在什么地方,想过去办事
tl431调压电路图改进增强
为什么日剧好多女主角很丑
推荐资讯
苏州火车站k1606号列车在哪个检票口检票
作为经理的助理,怎么给经理发邮件,发邮件的
通水开始很通后来有点阻碍还需要做第二次吗
想要学习怎么去运营,先要学什么
众成汽车修配厂在什么地方啊,我要过去处理事
开孕婴店在乡镇开好还是在市里开好
嘀嗒拼车怎么用?怎么发布顺路乘客的消息
二陈汤怎么做?
信用卡我已经刷爆了,账单还没还完,过一个月
为什么天天炫舞在手机里上传不了相片?
跨省转五险一金怎么转
怎么看印度计划中的新主战坦克
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?