大数据平台:分散式档案

在网路之上的多个服务器节点建立了个巨量储存空间和高吞吐(Throughput)的档案系统,使用时无须关心档案的物理储存方式,可以像使用本地档案系统一样管理档案及资料夹。

是 Hadoop 「数据生态圈」的重要基础设施:
* 具备「故障检测和隔离(Fault Detection and Isolation, FDI)」能力
* 透过资料「副本机制」获得了更好的容错能力
* 适合大型档案以及巨量资料的批次处理

具有一些明显的限制:
* 采用一致性模型有较高的读写延迟
* 不适用用於即时性服务
* NameNode 可能会造成单点故障

  • 系统高可用性:
    可以透过 NFS 来同步主从 NameNode 的资料备份,可以快速的故障转移到热备援的 NameNode,提升系统的可用性。
  • 水平扩充能力:
    可以利用 Federation 机制提高系统的水平扩充能力,将全域的档案目录切割到多个 NameSpace 後分配到多个独立的 NameNode 管理,共享所有 DataNode 的储存资料。

<<:  模型的内容03 Class Net

>>:  Day28 - 开发者的环境变数设置

Day02 - 【入门篇】Quick Start(2)

本系列文之後也会置於个人网站 昨天,已经完成了一部分配置,且也已经可以建立帐号并登入了。 不过,这...

Web应用测试工具-Skipfish

Skipfish 是一个主动的Web应用程序安全测试工具 透过执行递归爬网和基於字典的探测 易於使用...

Day 10. 新手也能懂的物件导向 part 2

上一篇讲了一部分物件导向的特性,今天要来讲多型,在此之前要先介绍介面(interface),以及他的...

(10)建立基本类神经网路程序

参考网站:Keras官方指南   根据上面的参考网站,可以做出基本的类神经网路。   首先要先有基本...

Day8 资料监听

今天要来介绍资料监听Watch~ Watch的用法是当这个值发生改变时,我们可以做出相对应的事 在w...