Hadoop的系列化是通過Writable接口來實現的,只滿足了前兩條設計,在org.apache.hadoop.io包下包含了大量的可序列化的組件,它們都實現了Writable接口,Writable接口提供了兩個方法,write和readFields,分別用來序列化和反序列化。
HDFS作為一個分布式文件系統,是所有這些項目的基礎。分析好HDFS,有利于了解其他系統。由于Hadoop的HDFS和MapReduce是同一個項目,我們就把他們放在一塊,進行分析。
大家都熟悉文件系統,在對HDFS進行分析前,我們并沒有花很多的時間去介紹HDFS的背景,畢竟大家對文件系統的還是有一定的理解的,而且也有很好的文檔。在分析Hadoop的MapReduce部分前,我們還是先了解系統是如何工作的,然后再進入我們的分析部分。