HDFS是hadoop兼容最好的標準級文件系統。Hadoop是分佈式服務器集羣上存儲海量數據並運行分佈式分析應用的開源框架,而HDFS是一個分佈式文件系統,是Hadoop中的一個核心部件,主要是對數據進行分佈式儲存和讀取。
HDFS(Hadoop Distributed File System)是hadoop項目的核心子項目,是基於流數據模式訪問和處理超大文件的需求而開發的。
HDFS的優點:
1) 處理百MB、設置數百TB大小的文件
2) 流式的訪問數據,響應"一次寫入、 多次讀寫"
3) 運行於廉價的商用集羣上
HDFS的缺點:
1) 不適合低延遲數據訪問
2) 無法高效存儲大量小文件
3)不支持多用户寫入及任意修改文件