在學(xué)習(xí)CGFT大數(shù)據(jù)時,數(shù)據(jù)存儲策略主要包含哪些內(nèi)容是很重要的。下文是對它的詳細(xì)介紹,一起了解一下!
數(shù)據(jù)存儲策略包括數(shù)據(jù)存放、數(shù)據(jù)讀取和數(shù)據(jù)復(fù)制等方面,它在很大程度上會影響到整個分布式文件系統(tǒng)的讀寫性能,是分布式文件系統(tǒng)的核心內(nèi)容。
1、數(shù)據(jù)存放
為了提高數(shù)據(jù)的可靠性與系統(tǒng)的可用性,以及充分利用網(wǎng)絡(luò)寬帶,HDFS采用了以機架為基礎(chǔ)的數(shù)據(jù)存放策略。
2、數(shù)據(jù)讀取
HDFS提供了一個API可以確定一個數(shù)據(jù)節(jié)點所屬的機架ID,客戶端也可以調(diào)用API獲取自己所屬的機架ID。
3、數(shù)據(jù)復(fù)制
HDFS的數(shù)據(jù)復(fù)制采用了流水線復(fù)制的策略,大大提高了數(shù)據(jù)復(fù)制過程的效率。當(dāng)客戶端要往HDFS中寫入一個文件時,這個文件會首先被寫入本地,并被切分成若干個塊,每個塊的大小是由HDFS的設(shè)定值來決定的。
每個塊都向HDFS集群中的名稱節(jié)點發(fā)起寫請求,名稱節(jié)點會根據(jù)系統(tǒng)中各個數(shù)據(jù)節(jié)點的使用情況,選擇一個數(shù)據(jù)節(jié)點列表返回給客戶端。

學(xué)習(xí)交流群(掃碼免費加群)
-
1、新手入門
-
2、學(xué)習(xí)資料
-
3、免費課程
-
4、考試動態(tài)
-
5、備考干貨
-
6、答疑沖刺