隨著閃存每GB價格的普遍下降,數據縮減方法,例如重復數據刪除,壓縮和精簡配置等,也使全閃存數據中心從概念轉變?yōu)楝F實。很少有廠商能夠同時提供解決數據縮減難題的所有三種方案,所以重要的是知道哪個方法(如果有的話)對你的組織最為適用。
當考慮采用數據縮減技術使閃存更加實惠時,你必須考慮到可能的性能影響。在幾近零響應時間的存儲介質上添加任何層都會對性能產生影響,但關鍵問題是“應用程序或用戶會注意到這層的影響嗎?”你總是可以通過增加處理能力和內存來減輕性能影響的。
選擇你所適用的數據縮減方法
對于絕大多數數據中心,任何數據縮減方法所帶來的相關開銷幾乎都不被覺察。這些系統(tǒng)能夠充分利用那些大多數數據中心無法利用的性能,所以花費一些數據縮減的處理周期來降低閃存系統(tǒng)的成本顯然是值得的。
自動精簡配置(Thin provisioning)是一種圓滿的解決方案,幾乎適用于每一個環(huán)境。動態(tài)增加一個卷的容量當然會產生開銷,但它是很小的。這種技術作用很大,因為其他形式的數據縮減方法都不能對其進行優(yōu)化。它將新增容量硬分配給指定的LUN,并且不再被其它所有LUN共享。
重復數據刪除技術(Dedupe)能夠跨文件消除數據的冗余部分。重復數據刪除的回報是顯而易見的,尤其是在虛擬環(huán)境中,不同的客戶操作系統(tǒng)之間的數據其實存在著大量的共性。
然而,重復數據刪除可能顯著增加對性能的需求。它會創(chuàng)造大量的元數據,用于跟蹤那些冗余數據中的獨特數據和指針??焖賯鬟f重復數據刪除所需要的元數據對于整個系統(tǒng)的性能是個關鍵。盡管閃存會帶來一定幫助,在系統(tǒng)擴展時繼續(xù)跟蹤冗余還是需要更多的CPU能力,進而導致存儲系統(tǒng)采購成本的提高。
壓縮(Compression)也能夠降低對存儲容量的占用,它從根本上消除文件內的冗余,而不是文件之間的冗余信息。盡管壓縮不可能提供像重復數據刪除所提供的那么高的縮減比率,例如9:1,它提供的是一個更加一致的處理結果,因為它作用于所有文件,并且無需創(chuàng)建跨文件的冗余信息。這種文件級的高效率使壓縮特別適用于數據庫和其他單文件信息。
同步(線內)需求
數據縮減對于全閃存和混合存儲系統(tǒng)能夠帶來兩方面明顯的好處:
·有助于減少總容量需求。許多全閃存陣列廠商聲稱它們產品的價格點低于$3/GB,有的甚至宣稱低于$1/GB。實際結果的不同取決于具體數據縮減實現的效率,并且每個數據中心對于這些技術需要達到的效率水平也多少有一些各自的特殊要求。
·數據縮減。如果能夠做到同步(線內),將有助于延長閃存模塊的壽命。閃存模塊在寫操作上的局限性已廣為人知,它們都有預期的最大寫入次數。
在數據被寫入閃存之前執(zhí)行這三個數據縮減方法,這被稱為同步(線內)數據效率(inline data efficiency)。例如,如果你使用了所有三種方法,你能達到5:1的縮減比率 - 一個合理的結果。 5:1的數據縮減意味著寫操作減少為原先的20%,這將顯著延長閃存模塊的使用壽命。
那么哪種方法最好呢?這取決于使用場景 - 大多數數據中心正在為各種不同的工作負載部署并使用閃存。曾幾何時,每種數據縮減方法對于某特定類型的工作負載最為有效。而對于混合工作負載,最有效的系統(tǒng)應該是具有上述三種功能,并且能夠同步進行數據縮減的。目前,能夠同時提供三種功能的系統(tǒng)還很少見。
對于具體應用場景,答案會有所不同。例如,在數據庫環(huán)境,經過壓縮的系統(tǒng)就已經足夠了。如果該數據庫有非??量痰男阅芤螅敲床唤涍^數據縮減操作或者關閉數據縮減可能是必要的。對于虛擬環(huán)境,使用具有重復數據刪除功能的系統(tǒng)可能更加適合。
數據縮減的替代方案:本機容量
數據縮減的一種替代方案是本機容量。在過去,不帶數據縮減功能的通用閃存陣列系統(tǒng)價格過于昂貴。但現在,像TLC和3D NAND等新興的高密度閃存技術,使得全閃存陣列得以突破$1/GB甚至更低。這些新技術雖然在耐用性方面問題更大一些,但它們可以與更可靠的SLC聯合使用,充當對寫操作更加敏感的TLC層的減震器。
這種方法的優(yōu)點是,數據中心能夠確切知道每GB的成本,無需再操心數據縮減變量以及使用它所產生的性能開銷。
毫無疑問,數據縮減技術使全閃存數據中心的概念更加現實。數據縮減技術的每個支柱——重復數據刪除,壓縮和自動精簡配置,都具有價值。然而,當全閃存陣列可以集三大功能于一身,并且在數據寫入閃存模塊之前能夠完成同步(線內)數據縮減操作時,這些方法才是最有效的。