對備份的需求是基于數據的重要性和系統的穩定性。通常需要備份,即使分布式存儲有多個副本,以確保一定數量的數據恢復。但為了安全期,要防止整個系統停機,還是要備份。備份的選擇主要從兩個方面考慮。一是分布式存儲系統本身所支持的備份和恢復,這是對應用系統的保障。
是否需要備份建議保存數據業務系統的重要性級別,如業務系統需要地方、城市或超出了備份數據,然后建議應用程序備份數據備份,不進行備份存儲,這樣可以保持統一整體備份架構,避免了備份造成的大量無用數據的浪費,備份設備容量大。應用端備份可以使用統一的備份軟件,如NBU、TSM等。
在分布式存儲系統中,系統可用性是最重要的指標之一,需要保證在機器發生故障時,系統可用性不受影響,為了做到這點,數據就需要保存多個副本,并且多個副本要分布在不同的機器上,只要多個副本的數據是一致的,在機器故障引起某些副本失效時,其它副本仍然能提供服務。同時,分布式存儲還支持糾刪碼技術,具體技術實現可以參考相關的技術文檔,糾刪碼技術相對副本技術而言,極大地節省了存儲空間,一般1:1.5左右甚至更低的空間即可,但是會消耗部分的CPU資源來進行數據冗余/恢復的計算。
依然需要備份,分布式存儲的副本或糾刪碼是防止存儲部件損壞造成數據丟失或業務暫停,哪怕分布式存儲啟用快照功能,也是無法防止物理故障。備份的意義在于使用與存儲完全隔離的故障域來保護數據,分離的存儲操作系統,不同的物理設備,不同的物理區域,以防止物理故障,邏輯故障。
方式的話有
1.備份軟件+硬盤設備或磁帶設備;
2.存儲之間的復制;
3.以及現在新的存儲至對象存儲方式,其本質是存儲自帶備份小軟件將屬于備份到硬盤設備的方式