一、方案背景
隨著檔案事業進一步發展,檔案數字化進程不斷加快,電子檔案的長期保存成為了十四五規劃中的重中之重。規劃中明確要求“扎實做好重要電子檔案備份工作,建設能夠支撐各級國家檔案館開展重要電子檔案異地異質備份的專業化備份環境,對離線備份載體根據技術特性進行系統化監測及管理保證電子檔案安全備份。為了解決各級各類檔案館電子檔案長期安全及異質備份保存的硬性需求,某司結合多年冷數據存儲設備研發經驗,聯合國內數十家檔案管理系統廠商,推出了存電子檔案異質備份與長期保存一體化解決方案。
二、方案架構
電子檔案長期保存系統是“異質備份電子檔案庫房一體化解決方案”的核心系統。該系統作為電子檔案數據生命周期中的“最后一站”,承擔了原版、高質量電子檔案數據的穩定、安全存儲的職責長期保存系統通過磁盤存儲+藍光光盤存儲的雙介質存儲的方式,將電子檔案數據進行雙副本方式進行存儲,當其中任何一個副本發生損壞時,都能進行相互恢復。每種介質內部也都實現了相應的數據安全存儲策略:磁盤存儲系統中使用離線硬盤作為電子檔案數據存儲介質;藍光存儲系統中使用歸檔級藍光光盤作為數據存儲介質,搭配上異地全量數據備份邏輯,能夠可靠保證珍貴電子檔案的安全、穩定存儲。

三、方案優勢
(一)整體優勢
合規性:檔案法、檔案歸檔標準的強制要求與合規性。
低成本:降低傳統IT設備的維護成本、周期和能源消耗。
自主可控:全自主可控技術,避免國外技術壟斷風險。
檔案創新:十四五規劃要求,頭部單位已經完成規劃或建設。
數據安全:雙介質+異地存儲,珍貴電子檔案更安全。
(二)核心優勢
離線存儲核心要求——單盤可讀。單盤可讀總體來說就是使用開放的數據協議、接口來保證存儲在光盤中的珍貴資料在若干年后仍能通過標準兼容設備、在不依賴于任何廠商專用設備和系統的情況下進行數據回讀。
具體來說,在藍光光盤庫上實現單盤可讀需要保證以下三個方面:
1.藍光標準
需要使用標準藍光光盤和藍光光驅,藍光標準是國際通用的一種光盤標準,目前市面上流通的民用級或專業級光驅都是遵循藍光標準的,可以正常讀寫任何符合藍光標準的盤片。目前標準藍光光盤有25/50/100/200G幾種標準容量,標準藍光盤可以使用任何藍光光驅進行數據回讀,適合資料長期保存。市面上存在超過200G的盤片如300G、500G盤目前不是藍光(BD)標準這種非標盤只能在某些廠商專用設備搭配專用系統讀取,而且目前只有部分日系廠商有AD盤技術且不公開,所以不能用于資料的長期保存。
2.數據完整
需要保證資料在單盤上的完整性從數據結構上來說,就是保證一個電子文件不能采用部分分割的方式或加密方式等進行保存,即一個文件需要完整存儲在一張光盤中。這就要求我們在存儲文件時,不能采用諸如RAID或者條帶化技術對數據進行分割存儲。此外,電子檔案領域還存在“不跨卷、不跨件”的邏輯存儲要求,即要求一個案卷不能拆分到多張盤進行存儲,一件檔案不能拆分到多張盤進行存儲。當然某些條件下,如單案卷過大,超過單張盤容量時,可以允許跨盤接續存儲。
3.開放協議
要求光盤存儲數據使用的文件系統應該是公開的、廣泛被大多數操作系統所支持的,不能采用私有文件系統協議進行保存,否則,即使是藍光標準的光驅和光盤,用戶仍然不能解碼其中的文件結構和數據。目前UDF文件系統被幾乎所有操作系統所支持,采用UDF文件系統刻錄的光盤在所有操作系統中都能正常讀取文件結構和內容。
四、方案組成
(一)硬件
電子檔案長期保存一體機
(二)軟件
1.電子檔案長期保存系統
系統架構:管理軟件采用B/S架構,可通過瀏覽器管理設備及數據;
存儲支持:支持掛載多種離線存儲設備,如光盤庫、離線硬盤庫等;
可視化顯示:提供載體可用容量、已用容量、數據來源容量以及占比等信息的可視化顯示;
數據檢索:對檔案數據進行簡單的元數據分析能力,支持多元數據字段檢索,支持對存儲在本系統的檔案數據進行檢索,如:檔案類型、文號、檔號等,具備基本的檔案檢索能力;
四性檢測:能夠對上傳至本系統的文件進行真實性、完整性、可用性及安全性檢測;
自動任務:支持內置定時任務功能,提供檢測任務的自動化無人值守管理;
數據安全:支持定期自動發起針對不同存儲介質中的數據進行安全檢測,檢測過程遇到文件錯誤和介質異常能夠及時報警,支持使用不同介質的文件進行數據恢復。
2.藍光光盤庫存儲系統
按需提供20~1600TB容量;
單盤可讀,內置全自動機械臂;
配置檢測光驅,實現自動質檢;
符合《DA/T 74》規范。
3.離線硬盤庫存儲系統
5U48盤位高密度硬盤安裝;
每塊硬盤獨立供電,按需啟動;
智能風扇,降低能耗;
支持不同容量、接口硬盤混用;
定期S.M.A.R.T與數據檢測;
符合《DA/T 75》規范。
五、技術對比
