數據水印數據安全防護
傳統的數據安全防護是努力的建設安全環境,將數據牢牢的鎖在”“中,就好像一個的人被關在屋子里,一旦數據要共享出去,則意味著這個人被曝光了,而數據脫敏則是為這個人穿上了一件衣服,從根本上保障數據安全。脫敏支持結構化數據(企業ERP、財務系統、數據庫)和非結構化數據(像企業經營活動中存儲或處理的圖片、視頻、文檔、郵件等)保護,對于半結構化數據(XML和JSON)及非結構化數據,所需要的安全防護策略更為復雜,需要針對各個數據泄露途徑展開防護。
什么是數據水印?
金融業機構開展金融數據安全防護工作過程中,越來越多的數據庫數據通過網絡進行存儲和發布,這些數據往往包含有各類敏感信息,即使經過脫敏后仍然有巨大的社會價值與經濟價值,一旦出現數據泄露,后果也是無法想象的。
因此,需要使用數據水印技術在數據交換及數據使用中的分發共享、委托處理等環節標明數據的所有者、數據分發對象、分發時間、分發途徑及使用范圍等信息。
數據庫水印算法一方面需要更好地將水印標識信息隱藏到數據庫中,另一方面需要滿足嵌入后的透明性——僅允許一定范圍內失真,因此它本質上可看成一個帶約束條件的優化問題。從信號角度來看,數據庫水印嵌入過程可看成一個大信號疊加了一個小信號,經過有噪信道后,如何檢測到小信號——小信號的編解問題。根據水印嵌入過程是否需要改變原始數據庫的元組的屬性值和格式,嵌入方法主要可分為兩大類:
1) 基于元組修改的水印嵌入算法:實質上,任何水印信息可編碼轉換成一連串由“0”和“1”組成的比特字符串。針對元組的數值屬性(如年齡、時間戳)和類別屬性(如地址信息等)兩種類別,嵌入方法可再分為兩種子類別:0”或“1”兩種水印比特。為了保留數據可用性,修改應滿足一定的約束條件(如統計特性)。簡單的方式,是在數值屬性值的很低有效位(Least Significant Bit, LSB)進行替換,比如在年齡18(二進制“10010”)很小LSB位嵌入“0”變為18( “10010”),嵌入“1”變為19(二進制“10011”)。其他可以在小數點后進行嵌入,或者使用不同的量化索引等嵌入機制。類別屬性的嵌入方法:類別屬性不能直接修改數值編碼,一種思路是嵌入數據庫用戶不易察覺的字符或標點,比如通過在類別屬性值末尾嵌入回車符、換行符表示“0”“1”,以及嵌入不同的空格數量等,常見嵌入規則如表1所示;另一種思路是基于語義的近義詞進行嵌入,首先構建關鍵詞的近義詞庫并確立順序,嵌入過程根據約定規則嵌入“0”或“1”比特。