個人隱私安全這個話題如今儼然已經不是一個新話題,而是一個熱話題,究其緣由一是國家對于個人隱私安全越來越重視,相繼出臺了一系列政策法規;其次是大家對于自己個人隱私安全的意識加強;還有一個重要原因是各種個人隱私泄漏事件為各類組織自身帶來的損失越來越大,這些損失即有直接的經濟損失,更有對品牌形象的間接影響。這些都促使各類組織越來越重視個人隱私數據的保護,數據脫敏產品作為個人隱私保護的一款利器,已經被越來越多的組織采用。那么面對市面上越來越多的數據脫敏產品,組織要如何區分?又如何選擇一款適合自己的數據脫敏產品呢?本文將從靜態脫敏與動態脫敏的應用場景、基本功能、附加功能來詳細介紹,為大家提供可借鑒的建議。
一、怎么選擇脫敏技術
數據脫敏技術一般分為動態脫敏和靜態脫敏兩種,這兩種技術適用于不同的脫敏場景:
靜態脫敏一般用于將生產庫中的數據導出外發使用場景,如用戶生產庫中的數據需要拿到測試、開發、分析等第三方使用環境中。
動態脫敏適用于不脫離生產環境,對敏感數據的查詢和調用結果進行實時脫敏。如客服系統,客服人員需要實時的調用生產庫里的數據進行查詢、外呼等操作,但是客服人員沒有必要看到用戶所有的真實信息,那么就需要對查詢返回的結果實時脫敏,讓客服人員看到部分數據但又不影響對業務的操作。還比如數據運維管理、應用訪問,這些場景不需要對生產數據庫中的數據進行任何改變,但需依據用戶的角色、職責和權限的不同看到不同級別的脫敏數據。
二、數據脫敏應該具備的基本功能
無論是靜態脫敏還是動態脫敏都應該具備以下的基本功能:
1、敏感數據發現:只有定位到敏感數據存在哪,才能完成脫敏任務。所以無論靜態還是動態脫敏產品都應該具備敏感數據發現功能。比如能夠按照用戶指定的一部分敏感數據或預定義的敏感數據特征,在執行任務過程中對抽取的數據進行自動的識別并發現敏感數據。
2、豐富的脫敏算法:脫敏產品應該具備豐富的脫敏算法以滿足不同的脫敏場景需求,例如同義替換、部分數據遮蔽、混合屏蔽、確定性屏蔽等脫敏算法,同時支持用戶自定義脫敏算法以及按自定義函數定義脫敏算法。
三、好的數據脫敏還應該具備什么功能
1、一款好的靜態脫敏產品應具備以下功能:
確保數據脫敏有效性:保證脫敏后的數據能夠準確反映原始數據的業務屬性和數據分布特征,例如對于原始數據中的姓名、地址、病癥、企業名稱等信息需要在脫敏后仍然具有可讀性;脫敏后的數據需要滿足業務系統的數據規則,能夠正確的通過業務系統的數據有效性驗證,如身份證號、銀行卡號的校驗碼,生日數據的區間,有效的發卡行信息,年齡與出生日期的匹配等。
保留數據關聯性:脫敏后的數據應能滿足業務系統的數據關系特征,嚴格保留原有的數據關系;例如身份證號在多個表中出現,需要保證這些數據經過脫敏后也是一樣的。另外,對于具有時間序列關系的數據,需要保證每個日期脫敏后仍然能夠保持原有的時間序列。
保證高效脫敏:高端場景下的數據量很大,包括表數量多,單表數據多,每日增量數據多等等。為了能夠盡可能節省人工勞動成本,脫敏產品的性能一定要高,最好能夠支持增量數據定期自動執行脫敏。
2、一款好的動態脫敏產品應該具備以下功能:
全面的權控體系:在實際場景中通常會涉多個數據庫的監控和脫敏,這些數據庫一般都關聯歸屬于不同業務,甚至還存在代理運維第三方業務的情況。所以針對這種復雜的人員結構以及復雜的業務場景,動態脫敏產品應具備根據不同數據庫組、用戶、角色實現不同的數據脫敏能力。
高性能脫敏能力:動態脫敏產品的使用場景決定了需要保證脫敏的及時性和高效性。最好能夠保證在脫敏字段多且結果集龐大的情況下控制數據訪問性能下降不超過10%。
完備的容災機制:動態脫敏產品一般會采用串聯部署模式,為防止異常斷電、設備遷移等外界因素導致設備不能正常啟用時,動態脫敏應該可以通過HA主備來應對風險的發生。通過系統容災管理配置,在異常發生導致其中一臺設備不可用時,動態脫敏設備可以自動將策略、會話等信息同步給備機,并且繼續實現脫敏、防護等作用,快速的主備切換幾乎不會延誤用戶的業務操作以及數據庫使用。
四、相關鏈接
1、 數據脫敏相關技術
? 數據脫敏的主要方式
? 數據庫靜態脫敏是什么?
? 靜態脫敏集群部署架構下的應用探索
? 動態數據脫敏不同技術路線對比
? 國內動態脫敏技術演進技術探討
? 敏感數據的“用”、“護”之道-靜態脫敏
? 敏感數據的“用”、“護”之道-動態脫敏
2、 數據脫敏系統怎么選
? 好的靜態數據脫敏產品應具備哪些能力?
? DMS數據脫敏系統:滿足多場景需求
? 銀行數據脫敏場景需求與解決思路
? 靜態脫敏與動態脫敏的區別
? 靜態脫敏的部署模式
? 靜態脫敏的應用場景及特點