隨著國家提出大數據促進經濟社會轉型發展的戰略思路,大數據平臺建設目前已經是政務信息化建設中的焦點內容,各省級政府依托強大的信息化體系率先做出嘗試。大數據平臺業務系統搭建之初,作為整個平臺穩定、持續運行的基礎,安全建設方案會是整個平臺項目中重要的一環。
大數據平臺整體安全建設,從數據采集到數據資產的梳理,再到平臺的訪問安全管控和數據存儲安全,以及數據共享分發過程中的版權保護,整個安全方案如何形成數據訪問和使用過程的閉環,并且能夠實現安全策略的統一下發和協同配合,是擺在平臺建設方面前的棘手問題,本文以某大數據平臺安全建設方案為參考,拋磚引玉,共同探討行之有效的安全建設思路,該方案已經初步得到建設方認可,具備可落地基礎。
業務需求:數據梳理
在進行安全建設之初,針對需要保護的信息資源,需要先進行狀況摸底:
1)提供對部門的組織結構、業務角色、信息資源類別、信息化系統等的管理和維護功能;
2)能夠對業務流程圖和數據流程圖進行管理,能夠識別協同關系和信息共享需求,能夠明確職責、挖掘、整合數據資源、規范數據表示;
3)能夠對數據庫的主題庫、邏輯實體、實體關系圖、數據映射圖、數據元標準、信息分類編碼進行管理。
技術實現:數據庫漏掃、數據資產梳理
數據庫漏掃:實現對數據庫系統的自動化安全評估,能夠有效暴露當前數據庫系統的安全問題,對數據庫的安全狀況進行持續化監控。利用數據庫漏掃產品覆蓋傳統數據庫漏洞檢測項;實現弱口令掃描、敏感數據發現、危險程序掃描、滲透測試等高端檢測能力;通過預定義安全策略、自定義安全策略,實現高效、有針對性的安全狀況掃描檢測,和通過各種角度、各種專題、詳略不一的報表直觀呈現數據庫系統的安全狀況樣貌。
數據資產梳理:實現數據資產的“靜態+動態”梳理
靜態梳理:實現數據庫自動嗅探:自動搜索企業中的數據庫,可指定IP段和端口的范圍進行搜索,自動發現數據庫的基本信息;按照敏感數據的特征或預定義的敏感數據特征對數據進行自動識別,持續發現敏感數據;根據不同數據特征,對常見的敏感數據進行分類,然后針對不同的數據類型指定不同的敏感級別。
動態梳理:對平臺數據庫系統中不同用戶、不同對象的權限進行梳理并監控權限變化。監控數據庫中用戶的啟用狀態、權限劃分、角色歸屬等基本信息;歸納總結用戶訪問情況,尤其針對敏感對象,能夠著重監測其訪問權限劃分情況。數據流轉梳理,對數據應用程序、運維工具、腳本等程序和人員對敏感數據的操作進行監控和分析,形成敏感數據內部流轉路線圖,展示敏感數據是如何被處理和流轉的;監控異常流轉情況,及時發現數據違規使用風險。
綜上,通過安全風險掃描、檢測和資產梳理可以明確信息資源的出口、入口,數據間關系,摸清各部門的業務需求、數據需求和集成需求,能夠提供信息資源的文檔的自動化生成(數據庫設計文檔、信息資源目錄、實體關系圖等),以及通過思維導圖等方式展示信息資源。
業務需求:采集過程中的數據共享
各政府職能單位信息匯聚采集(公安、民政、人社等)、互聯網入口公眾信息采集(政府網站、微信、社會學術庫、企業信息等場景需求下,需要共享數據,但敏感數據不能全部開放。
技術實現1:動態脫敏
將動態脫敏系統部署在數據的共享、交換、應用、運維區,與數據庫之間;形成自動化的敏感數據匿名化邊界,防止隱私數據在未經脫敏的情況下從數據區流出。
提供基于數據庫訪問來源IP、數據庫應用系統、應用系統賬戶、時間等因素的策略,對需要共享的敏感數據,可根據數據的敏感級別和應用的需要,靈活的配置動態脫敏策略,從而實現外部應用能夠安全可控的使用共享的敏感數據,防敏感數據泄露。根據不同數據特征,內置豐富高效的動態脫敏算法,包括屏蔽、變形、替換、隨機;支持自定義脫敏算法,用戶可按需定義。
技術實現2:數據脫敏(靜態)
數據脫敏(靜態):利用對數據的靜態脫敏技術,有效防止大數據平臺內部對隱私數據的濫用,防止隱私數據在未經脫敏的情況下流出。既滿足隱私數據保護,又滿足開發、測試、模型訓練等業務對數據的需求,同時也保持監管合規,滿足企業合規性。
業務需求:大數據平臺的統一資源管控
大數據平臺的數據使用管控需要實現資源管理、安全管理、運維管理、集群部署及監控、任務調度等功能,同時配備友好的管理界面。
數據庫審計:通過對訪問數據庫的所有網絡流量進行采集、解析、過濾、分析和存儲,全面的審計所有對數據庫的處理行為,滿足大數據平臺對數據處理進行監控、收集和記錄的需求。
數據庫防火墻:將數據庫防火墻部署在應用系統和數據庫之間,能夠防護由于WEB應用漏洞、應用框架漏洞等原因造成的黑客攻擊數據庫,竊取敏感數據;確保大數據平臺核心數據資產的共享安全。
數據庫安全運維系統:基于角色管理的細粒度的數據庫運維控制功能,精確到SQL語句,確保核心數據資產的合規使用;針對不同的數據庫用戶,提供操作權限、訪問控制,限制NO WHERE更新和刪除,避免大規模數據泄露和篡改;提供雙因素鑒別和登錄控制能力,防止數據庫賬戶泄漏和濫用;提供用戶權限細粒度管理,對敏感數據的操作進行嚴格管控;控制和審計動作、全面精細審計分析,提供實時訪問統計圖。
業務需求:存儲安全
對于落地到大數據平臺的數據資源,除了訪問管控,需要對其中高密級數據增加存儲加固手段,作為數據安全防護的底線。
技術實現:數據庫加密
強化大數據平臺數據安全,實現整體數據安全加固,防止數據外泄。加強對敏感數據的加密訪問和存儲,敏感數據呈現中對關鍵字段進行加密。安華金和的數據庫加密產品DBCoffer可以針對表空間實現表空間級加密,對表空間內的所有數據全部進行加密,增強數據安全性;支持表級加密,增強安全的同時又兼具靈活性;在不影響數據庫本身權限的同時,系統增強了權限控制,分別從數據庫用戶,客戶端IP,應用系統等不同層面對權限增強,全面防止越權訪問,防止數據泄露;安全服務組件實現對密鑰的管理,讓用戶自己掌握密鑰,即使數據被盜也無法查看明文。
業務需求:支撐大數據分析運算
通過從運維端進行大數據分析,實現對海量數據提供高效的分析和計算。數據分析挖掘引擎支持并行化統計算法和機器學習基礎算法庫,支持的并行化基礎算法,能夠處理大數據集。具體功能要求包括查詢、關聯分析、統計分析、報表展示、數據挖掘以及二次開發等。
技術實現:數據脫敏(靜態)
針對海量數據進行分析計算,是典型的數據庫脫敏系統面臨的分析場景,在此場景下對將生產數據中的部分敏感數據進行脫敏處理,有效防止大數據平臺內部對隱私數據的濫用,防止隱私數據在未經脫敏的情況下流出。針對數據分析這一應用場景,支持對目標數據庫中部分數據進行脫敏,可根據指定的過濾條件對數據來源進行過濾篩選形成數據子集。在脫敏產品的使用過程中,面對生產環境中數據或數據結構頻繁發生變化的場景,及時調整脫敏策略,防止敏感數據“漏網”現象,引發敏感數據泄露。
業務需求:政務部門的公開下載和服務
提供政務部門可公開各類數據的下載與服務,為企業和個人開展政務信息資源的社會化開發利用提供數據支撐,推動信息資源增值服務業的發展以及相關數據分析與研究工作的開展。
技術實現:數據脫敏(動、靜)、數據水印
數據脫敏:使用動態+靜態數據脫敏技術,實現對外數據公開下載以及開發利用等服務過程中的數據安全。
數據水印:通過系統外發數據行為流程化管理,對數據外發行為事前數據發現梳理、申請審批、事中添加數據標記、自動生成水印、事后文件加密、外發行為審計、數據源追溯等功能,避免外發數據泄露無法對事件追溯,提高了數據傳遞的安全性和可追溯能力。系統通過智能自動發現功能輔助用戶發現敏感數據完成外發數據梳理;通過對原數據添加偽行、偽列、對原始敏感數據脫敏并嵌入標記等方式進行水印處理,保證分發數據正常使用。水印數據具有高可用性、高透明無感、高隱蔽性不易被外部發現破解。一旦信息泄露第一時間從泄露的數據中提取水印標識,通過讀取水印標識,追溯數據流轉過程,精準定位泄露單位及責任人,實現數據溯源追責。
整個大數據平臺的安全建設工作,不是簡單的安全產品的堆砌,它需要基于專業的安全建設思路來建立完整的數據安全防護體系,滿足業務需求的同時,兼顧安全需求。