精選博客系列|加速基於同態加密的隱私保護機器學習
隨着機器學習在當今的企業和軟件平台中的廣泛使用,跨人工智能 (AI) 平台的隱私保護技術的解決方案也顯得非常重要。雖然這個想法在今天看起來很明顯,但人工智能研究社區歷來更專注於打破數據孤島的界限,並將數據從一個孤島匹配到另一個孤島,以此發掘以前未被發現的數據價值。
隨着人工智能領域的成熟,很顯然,如果不保護私人數據,我們很可能會將我們的數據源暴露在潛在的漏洞中,而引發難以預料的後果。今天,人工智能行業已經通過與密碼學家密切的合作來應對和解決人工智能技術的這一關鍵難題。有一種使隱私數據不公開的解決方法,即在加密的情況下進行數據計算,它被稱為同態加密。
什麼是同態加密?
同態加密(HE)屬於一類用於隱私保護計算的高級加密技術。它允許對加密數據進行計算,而無需解密,只允許授權方解密計算結果。這種獨特的加密技術允許數據在靜態、傳輸和計算過程中保持加密狀態。自 1970 年代後期以來,人們一直在尋求對加密數據進行任意計算的辦法,直到 2009 年,Craig Gentry首次描述了全同態加密(FHE)的構建方案。這一突破最終使加密執行任意計算成為可能。
同態加密(HE)可分為三大類:
1.完全同態加密(FHE)
由Craig Gentry於2009年首次描述,FHE是一種加密類型,支持同一方案中的加法和乘法,並允許對加密數據執行任意深度的通用計算,而無需解密它。FHE 方案的流行示例包括具有自舉功能變體的BGV[2]/ BFV[3],[4]/ CKKS[5], FHEW [6]和 TFHE[7]。FHE計劃正在積極研究和開發,並正在進行標準化過程。
2.完全分級同態加密(FLHE)
也稱為分級同態加密(LHE),它類似於FHE,但更具限制性,因為它允許有限的(或預定的)計算深度。流行的例子包括沒有自舉的BGV,BFV和CKKS。這些方案變體也在進行標準化審核。
3.部分同態加密(PHE)
這種形式的加密已經存在多年,它允許對加密數據進行加法或乘法(但不能兩者兼而有之),而無需對其進行解密。PHE的流行例子是RSA[8]、Paillier密碼系統[9]和 ElGamal 加密[10]方案。這三種方案是標準化的,在當今的生產環境中很常用。
從部分同態解決方案開始
FHE被認為是密碼學的聖盃。數據在其整個生命週期,包括在靜態、傳輸中以及計算時都保持加密狀態。在 2009 年出現時,其計算開銷被認為太慢,無法用於任何實際用途。從通用的角度,FHE在標準化和性能上仍然有所缺乏,因而許多用户在實現基於HE的實際應用程序時是有所保留的。而過去十年的發展已經開始釋放同態加密的在實際應用中的潛力,特別是在那些受監管的行業以及那些保護數據的隱私和機密性至關重要的行業。
時代在發展,“壞人”也更老練了。因此,我們需要更安全的應用程序。現在,通過與英特爾的合作,我們可以使用基於硬件加速的部分同態加密方案來解決性能差距,以更好地滿足市場需求。
英特爾工程師開發了“Intel Paillier Cryptosystem Library”(IPCL)[12],這是第一個開源且符合 ISO 標準的Paillier 密碼系統軟件實現。IPCL 利用高級矢量擴展指令集 512 (AVX512) 和整數融合乘法累加 (IFMA) 功能,可以在第三代英特爾®至強®可擴展處理器上發揮它的優勢。
IPCL被視為聯邦學習解決方案中,有關隱私保護方面的安全標準化中的重要一步:通過IPCL,聯邦學習可以在保證高性能的條件下,使用Paillier加密系統在計算過程滿足數據隱私保護法規。現在,英特爾與 VMware 合作,將該核心技術以及打包和管理一起集成併發布,使其成為一個完整、易於部署的解決方案。該合作將幫助 VMware構建更好的基於 HE的產品和方案。
在 KubeFATE 中試驗 IPCL
VMware CTO辦公室部門的前沿技術團隊(Advanced Technology Group, ATG)開發了KubeFATE[13],它是一種企業級的、可在 Kubernetes 上為數據中心構建聯邦學習的解決方案。作為開源項目Federated AI Technology Enabler (FATE,目前託管在 LF AI & Data 基金會)[14]的一部分,KubeFATE用於管理跨組織的基礎設施和服務。
FATE實現了基於同態加密(HE)和多方計算(MPC)的安全計算協議。通過將 IPCL 與 FATE 集成,KubeFATE在最新的英特爾處理器上運行時可以享受性能提升。IPCL 中的關鍵數學函數利用英特爾 AVX512 實現 SIMD 並行性,利用整數融合乘加 (IFMA) 指令集加快處理速度。有關該加速方案的更多詳細信息,請參閲之前的一篇文章[15]。
下圖顯示了將 IPCL 集成到 FATE 中時更細節的各層組件的關係。此新功能已經在 FATE v1.9 版本中以預覽形式發佈。在這其中使用了IPCL in Python庫(即圖中的IPCL Python Wrapper)來方便 IPCL 與基於 Python 的框架的集成。
展望不久的將來
英特爾和VMware曾合作為變電站引入虛擬化技術,並共同在美國電網現代化方面取得了巨大進步[16]。這個現代化過程的下一個需求就是整合下一代加密方案,例如HE和後量子密碼學。
電網系統是非常適合這種現代化發展的,除此之外,供水和下水道系統也是(現代化進程的)主要候選者。此類關鍵基礎設施的管理者也在尋找方法來遵守新的安全和隱私法案,如加州消費者隱私法案(CCPA)[17]、歐盟通用數據保護條例 (GDPR)[18]和白宮行政命令14028[19]。
除了公用事業之外,應用了多雲技術的企業也在積極尋找採用這些技術的方法,以確保其最關鍵的業務數據安全。據分析公司普華永道(PwC)稱:這些公司正在積極尋找機會利用人工智能解決方案來分析敏感數據集,以做出更快的業務決策並獲得新的見解[20]。Gartner 將隱私增強計算列為 2022 年第三大最重要的戰略趨勢[21]:
“隱私增強計算可以保護在不受信任的環境中處理個人數據——由於不斷變化的隱私和數據保護法律以及消費者日益增長的擔憂,這一點變得越來越重要。隱私增強計算利用各種隱私保護技術,允許從數據中提取價值,同時仍滿足合規性要求。”
我們正處於不斷探索同態加密(包括部分同態加密和完全同態加密)在解決實際問題的用法旅程的初期。接下來,我們將圍繞同態加密構建解決方案,並利用英特爾的其他開源庫(如 HEXL 和英特爾同態加密工具包)進行加速。
內容來源|公眾號:VMware 中國研發中心
- 虛擬雲網絡系列 | Antrea 應用於 VMware 方案功能簡介(二)
- 虛擬雲網絡系列 | Antrea 應用於 VMware 方案功能簡介(一)
- 精選博客系列|為雲服務商提供遠邊緣無線接入網絡架構的選擇和靈活性
- 精選博客系列|面向公共安全的SD-WAN Edge:刷新VMware邊緣計算棧
- 精選博客系列|將基於決策樹的Ensemble方法用於邊緣計算
- 精選博客系列|加速基於同態加密的隱私保護機器學習
- 雲原生安全檢測器 Narrows(CNSI)的部署和使用
- 雲原生安全檢測器 Narrows發佈,在Harbor上增加容器安全的動態掃描
- FedLCM:統一的聯邦學習生命週期管理平台
- TAP 文章系列-13 | 基於 Knative 的 TAP 雲原生運行時
- 大V科技談 | VMware雲和邊緣基礎架構創新實現突破性的性能提升
- TAP 文章系列-11 | 利用 TAP 實現應用雲調試與面向開發者的應用運行狀態監控
- TAP 文章系列-12 | 小步快跑的代碼掃描,實現質量左移
- TAP 系列文章5 | 雲原生構建服務
- 系列文章|雲原生時代下微服務架構進階之路 - Event Storming
- 系列文章|雲原生時代下微服務架構進階之路—微服務簡介
- 聯合解決方案系列|VMware MultiCloud Lab多雲大數據聯合方案展示
- TAP 系列文章2 | Tanzu Application Platform v1.1 安裝配置步驟
- 聯合解決方案系列|VMware和星雲Clustar聯合發佈多雲聯邦學習解決方案
- TAP 系列文章 | Tanzu Application Platform 的技術概覽