精選部落格系列|加速基於同態加密的隱私保護機器學習

語言: CN / TW / HK

隨著機器學習在當今的企業和軟體平臺中的廣泛使用,跨人工智慧 (AI) 平臺的隱私保護技術的解決方案也顯得非常重要。雖然這個想法在今天看起來很明顯,但人工智慧研究社群歷來更專注於打破資料孤島的界限,並將資料從一個孤島匹配到另一個孤島,以此發掘以前未被發現的資料價值。

隨著人工智慧領域的成熟,很顯然,如果不保護私人資料,我們很可能會將我們的資料來源暴露在潛在的漏洞中,而引發難以預料的後果。今天,人工智慧行業已經通過與密碼學家密切的合作來應對和解決人工智慧技術的這一關鍵難題。有一種使隱私資料不公開的解決方法,即在加密的情況下進行資料計算,它被稱為同態加密。


什麼是同態加密?

同態加密(HE)屬於一類用於隱私保護計算的高階加密技術。它允許對加密資料進行計算,而無需解密,只允許授權方解密計算結果。這種獨特的加密技術允許資料在靜態、傳輸和計算過程中保持加密狀態。自 1970 年代後期以來,人們一直在尋求對加密資料進行任意計算的辦法,直到 2009 年,Craig Gentry首次描述了全同態加密(FHE)的構建方案。這一突破最終使加密執行任意計算成為可能。

同態加密(HE)可分為三大類:

1.完全同態加密(FHE)

由Craig Gentry於2009年首次描述,FHE是一種加密型別,支援同一方案中的加法和乘法,並允許對加密資料執行任意深度的通用計算,而無需解密它。FHE 方案的流行示例包括具有自舉功能變體的BGV[2]/ BFV[3],[4]/ CKKS[5], FHEW [6]和 TFHE[7]。FHE計劃正在積極研究和開發,並正在進行標準化過程。

2.完全分級同態加密(FLHE)

也稱為分級同態加密(LHE),它類似於FHE,但更具限制性,因為它允許有限的(或預定的)計算深度。流行的例子包括沒有自舉的BGV,BFV和CKKS。這些方案變體也在進行標準化稽核。

3.部分同態加密(PHE)

這種形式的加密已經存在多年,它允許對加密資料進行加法或乘法(但不能兩者兼而有之),而無需對其進行解密。PHE的流行例子是RSA[8]、Paillier密碼系統[9]和 ElGamal 加密[10]方案。這三種方案是標準化的,在當今的生產環境中很常用。

從部分同態解決方案開始

 

FHE被認為是密碼學的聖盃。資料在其整個生命週期,包括在靜態、傳輸中以及計算時都保持加密狀態。在 2009 年出現時,其計算開銷被認為太慢,無法用於任何實際用途。從通用的角度,FHE在標準化和效能上仍然有所缺乏,因而許多使用者在實現基於HE的實際應用程式時是有所保留的。而過去十年的發展已經開始釋放同態加密的在實際應用中的潛力,特別是在那些受監管的行業以及那些保護資料的隱私和機密性至關重要的行業。

時代在發展,“壞人”也更老練了。因此,我們需要更安全的應用程式。現在,通過與英特爾的合作,我們可以使用基於硬體加速的部分同態加密方案來解決效能差距,以更好地滿足市場需求。

英特爾工程師開發了“Intel Paillier Cryptosystem Library”(IPCL)[12],這是第一個開源且符合 ISO 標準的Paillier 密碼系統軟體實現。IPCL 利用高階向量擴充套件指令集 512 (AVX512) 和整數融合乘法累加 (IFMA) 功能,可以在第三代英特爾®至強®可擴充套件處理器上發揮它的優勢。

IPCL被視為聯邦學習解決方案中,有關隱私保護方面的安全標準化中的重要一步:通過IPCL,聯邦學習可以在保證高效能的條件下,使用Paillier加密系統在計算過程滿足資料隱私保護法規。現在,英特爾與 VMware 合作,將該核心技術以及打包和管理一起整合併發布,使其成為一個完整、易於部署的解決方案。該合作將幫助 VMware構建更好的基於 HE的產品和方案。

在 KubeFATE 中試驗 IPCL

VMware  CTO辦公室部門的前沿技術團隊(Advanced Technology Group, ATG)開發了KubeFATE[13],它是一種企業級的、可在 Kubernetes 上為資料中心構建聯邦學習的解決方案。作為開源專案Federated AI Technology Enabler (FATE,目前託管在 LF AI & Data 基金會)[14]的一部分,KubeFATE用於管理跨組織的基礎設施和服務。

FATE實現了基於同態加密(HE)和多方計算(MPC)的安全計算協議。通過將 IPCL 與 FATE 整合,KubeFATE在最新的英特爾處理器上執行時可以享受效能提升。IPCL 中的關鍵數學函式利用英特爾 AVX512 實現 SIMD 並行性,利用整數融合乘加 (IFMA) 指令集加快處理速度。有關該加速方案的更多詳細資訊,請參閱之前的一篇文章[15]。

下圖顯示了將 IPCL 整合到 FATE 中時更細節的各層元件的關係。此新功能已經在 FATE v1.9 版本中以預覽形式釋出。在這其中使用了IPCL in Python庫(即圖中的IPCL Python Wrapper)來方便 IPCL 與基於 Python 的框架的整合。

展望不久的將來

英特爾和VMware曾合作為變電站引入虛擬化技術,並共同在美國電網現代化方面取得了巨大進步[16]。這個現代化過程的下一個需求就是整合下一代加密方案,例如HE和後量子密碼學。

電網系統是非常適合這種現代化發展的,除此之外,供水和下水道系統也是(現代化程序的)主要候選者。此類關鍵基礎設施的管理者也在尋找方法來遵守新的安全和隱私法案,如加州消費者隱私法案(CCPA)[17]、歐盟通用資料保護條例 (GDPR)[18]和白宮行政命令14028[19]。

除了公用事業之外,應用了多雲技術的企業也在積極尋找採用這些技術的方法,以確保其最關鍵的業務資料安全。據分析公司普華永道(PwC)稱:這些公司正在積極尋找機會利用人工智慧解決方案來分析敏感資料集,以做出更快的業務決策並獲得新的見解[20]。Gartner 將隱私增強計算列為 2022 年第三大最重要的戰略趨勢[21]:

“隱私增強計算可以保護在不受信任的環境中處理個人資料——由於不斷變化的隱私和資料保護法律以及消費者日益增長的擔憂,這一點變得越來越重要。隱私增強計算利用各種隱私保護技術,允許從資料中提取價值,同時仍滿足合規性要求。”

我們正處於不斷探索同態加密(包括部分同態加密和完全同態加密)在解決實際問題的用法旅程的初期。接下來,我們將圍繞同態加密構建解決方案,並利用英特爾的其他開源庫(如 HEXL 和英特爾同態加密工具包)進行加速。

內容來源|公眾號:VMware 中國研發中心

「其他文章」