隱私計算,是一把開啟AI 資料流通之門的新鑰匙嗎?

語言: CN / TW / HK

不久之前,奇績創壇創始人&CEO陸奇博士在一個問答欄目中被問到當下對AI的看法,他表示,“我對於AI的熱情和關注主要來自於它可以給我們社會帶來的前景。”在陸奇看來,AI的核心就是一種“獲取知識,並運用知識來達成目標的通用能力”。而這是人類至今為止發明的用途最廣、功能最強的通用能力。 因為知識就是力量,是一種可以運用到我們想做的任何事物上的力量。

回看過去幾年,我國AI在資料驅動下走出實驗室,落地到金融、安防等多個領域,業內甚至流傳“得資料者,得人工智慧”的說法。2020年,國務院將資料列為繼土地、勞動力、資本、技術之後的第五種要素,以鼓勵資料的流通和價值體現。但出乎意料的是,短期內AI公司獲取資料的渠道反而變得更少。一方面,資料成為生產要素後,個人及政府對資料的價值認識和保護意識有所提升,企業會更有選擇地開放分享資料的型別和方式;另一方面,資料作為驅動企業發展的因素之一,在法律限制及自身利益的考量下,受到各企業嚴格管控。

AI公司的進一步發展需要更多資料,資料卻無法如過去般順暢流通,AI應用正陷入資料割裂的發展瓶頸。

對於如何在AI發展與隱私保護之間尋找平衡,清華大學計算機系教授張鈸給出兩個思路:一方面是隱私如何不被誤用和濫用。第二個方面是如何利用技術的手段來保護個人隱私或者團體的隱私,包括資料的安全等等。

前者屬於人工智慧的治理問題,後者則是技術問題。

與此同時,一群人發現,有著“資料可用不可見”特點的隱私安全計算或許能幫助AI公司走出資料困境,開啟資料流通之門。

什麼是隱私安全計算

隱私安全計算,是在資料處理分析計算過程中,保證資料提供方不對外洩露資料,無法被惡意攻擊或者其它非授權者獲取資料的技術集合,可實現資料的安全流通與利用。

一個經典問題:兩個百萬富翁在街頭相遇,他們都想知道彼此誰最富有,但又不想向對方透底,在沒有第三方的幫助下,怎樣才能知道誰最有錢?

這是2000年圖靈獎得主姚期智1982年提出的“百萬富翁”問題。姚先生提出的這個問題和他提出的解決方案,成為密碼安全領域的一個大方向,推動了隱私安全計算技術的發展應用。

近兩年,隱私安全計算正成為投資人看好的新行業。據前瞻經濟學人統計,2020年我國隱私安全計算行業新成立企業數量為71家,同比增長33.96%。

2021年5月至今的12個月中,該賽道的8家公司的8起融資累計超10億元,平均單輪融資金額過億元。

值得注意的是,大多數公司的融資事件發生在2020至2021年,這也反映著越來越多投資人發現了隱私安全計算的價值。

隱私安全計算的快速發展,一方面離不開演算法的進步及計算機效能的大幅度提升,另一方面也與政策相關。

過去十幾年間隱私計算的演算法得到了長足的進步,包括差分隱私、聯邦學習、同態加密和零知識證明等領域都獲得了突破性的進展。而隱私計算技術對算力與通訊頻寬的需求也由於計算機系統和硬體的發展獲得了很大的改善,隱私安全計算的技術終於能夠開始解決實際任務,而不僅僅是計算機領域的純理論問題。

政策方面,隨著《網路安全法》《資料安全法》《個人資訊保護法》三法相繼生效,倒逼企業在資料採集、處理、使用、流通全環節重視及增強資料保護,隱私安全計算行業因此得利。

國務院今年一月印發的《“十四五”數字經濟發展規劃》更明確提出:“鼓勵重點行業創新資料開發利用模式,在確保資料安全、保障使用者隱私的前提下,調動行業協會、科研院所、企業等多方參與資料價值開發。”

這一檔案的印發,或將進一步加速隱私安全計算技術的發展與行業應用。

過去幾年,隱私安全計算從醫療行業不斷延伸應用至金融、政務等不同領域,整個行業也越發熱鬧。

沸點資本副總裁馬蘭從投資人的角度,向雷峰網分享了近幾年她對隱私安全計算應用的觀察。

馬蘭注意到,2018年時很多金融機構將合規放在第一位,所以當時很多以監管為切入口的企業成長。政府2019年正式提出將資料作為生產要素後,資料安全被提升到與合規同等重要的位置。

不過人們發現,資料既做資產又做交易存在很大的資料安全問題,一批人此時將隱私安全計算引入以幫助解決這一問題。

得益於較大市場需求的出現,2020年隱私安全計算行業的原有企業發力,同時出現了一些新的創業公司,資本也相繼跟進。因此2020年至2021年,隱私安全計算創業者接連找到新的落地場景,甚至產生一定收入。

在馬蘭看來,儘管隱私安全計算行業處於動態變化之中,但整體向著積極、更安全的狀態發展。

AI與隱私安全計算的碰撞

AAAI國際先進人工智慧協會常務理事楊強曾向雷峰網表示,從2019年開始,他就明顯感受到人工智慧難以落地、應用模式沒有普適性、AI產品通用性不夠等問題出現得更加頻繁。

近年來全球多國將資料列為核心資產,資料因無法共享而形成一個個資料孤島,進一步阻礙AI落地。他認為,各行各業都存在資料壁壘,只有突破壁壘,增加資料的流通性,才能讓AI生態更好地發展。

在法規政策的要求下,科技頭部公司因為有著成熟的產品和龐大的使用者量,可從多個渠道獲取大量資料,中小型企業卻沒有這種條件,難以突破資料瓶頸。

隱私安全計算是突破行業資料壁壘的一種方法,隱私安全計算讓資料在合作過程中得到安全保證,資料流通自然更為暢通。

目前,不少擁有大量資料的主體因為必須對資料資訊嚴格保密,同時找不到合適的處理方式而導致資料閒置,無法發揮資料的價值。

譬如,某地方政府擁有當地居民的詳細資料,為防控疫情希望建立智慧傳染病防控體系,但是在缺少技術的支援下,政府很難憑一己之力建立該系統。如果外部招標公司幫助,居民個人資料存在洩漏風險,政府為了避免資料洩漏風險而不使用資料,資料因此無法發揮應有的作用。

如果在雙方之間引入提供隱私安全計算服務的第三方,資料不直接在二者中流通,資料擁有方在合作中仗著擁有資料而強勢的情況將較少出現,資料流通也將相對更安全。

具體而言,隱私安全計算企業將提供相應平臺,資料提供者將資料授權匯入平臺中進行模型評估並優化,完成後只向資料需求者輸出資料的價值和計算結果。整個過程中,原始資料不離開隱私安全計算平臺,資料只在平臺內授權使用。

雙方合作過程中,隱私安全計算企業出現後可避免資料洩露。不過, 如何保證隱私安全計算企業不會洩露、濫用資料?

隱私安全計算企業翼方健數首席科學家張霖濤表示,目前隱私安全計算仍然是一項處於發展早期的技術,各方面還有著較大的優化空間,不過為了保護資料資訊隱私,業內已有多項措施。

以翼方健數為例,在其資料平臺訓練優化的資料都經過加密處理,金鑰由資料所有方擁有,翼方健數無法獲取資料;其次,翼方健數的多方安全計算、聯邦學習、可信任執行環境三大主流安全計算方式都已通過信通院認證,官方背書證明其資料安全性。

隱私安全計算的價值被看到後,包括阿里巴巴、微眾銀行、螞蟻集團、平安科技等多家公司已積極佈局隱私安全計算,並推動技術應用。根據中國信通院調研資料顯示,2021年約有44%的隱私安全計算產品進入實施階段,佔比進一步提升;處於研發階段的隱私安全計算產品佔比相對下降,佔比為19%。

在可預見的未來,隱私安全計算或將與AI深度結合,幫助AI公司更快速發展。

翼方健數專供AI的解題方法

如張霖濤所言,隱私安全計算技術仍有不少問題等待被解決。

首先,隱私安全計算面臨生態壁壘問題。

隱私安全計算行業內公司之間的技術不互通,資料模型在一個平臺輸出後,無法在另一家公司平臺複用,導致新的“資料孤島”問題出現。

其次,目前資料交易的意願和市場還不成熟,導致很多企業把隱私安全計算當成安全合規的成本項建設。只有將場景與隱私安全計算技術深度結合,業務方從隱私安全計算受利後才能把成本項變為營收項,激發業務方可持續參與的意願。

事實上,過去不少機構努力推動全國資料交易,但由於技術手段限制,結果卻不甚理想。

若結合隱私安全計算,資料交易或更為高效。

雷峰網瞭解到,翼方健數正在計劃推出一款基於隱私安全計算的“AI淘寶”。其首席市場官劉碩介紹,該平臺可將不同的AI需求方、供給方,以及資料需求方與供給方連線,使得AI產業鏈上有著不同能力的企業發揮各自長處,滿足不同的需求。 

具體而言,該平臺集合國內主流AI工具,平臺內的AI企業及資料參與方可調取AI能力。與其它平臺的最大區別是,該平臺保護資料來源的所有資料、AI模型。

“翼方健數是一家0資料的資料智慧公司,不擁有資料,只提供工具對資料進行管理,並允許客戶在獲得授權下加工和處理資料,獲取資料價值。”張霖濤對雷峰網介紹。

翼方健數之所以有如此計劃,與其深耕行業多年,以及對不同領域公司業務發展的長期觀察相關。

翼方健數2016年成立便扎入研究隱私安全計算的開發與應用,目前其業務已從醫療拓展至政務、金融、營銷、科學等領域。過往案例中,翼方健數已在不同場景利用隱私安全計算技術解決實際問題:

利用隱私安全計算技術,翼方健數幫助有著“藥物-細胞-基因”資料庫的企業,如格物致和,與AI製藥公司、生物醫藥研發技術公司,如燧坤智慧達成供需合作,幫助資料所有者將資料的使用權和所有權進行分離,放心地對外賦權使用;針對招投標場景,翼方健數構建了一個AI驗證平臺,既保護了招標方的資料,也保護了投標方AI企業的模型。不僅是應用在AI需求方的招標選擇上,AI驗證平臺還可以應用在技術賽事上,對AI實現真正的“技術評分”。

受限於實施交付複雜、計算量極大、客戶接受程度低、需要全環節保密等問題,隱私安全計算技術目前僅僅是剛剛開始被應用於越來越多的領域,隨著時間的推移和技術的進步,還許多場景有著隱私安全計算大展拳腳的機會。

以汽車行業為例,近幾年興起的智慧網聯汽車行業中,已出現不少自動駕駛公司為車企提供輔助駕駛能力,比如百度Apollo牽手比亞迪、Momenta聯合上汽等。汽車行業迎來新的面貌同時,有人質疑自動駕駛公司為車企提供服務,可能通過量產汽車收集大量使用者、道路資料,從而存在資料隱私洩露的風險。如果在雙方合作過程中引入隱私安全計算,或將避免自動駕駛公司獲得使用者敏感資訊。

總結

有著“電腦保安教母”之稱的宋曉冬教授曾公開表示,未來所有的計算都將是隱私計算。

隨著各行業數字化轉型升級的加快,資料對於行業發展的驅動作用也將越來越明顯,同時資料流動也將受到更多限制。

目前,多家公司已提出不同技術路線,提升隱私安全計算安全合規程度。隨著隱私計算逐步深入應用至更多場景,補足當前缺陷,隱私安全計算或將迎來更光明的未來。

雷峰網 (公眾號:雷峰網) 雷峰網雷峰網

雷峰網原創文章,未經授權禁止轉載。詳情見 轉載須知