什么是隱私計算技術(shù)?
一、隱私安全保護(hù)面臨的挑戰(zhàn)數(shù)據(jù)在為人們的生活帶來了種種便利的同時,也使得大家對個人數(shù)據(jù)隱私和安全產(chǎn)生了擔(dān)憂,這儼然已經(jīng)成為世界性的問題。
如何才能在遵循法規(guī)的要求下,既充分發(fā)揮數(shù)據(jù)的價值,同時又不會影響到用戶的數(shù)據(jù)隱私和安全?尤其是對于依賴外部數(shù)據(jù)的企業(yè)來說,如何能夠合理利用合作伙伴的數(shù)據(jù)價值,又不會見到原始數(shù)據(jù)以至于造成數(shù)據(jù)泄露?這就對企業(yè)利用數(shù)據(jù)開展業(yè)務(wù)提出了一個挑戰(zhàn)。近年來隱私計算技術(shù)發(fā)展迅速,它作為賦能數(shù)據(jù)流通的核心技術(shù)之一,將成為數(shù)據(jù)流通服務(wù)的底層基礎(chǔ)設(shè)施,為數(shù)據(jù)流通創(chuàng)造條件并守護(hù)數(shù)據(jù)隱私和安全。二、隱私計算技術(shù)概念及技術(shù)路線隱私計算是涵蓋了眾多學(xué)科的交叉融合技術(shù),是一種包含了安全多方計算、同態(tài)加密、差分隱私、零知識證明、聯(lián)邦學(xué)習(xí)以及可信執(zhí)行環(huán)境等主流技術(shù)子項的相關(guān)技術(shù)合集及產(chǎn)品方案。因為隱私計算技術(shù)和方案的種類較多,為了便于理解和分類,業(yè)界通常將上述技術(shù)分為三大路徑:以安全多方計算為代表的密碼學(xué)路徑、以可信任執(zhí)行環(huán)境為代表的硬件路徑和以聯(lián)邦學(xué)習(xí)為代表的人工智能路徑。下面簡單介紹一下這3個路線的區(qū)別和聯(lián)系。1、安全多方計算(MPC)安全多方計算(Secure Multi-party Computation, MPC)是一種密碼學(xué)領(lǐng)域的隱私保護(hù)分布式計算技術(shù)。安全多方計算能夠使多方在互相不知曉對方內(nèi)容的情況下,參與協(xié)同計算,最終產(chǎn)生有價值的分析內(nèi)容。實現(xiàn)原理上,安全多方計算并非依賴單一的安全算法, 而是多種密碼學(xué)基礎(chǔ)工具的綜合應(yīng)用,包括同態(tài)加密、差分隱私、不經(jīng)意傳輸、秘密分享等,通過各種算法的組合,讓密文數(shù)據(jù)實現(xiàn)跨域的流動和安全計算。本文第三部分會簡單介紹其中的部分算法,來闡述其具體保護(hù)原理。下面是安全多方計算的其中一種簡單實現(xiàn)方案示意圖:2、聯(lián)邦學(xué)習(xí)(FL)聯(lián)邦學(xué)習(xí)(Federated Learning, FL)又名聯(lián)邦機(jī)器學(xué)習(xí)、聯(lián)合學(xué)習(xí)。相比于使用中心化方式的傳統(tǒng)機(jī)器學(xué)習(xí),聯(lián)邦學(xué)習(xí)實現(xiàn)了在本地原始數(shù)據(jù)不出庫的情況下,通過對中間加密數(shù)據(jù)的流通和處理,來完成多方聯(lián)合的學(xué)習(xí)訓(xùn)練。它一般會利用分布式數(shù)據(jù)來進(jìn)行本地化的模型訓(xùn)練,并通過一定的安全設(shè)計和隱私算法(例如同態(tài)加密、差分隱私等), 將所得到的模型結(jié)果通過安全可信的傳輸通道,匯總至可信的中心節(jié)點,進(jìn)行二次訓(xùn)練后得到最終的訓(xùn)練模型。由于密碼學(xué)算法的保障,中心節(jié)點無法看到原始數(shù)據(jù),而只能得到模型結(jié)果,因此有效地保證了過程的隱私。聯(lián)邦學(xué)習(xí)和多方安全計算的區(qū)別,主要在于應(yīng)用場景有較大不同。因此聯(lián)邦學(xué)習(xí)的實現(xiàn)主要“面向模型”, 其核心理念是“數(shù)據(jù)不動模型動”,而多方安全計算則是“面向數(shù)據(jù)”,其核心理念是“數(shù)據(jù)可用不可見”。3、可信任執(zhí)行環(huán)境(TEE)可信任執(zhí)行環(huán)境(Trusted Execution Environment, TEE)指的是一個隔離的安全執(zhí)行環(huán)境,在該環(huán)境內(nèi)的程序和數(shù)據(jù),能夠得到比操作系統(tǒng)層面(OS)更高級別的安全保護(hù)。其實現(xiàn)原理在于通過軟硬件方法, 在中央處理器中,構(gòu)建出一個安全區(qū)域,計算過程執(zhí)行代碼TA(Trust Applition)。僅在安全區(qū)域分界中執(zhí)行,外部攻擊者無法通過常規(guī)手段獲取和影響安全區(qū)的執(zhí)行代碼和邏輯。同時計算數(shù)據(jù)通過相關(guān)密碼學(xué)算法加密,來保證數(shù)據(jù)只能在可信區(qū)中進(jìn)行計算,其簡單實現(xiàn)示意圖如下所示:可信執(zhí)行環(huán)境和前文提到的兩種技術(shù)路線的區(qū)別, 在于不需要依賴過多復(fù)雜的密碼學(xué)算法,因此計算效率高,且能夠?qū)崿F(xiàn)的計算邏輯更加豐富。上述三者的詳細(xì)區(qū)別和聯(lián)系參見下表:技術(shù)路線核心思想數(shù)據(jù)流動密碼技術(shù)硬件要求安全多方計算MPC數(shù)據(jù)可用不可見信任密碼學(xué)原始數(shù)據(jù)加密后交換同態(tài)加密、差分隱私、秘密分享等通用硬件聯(lián)邦學(xué)習(xí)FL數(shù)據(jù)不動模型動信任密碼學(xué)不交換原始數(shù)據(jù)不經(jīng)意傳輸、秘密分享、同態(tài)加密、差分隱私等通用硬件可信執(zhí)行環(huán)境TEE數(shù)據(jù)可用不可見信任硬件原始數(shù)據(jù)加密后交換非對稱加密算法基于可信技術(shù)實現(xiàn)的可信硬件三、隱私計算底層應(yīng)用的密碼學(xué)算法隱私計算三大技術(shù)路徑中,除了可信任執(zhí)行環(huán)境代表的硬件路徑外,其他兩個技術(shù)路徑均用到了多個復(fù)雜的密碼學(xué)算法,各算法在使用目的和手段上均有不同。這里簡單介紹3種常用的密碼學(xué)算法,方便大家初步認(rèn)識這些算法是如何保護(hù)數(shù)據(jù)和隱私安全的。1、同態(tài)加密(HE)同態(tài)加密(Homomorphic Encryption, HE)指的是能夠直接使用密文進(jìn)行特定運算的加密技術(shù),并保證得到的結(jié)果與明文計算結(jié)果一致。 數(shù)據(jù)進(jìn)行加減、匯聚時不會發(fā)生明文數(shù)據(jù)的暴露,因此能夠大大提高計算方的可靠性。同態(tài)加密的優(yōu)勢在于通信量少,不需要多輪通信輪數(shù),且在結(jié)果方密鑰不泄露的情況下,計算過程是安全的,因此在多方安全計算、聯(lián)邦學(xué)習(xí)等場景中得到了應(yīng)用。更詳細(xì)的原理和應(yīng)用,可以參考該文章《同態(tài)加密在聯(lián)邦計算中的應(yīng)用》2、差分隱私(DP)差分隱私(Differential Privacy, DP)是通過添加額外的隨機(jī)數(shù)據(jù)“噪音”使真實信息淹沒于其中,從而保護(hù)隱私的一種技術(shù)手段。當(dāng)惡意用戶試圖通過差分攻擊的手段反推原始數(shù)據(jù)時,由于噪音的存在,無法確認(rèn)數(shù)據(jù)的真假,因此無法順利還原原始數(shù)據(jù)。其優(yōu)勢在于無須加解密時的巨大算力消耗,技術(shù)相對成熟,因此在各種涉及個人隱私的統(tǒng)計類場景中得到廣泛應(yīng)用。差分隱私如何應(yīng)用在安全計算中,可閱讀《多方計算時,每次結(jié)果竟然都存在著巨大隱患,此文告訴你可以這樣解決》進(jìn)行更深入理解。3、不經(jīng)意傳輸(OT)不經(jīng)意傳輸(Oblivious Transfer, OT)由Rabin于1981年首次提出,也叫做茫然傳輸協(xié)議。其作用是當(dāng)數(shù)據(jù)發(fā)送方有多份數(shù)據(jù)時,可通過OT算法,來讓數(shù)據(jù)接收方從中僅選取需要的數(shù)據(jù),但無法獲取其他的數(shù)據(jù),同時數(shù)據(jù)發(fā)送方也無法得知接收方從中獲取了哪些數(shù)據(jù)。因此該算法常用于隱私計算集合求交、聯(lián)邦學(xué)習(xí)樣本對齊、隱私信息檢索等場景。對于隱私計算集合求交的原理,可以參考《淺談PSI隱私集合求交》或者《使用PSI解決聯(lián)邦計算的數(shù)據(jù)碰撞問題》一文進(jìn)行更深入的了解和學(xué)習(xí)。四、華為云在隱私計算領(lǐng)域的產(chǎn)品與實踐華為云在2021年9月正式商用發(fā)布隱私計算產(chǎn)品可信智能計算服務(wù)TICS。該產(chǎn)品面向政務(wù)、金融、消費和醫(yī)療等行業(yè),旨在打破組織內(nèi)部、行業(yè)內(nèi)部、跨行業(yè)之間的數(shù)據(jù)孤島,基于鯤鵬TEE可信執(zhí)行環(huán)境、全同態(tài)加密、安全多方計算、差分隱私、區(qū)塊鏈等技術(shù),實現(xiàn)在數(shù)據(jù)隱私保護(hù)下的多方數(shù)據(jù)聯(lián)合SQL分析、橫向聯(lián)邦學(xué)習(xí)、縱向聯(lián)邦學(xué)習(xí),協(xié)同伙伴和客戶,推動數(shù)據(jù)要素的可信流通和開發(fā)利用。華為云可信智能計算服務(wù)TICS并不是一項單一的技術(shù),而是一套理論框架和技術(shù)體系,是大數(shù)據(jù)、密碼學(xué)、人工智能、區(qū)塊鏈、可信硬件、安全容器等領(lǐng)域的交叉和融合。在多方數(shù)據(jù)庫聯(lián)合查詢場景中,平臺既要做到保護(hù)敏感明細(xì)數(shù)據(jù),又要實現(xiàn)多方數(shù)據(jù)庫的聯(lián)邦統(tǒng)計分析。在多方樣本或特征的聯(lián)合建模場景中,平臺既要對敏感ID和特征進(jìn)行保護(hù),又要把多方樣本或特征聯(lián)合起來訓(xùn)練出更好的模型。這個過程中華為云可信智能計算服務(wù)TICS會為各參與方提供全生命周期的監(jiān)控和管理,TICS和華為云區(qū)塊鏈服務(wù)緊密配合,進(jìn)行數(shù)據(jù)管理和計算過程的確權(quán)和存證,做到整個計算過程可追蹤可審計。華為云可信智能計算服務(wù)TICS極具開放性。囊括行業(yè)主流算法,支持3大任務(wù)場景、7大類可信技術(shù)、60+原子化算子,根據(jù)最佳實踐,會為計算任務(wù)匹配選擇最優(yōu)協(xié)議組合;具有豐富的集成對接能力,開放了80+北向接口,支持與伙伴一起打造聯(lián)合解決方案;支持豐富的部署形態(tài),包括華為公有云、混合云、智能邊緣、華為云金融專區(qū)等,滿足不同行業(yè)和組織的合規(guī)需求。華為云可信智能計算服務(wù)TICS還提供多種專利技術(shù),保障數(shù)據(jù)安全,提升計算效率。首創(chuàng)聯(lián)邦SQL分析與多方安全計算技術(shù)融合,實現(xiàn)SQL執(zhí)行前、執(zhí)行中、執(zhí)行結(jié)果的全流程隱私保護(hù)能力;協(xié)同優(yōu)化聯(lián)邦訓(xùn)練和全同態(tài)加密,通過向量矩陣運算批量處理樹模型的多節(jié)點,性能相比行業(yè)TOP友商提升5~10倍;鯤鵬ARM-TEE全棧自主,BMC/BIOS/TEE-OS/TICS-TA等全部自研。為充分發(fā)揮數(shù)據(jù)價值,實現(xiàn)可持續(xù)發(fā)展,政企等組織在保護(hù)數(shù)據(jù)安全和個人信息的前提下實現(xiàn)數(shù)據(jù)要素流通就顯得至關(guān)重要。尤其是關(guān)系到國計民生的重要領(lǐng)域,迫切需要破解數(shù)據(jù)孤島難題,實現(xiàn)數(shù)據(jù)可信流通。華為云可信智能計算服務(wù)TICS的推出,讓“魚”和“熊掌”兼得成為可能。