數(shù)據(jù)密態(tài)時(shí)代還有多遠(yuǎn)?專(zhuān)訪螞蟻集團(tuán)韋韜
告別“明文”,邁進(jìn)“數(shù)據(jù)密態(tài)”時(shí)代。
隨著互聯(lián)網(wǎng)的不斷發(fā)展,數(shù)據(jù)在今天已然成為重要的生產(chǎn)要素。海量的數(shù)據(jù)以空前的規(guī)模產(chǎn)生、傳播乃至商業(yè)化。大數(shù)據(jù)在為人們生活提供便利的同時(shí),也讓原本處于灰色地帶的數(shù)據(jù)泄露、越權(quán)使用等數(shù)據(jù)安全問(wèn)題暴露無(wú)遺。
數(shù)字化時(shí)代,數(shù)據(jù)究竟如何使用?
隨著一年前《數(shù)據(jù)安全法》和《個(gè)人信息保護(hù)法》的相繼落地,讓數(shù)據(jù)在授權(quán)墻下實(shí)現(xiàn)無(wú)差別采集的難度激增。這給國(guó)內(nèi)過(guò)去數(shù)據(jù)要素市場(chǎng)的粗放式發(fā)展畫(huà)上了句號(hào)。今年6月,中央深改委審議通過(guò)《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見(jiàn)》進(jìn)一步明確:“建立數(shù)據(jù)資源持有權(quán)、數(shù)據(jù)加工使用權(quán)、數(shù)據(jù)產(chǎn)品經(jīng)營(yíng)權(quán)等分置的產(chǎn)權(quán)運(yùn)行機(jī)制,健全數(shù)據(jù)要素權(quán)益保護(hù)制度”。數(shù)字經(jīng)濟(jì)建設(shè)離不開(kāi)數(shù)據(jù)支撐,數(shù)字產(chǎn)業(yè)化和產(chǎn)業(yè)數(shù)字化的進(jìn)程正在加速。如何在保障數(shù)據(jù)安全的前提下發(fā)展數(shù)據(jù)要素市場(chǎng)?
《數(shù)據(jù)安全法》、《個(gè)人信息保護(hù)法》等實(shí)施一年之際,螞蟻集團(tuán)副總裁兼首席技術(shù)安全官韋韜博士接受了甲子光年采訪,韋韜博士告訴「甲子光年」 “只要數(shù)據(jù)流通是處于明文狀態(tài),那么往往因?yàn)槊魑姆职l(fā)易失控導(dǎo)致數(shù)據(jù)泄露,加劇數(shù)據(jù)濫用,甚至引發(fā)數(shù)據(jù)要素的價(jià)值崩塌。邁進(jìn)‘數(shù)據(jù)密態(tài)’時(shí)代,對(duì)數(shù)據(jù)要素的跨域流轉(zhuǎn)實(shí)現(xiàn)全程安全可控,已經(jīng)成為建設(shè)數(shù)字要素市場(chǎng)、發(fā)展數(shù)據(jù)要素經(jīng)濟(jì)的必然一步。”
何為數(shù)據(jù)密態(tài)?簡(jiǎn)單來(lái)說(shuō),“在數(shù)據(jù)進(jìn)入流轉(zhuǎn)進(jìn)行共享、計(jì)算直到銷(xiāo)毀的完整傳播鏈路中,保持?jǐn)?shù)據(jù)處于加密狀態(tài)不出現(xiàn)明文,將數(shù)據(jù)持有權(quán)與使用權(quán)分離,實(shí)現(xiàn)數(shù)據(jù)使用權(quán)的跨域管控,以確保數(shù)據(jù)流轉(zhuǎn)的全程安全可控”。這種數(shù)據(jù)加密流轉(zhuǎn)的狀態(tài)被稱為數(shù)據(jù)密態(tài)。
過(guò)去,數(shù)據(jù)加密在互聯(lián)網(wǎng)20多年的發(fā)展過(guò)程中被廣泛應(yīng)用。但伴隨數(shù)字經(jīng)濟(jì)建設(shè)的加快,東數(shù)西算、大數(shù)據(jù)交易中心等數(shù)據(jù)產(chǎn)業(yè)落地,數(shù)據(jù)的生產(chǎn)要素價(jià)值需要被進(jìn)一步釋放,數(shù)據(jù)持有者和數(shù)據(jù)需求者兩端都對(duì)數(shù)據(jù)安全提出了更高要求。這些客觀因素都加速著數(shù)據(jù)密態(tài)時(shí)代的到來(lái)。
目前,可信隱私計(jì)算是實(shí)現(xiàn)數(shù)據(jù)密態(tài)呼聲最高的技術(shù)路徑之一,可以實(shí)現(xiàn)在不喪失數(shù)據(jù)持有權(quán)的前提下,有效實(shí)現(xiàn)數(shù)據(jù)使用權(quán)的跨域管控。隱私計(jì)算本身也在近幾年開(kāi)始獲得市場(chǎng)與資本方的認(rèn)可。Gartner更曾預(yù)計(jì)到2025年,全球?qū)⒂?0%的企業(yè)采用隱私計(jì)算,并將其列入2021年需要深挖的九項(xiàng)戰(zhàn)略科技趨勢(shì)。
不過(guò),數(shù)據(jù)密態(tài)的到來(lái)并非旦夕之間,還面臨著諸多挑戰(zhàn)。如何實(shí)現(xiàn)滿足場(chǎng)景保障需求、低成本、高效率的數(shù)據(jù)安全,推動(dòng)數(shù)據(jù)密態(tài)時(shí)代早日到來(lái),正是螞蟻集團(tuán)與合作伙伴們共同探索的目標(biāo)。
好在,這些先行者已經(jīng)開(kāi)始看到曙光。
甲子光年:能否用一句話給“數(shù)據(jù)密態(tài)”下一個(gè)簡(jiǎn)潔的定義?
韋韜:在數(shù)據(jù)進(jìn)入流轉(zhuǎn)進(jìn)行共享、計(jì)算直到銷(xiāo)毀的完整傳播鏈路中,保持?jǐn)?shù)據(jù)處于加密狀態(tài)不出現(xiàn)明文,將數(shù)據(jù)持有權(quán)與使用權(quán)分離,實(shí)現(xiàn)數(shù)據(jù)使用權(quán)的跨域管控,以確保數(shù)據(jù)流轉(zhuǎn)的全程安全可控。
甲子光年:如何理解“數(shù)據(jù)密態(tài)”?
韋韜: “數(shù)據(jù)密態(tài)”是螞蟻集團(tuán)洞察出行業(yè)數(shù)字化發(fā)展的一個(gè)新趨勢(shì)。在技術(shù)上看,數(shù)據(jù)密態(tài)其實(shí)是密碼學(xué)界一直希望達(dá)到的境界。在行業(yè)上看,數(shù)據(jù)密態(tài)也契合了未來(lái)數(shù)據(jù)持有權(quán)和使用權(quán)分離的發(fā)展趨勢(shì)。
在技術(shù)角度,數(shù)據(jù)加密本身并不新鮮。伴隨20多年的互聯(lián)網(wǎng)發(fā)展,數(shù)據(jù)加密已經(jīng)在金融支付、電子商務(wù)等場(chǎng)景下廣泛應(yīng)用。但這些數(shù)據(jù)加密大多停留在存儲(chǔ)和傳輸階段。一旦涉及“計(jì)算”,數(shù)據(jù)往往需要回到安全性弱、容易失控的明文狀態(tài)。而“數(shù)據(jù)密態(tài)”的核心任務(wù),就是要把加密延展到計(jì)算環(huán)節(jié),意味著即使在運(yùn)算期間,也不會(huì)出現(xiàn)明文數(shù)據(jù)。這樣在技術(shù)上通過(guò)遠(yuǎn)程驗(yàn)證的可信鏈條以及密碼學(xué)密鑰機(jī)制來(lái)實(shí)現(xiàn)對(duì)數(shù)據(jù)要素跨域流轉(zhuǎn)的全程安全控制。
在行業(yè)發(fā)展角度,2022年6月中央深改委審議通過(guò)《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見(jiàn)》明確:“建立數(shù)據(jù)資源持有權(quán)、數(shù)據(jù)加工使用權(quán)、數(shù)據(jù)產(chǎn)品經(jīng)營(yíng)權(quán)等分置的產(chǎn)權(quán)運(yùn)行機(jī)制,健全數(shù)據(jù)要素權(quán)益保護(hù)制度”。我們注意到,數(shù)據(jù)密態(tài)也恰恰和數(shù)據(jù)的三權(quán)密切相關(guān)。只要數(shù)據(jù)傳播是處于明文狀態(tài),那么往往因?yàn)閿?shù)據(jù)的明文分發(fā)易失控導(dǎo)致數(shù)據(jù)泄露,即造成數(shù)據(jù)持有權(quán)失控;進(jìn)而加劇數(shù)據(jù)濫用,導(dǎo)致數(shù)據(jù)使用權(quán)失控;數(shù)據(jù)明文的泄露也會(huì)引發(fā)數(shù)據(jù)要素的價(jià)值崩塌,給數(shù)據(jù)價(jià)值經(jīng)營(yíng)帶來(lái)嚴(yán)重阻礙。
數(shù)據(jù)的持有權(quán)主要是持有明文數(shù)據(jù)(或者明文數(shù)據(jù)等價(jià)物)的權(quán)利。有了明文數(shù)據(jù)后,在技術(shù)層面往往就獲得了數(shù)據(jù)的全部使用價(jià)值。傳統(tǒng)上,基于明文的數(shù)據(jù)流轉(zhuǎn),難以將數(shù)據(jù)的持有權(quán)與使用權(quán)分離。數(shù)據(jù)密態(tài)技術(shù)第一次實(shí)現(xiàn)了數(shù)據(jù)的持有權(quán)與使用權(quán)分離,可以在保障數(shù)據(jù)持有權(quán)不喪失的前提下,對(duì)數(shù)據(jù)在跨域流轉(zhuǎn)的全程對(duì)其使用權(quán)實(shí)現(xiàn)管控。這種數(shù)據(jù)流轉(zhuǎn)全鏈路的使用權(quán)跨域管控能力,對(duì)于數(shù)據(jù)要素價(jià)值實(shí)現(xiàn)市場(chǎng)定價(jià)來(lái)說(shuō)是至關(guān)重要的。數(shù)據(jù)的使用權(quán)流通,而非持有權(quán)流通,是數(shù)據(jù)要素行業(yè)發(fā)展的關(guān)鍵。
甲子光年:螞蟻集團(tuán)提出,2022年,無(wú)論從法規(guī)要求還是技術(shù)成熟度來(lái)說(shuō),數(shù)據(jù)流通領(lǐng)域都將告別數(shù)據(jù)明文時(shí)代,進(jìn)入數(shù)據(jù)密態(tài)時(shí)代。這種判斷的依據(jù)是什么?
韋韜:因?yàn)樵诿魑臓顟B(tài)下,企業(yè)或個(gè)人都很難控制數(shù)據(jù)泄露的風(fēng)險(xiǎn)。并且數(shù)據(jù)的二次分發(fā)更會(huì)使這種風(fēng)險(xiǎn)呈指數(shù)增長(zhǎng)。現(xiàn)在,數(shù)據(jù)已成為實(shí)質(zhì)意義上的社會(huì)生產(chǎn)要素,它所能創(chuàng)造的價(jià)值是巨大的。中國(guó)眾多產(chǎn)業(yè)已經(jīng)進(jìn)入數(shù)字化轉(zhuǎn)型階段,這其中有大量數(shù)據(jù)流通、數(shù)據(jù)價(jià)值挖掘的需求。但明文數(shù)據(jù)可復(fù)制、低成本的特性卻與其價(jià)值形成反差。如果我們不告別明文,就永遠(yuǎn)無(wú)法避免數(shù)據(jù)安全問(wèn)題。最典型的例子就是明文數(shù)據(jù)泄露導(dǎo)致電信詐騙、網(wǎng)絡(luò)詐騙愈演愈烈。
與此同時(shí),保障數(shù)據(jù)安全也是國(guó)家和社會(huì)經(jīng)濟(jì)層面的強(qiáng)烈訴求,在行業(yè)自身發(fā)展需求之外,相關(guān)法規(guī)、政策的出臺(tái)更是進(jìn)一步強(qiáng)化了打造數(shù)據(jù)密態(tài)基礎(chǔ)設(shè)施的行業(yè)需求。國(guó)家一直強(qiáng)調(diào):安全和發(fā)展是一體之兩翼、驅(qū)動(dòng)之雙輪。近兩年,《數(shù)據(jù)安全法》、《個(gè)人信息保護(hù)法》以及《密碼法》、《民法典》等法律法規(guī)的落地,都證明著國(guó)家對(duì)數(shù)據(jù)安全的重視。如果數(shù)據(jù)安全相關(guān)問(wèn)題不能得到妥善治理,那將會(huì)對(duì)數(shù)字經(jīng)濟(jì)建設(shè),甚至社會(huì)安全穩(wěn)定造成巨大風(fēng)險(xiǎn)。
另外在技術(shù)層面,隱私計(jì)算技術(shù)經(jīng)過(guò)幾年來(lái)的探索,多個(gè)行業(yè)已經(jīng)在一些小規(guī)模領(lǐng)域做了驗(yàn)證。在實(shí)踐過(guò)程中碰到的困難、挑戰(zhàn)和受益,也逐漸明確。
所以我們認(rèn)為,整個(gè)數(shù)據(jù)安全行業(yè)已經(jīng)走到了邁入數(shù)據(jù)密態(tài)時(shí)代的節(jié)點(diǎn)。螞蟻集團(tuán)提出“數(shù)據(jù)密態(tài)”,希望呼吁整個(gè)行業(yè)一起往新時(shí)代邁進(jìn)。
甲子光年:過(guò)去企業(yè)不重視數(shù)據(jù)安全嗎?
韋韜:現(xiàn)代數(shù)字化企業(yè)是一種不斷演變進(jìn)化的數(shù)字生命體。它的架構(gòu)復(fù)雜性會(huì)爆炸性增長(zhǎng),不斷引入的外部數(shù)字化產(chǎn)品服務(wù)和行業(yè)技術(shù)體系演化,會(huì)推動(dòng)其形成內(nèi)部數(shù)字化基因的代差積累,就像碳基生命基因的演化,但更快更劇烈。
過(guò)去企業(yè)也重視數(shù)據(jù)安全。但總體而言,數(shù)據(jù)安全行業(yè)發(fā)展依然遠(yuǎn)落后于互聯(lián)網(wǎng)和整個(gè)社會(huì)數(shù)字化的發(fā)展。盡管近幾年全行業(yè)都開(kāi)始加強(qiáng)數(shù)據(jù)安全的投入力度,但差距依然顯著。比如今天依然有不少企業(yè)沒(méi)有專(zhuān)職數(shù)據(jù)安全團(tuán)隊(duì),現(xiàn)有的安全技術(shù)體系也往往難以跟上企業(yè)數(shù)字化基因代差的快速演變。
為了應(yīng)對(duì)嚴(yán)峻的網(wǎng)絡(luò)安全攻擊威脅,符合嚴(yán)格的數(shù)據(jù)安全合規(guī)要求,保障企業(yè)數(shù)字生命體的健康發(fā)展,必須加快發(fā)展能夠適應(yīng)這樣的數(shù)字生命體的安全技術(shù)、服務(wù)與行業(yè)引導(dǎo)機(jī)制。這對(duì)很多企業(yè)、行業(yè)來(lái)說(shuō)都是巨大挑戰(zhàn),也需要政府、行業(yè)、企業(yè)和社會(huì)更緊密的協(xié)同合作,共同進(jìn)行安全建設(shè)和保障。
甲子光年:數(shù)據(jù)密態(tài)時(shí)代的到來(lái),是否意味著數(shù)據(jù)安全問(wèn)題將不復(fù)存在?
韋韜:數(shù)據(jù)安全的程度需要結(jié)合實(shí)現(xiàn)成本來(lái)看,沒(méi)有人能夠承受實(shí)現(xiàn)絕對(duì)安全的成本。如果把數(shù)據(jù)安全比喻成交通治理,不難發(fā)現(xiàn),“平衡”是這個(gè)問(wèn)題的關(guān)鍵:高速公路需要限速來(lái)控制風(fēng)險(xiǎn),但也不能單純因?yàn)榘踩^(guò)分限速。數(shù)據(jù)安全需要尋求效率和風(fēng)險(xiǎn)的平衡。這一點(diǎn)在數(shù)據(jù)密態(tài)時(shí)代下依舊有效。
特別的,數(shù)據(jù)密態(tài)相關(guān)技術(shù)主要開(kāi)始逐步應(yīng)用于跨主體間的數(shù)據(jù)流轉(zhuǎn)管控領(lǐng)域,這將顯著的提升這些領(lǐng)域的數(shù)據(jù)安全保障水位。但主體內(nèi)部的數(shù)據(jù)流轉(zhuǎn),以及沒(méi)有使用數(shù)據(jù)密態(tài)技術(shù)的跨主體數(shù)據(jù)流轉(zhuǎn),依然需要其他技術(shù)和機(jī)制來(lái)提升其安全保障能力。
事實(shí)上數(shù)據(jù)安全是一個(gè)非常復(fù)雜的體系。達(dá)成數(shù)據(jù)安全是這個(gè)安全體系的整體效果,而實(shí)現(xiàn)路徑和方案現(xiàn)在都處于摸索階段,目前數(shù)據(jù)安全行業(yè)還需要更多相關(guān)方共同參與實(shí)踐。
2.技術(shù):“尋求安全與效率的平衡”
甲子光年:數(shù)據(jù)密態(tài)和隱私計(jì)算、密碼學(xué)之間的技術(shù)關(guān)系是什么?隱私計(jì)算的技術(shù)路線已經(jīng)基本確定了么?
韋韜:“數(shù)據(jù)密態(tài)”是螞蟻對(duì)數(shù)據(jù)安全行業(yè)發(fā)展階段的描述,而密碼學(xué)、隱私計(jì)算等技術(shù)是實(shí)現(xiàn)數(shù)據(jù)密態(tài)的技術(shù)手段。傳統(tǒng)密碼學(xué)技術(shù)主要應(yīng)用于數(shù)據(jù)的傳輸和儲(chǔ)存;而隱私計(jì)算更聚焦于數(shù)據(jù)共享、計(jì)算、流轉(zhuǎn)階段的加密,在支持?jǐn)?shù)據(jù)價(jià)值傳播的同時(shí)防止數(shù)據(jù)明文泄露。
實(shí)現(xiàn)隱私計(jì)算的技術(shù)路徑也很多,包括多方安全計(jì)算、聯(lián)邦學(xué)習(xí)、全同態(tài)、可信執(zhí)行環(huán)境等等,但還有很多的實(shí)際需求沒(méi)有得到滿足,依然有很大的創(chuàng)新空間。其實(shí)隱私計(jì)算本身也有兩個(gè)概念定義。一個(gè)是李鳳華老師提出的隱私計(jì)算(Privacy Computing),是面向隱私信息全生命周期保護(hù)的計(jì)算理論和方法。另外一個(gè)是目前行業(yè)里討論的比較多的隱私計(jì)算,或者更準(zhǔn)確的叫做隱私保護(hù)計(jì)算(Privacy-preserving Computation),是保證數(shù)據(jù)提供方不泄露原始數(shù)據(jù)的前提下,對(duì)數(shù)據(jù)進(jìn)行分析計(jì)算的一系列信息技術(shù),實(shí)現(xiàn)數(shù)據(jù)在流通與融合過(guò)程中的“可用不可見(jiàn)”。我們平時(shí)談?wù)撦^多的概念是后者。
目前隱私計(jì)算技術(shù)領(lǐng)域也逐步形成了向可信隱私計(jì)算升級(jí)的共識(shí)。可信隱私計(jì)算將會(huì)在隱私保護(hù)計(jì)算概念(Privacy-preserving Computation)的基礎(chǔ)上,更好的融合前者概念(Privacy Computing)對(duì)于隱私保護(hù)的訴求:可信隱私計(jì)算是指在應(yīng)用過(guò)程中,安全性、可用性和隱私保護(hù)符合設(shè)計(jì)申明預(yù)期的隱私計(jì)算,以滿足數(shù)據(jù)需求方、數(shù)據(jù)提供方、和監(jiān)管方等各方的需求。可信隱私計(jì)算的特征包括安全可驗(yàn)證,過(guò)程可審計(jì),開(kāi)放普適,滿足數(shù)據(jù)要素流轉(zhuǎn)場(chǎng)景的隱私保護(hù),可靠性,性能等要求。可信隱私計(jì)算行業(yè)共識(shí)的形成明確了下一步技術(shù)演進(jìn)的方向和要求,有助于行業(yè)更好的協(xié)同發(fā)力形成突破。
比如,為解決傳統(tǒng)隱私計(jì)算技術(shù)在計(jì)算效率和保護(hù)數(shù)據(jù)安全之間的平衡問(wèn)題,螞蟻集團(tuán)于2021年起推動(dòng)發(fā)展新一代可信隱私計(jì)算技術(shù)“可信密態(tài)計(jì)算”(Trusted-Environment-based Cryptographic Computing,TECC),這項(xiàng)技術(shù)創(chuàng)新性地將密碼技術(shù)(MPC、FL)和全棧可信計(jì)算技術(shù)(TEE、TPM)融合在一起,將數(shù)據(jù)以全密態(tài)形式在高速互聯(lián)的可信節(jié)點(diǎn)集群中進(jìn)行計(jì)算、存儲(chǔ)、流轉(zhuǎn),可實(shí)現(xiàn)數(shù)據(jù)持有權(quán)有效保障、使用權(quán)出域可控,支撐任意多方大規(guī)模數(shù)據(jù)安全、可靠、高效地進(jìn)行全密態(tài)的融合與流轉(zhuǎn)。TECC突破了使用單一技術(shù)的局限,獲得了更高的綜合能力,能在1小時(shí)內(nèi)完成億級(jí)樣本密態(tài)分析和建模,在安全性、適用性、性能等維度上形成跨越式提升,是數(shù)據(jù)密態(tài)時(shí)代的有力支撐。2022年7月,可信密態(tài)計(jì)算(TECC)還因?yàn)榧夹g(shù)的突破性入選了數(shù)字中國(guó)建設(shè)峰會(huì)“十大硬核科技”獎(jiǎng)。目前TECC也正在主管部門(mén)指導(dǎo)下進(jìn)行開(kāi)源。
甲子光年:過(guò)去,數(shù)據(jù)的合規(guī)使用一直是個(gè)難題。開(kāi)放授權(quán)數(shù)據(jù)獲取的業(yè)務(wù)場(chǎng)景就可能引發(fā)數(shù)據(jù)泄露,但授權(quán)嚴(yán)監(jiān)管下獲取的數(shù)據(jù)價(jià)值又比較有限。如何解決這個(gè)矛盾?
韋韜:其實(shí)現(xiàn)在監(jiān)管部門(mén)對(duì)數(shù)據(jù)授權(quán)已經(jīng)有了非常嚴(yán)格的管控,面對(duì)企業(yè)違規(guī)獲取授權(quán)或者霸王條款,消費(fèi)者和企業(yè)都可以通過(guò)各種渠道去申訴,這是一個(gè)非常大的變化。大約從2018年開(kāi)始,許多互聯(lián)網(wǎng)公司已經(jīng)把授權(quán)協(xié)議從概括授權(quán)更改到了單一場(chǎng)景授權(quán)。也就是說(shuō),現(xiàn)在的數(shù)據(jù)獲取已經(jīng)實(shí)現(xiàn)了“一個(gè)授權(quán)只對(duì)應(yīng)一個(gè)場(chǎng)景需求”,而不是把所有場(chǎng)景需求都綁定在一個(gè)授權(quán)上。
另外,《個(gè)人信息保護(hù)法》更明確了授權(quán)數(shù)據(jù)面向的場(chǎng)景、主體,以及應(yīng)用范圍,關(guān)鍵詞“同意”在其中高頻出現(xiàn)了27次,意在強(qiáng)調(diào)企業(yè)獲取和使用信息,必須經(jīng)過(guò)用戶的同意,授權(quán)程序必須規(guī)范。
同時(shí)我們也需要看到,今天的人工智能體系是依靠數(shù)據(jù)驅(qū)動(dòng)的。在授權(quán)嚴(yán)監(jiān)管下,如果采集不到足夠量級(jí)的無(wú)偏差的數(shù)據(jù),智能體系則很難發(fā)揮作用,這對(duì)數(shù)據(jù)行業(yè)來(lái)說(shuō)的確不是個(gè)好消息。
現(xiàn)在我們要努力達(dá)到的平衡是,既要保護(hù)公眾的隱私權(quán)益,又要實(shí)現(xiàn)“十四五”規(guī)劃中的數(shù)字要素市場(chǎng)化發(fā)展。至于如何在保護(hù)數(shù)據(jù)安全和發(fā)揮數(shù)據(jù)價(jià)值之間平衡,其實(shí)就是我們所提出的“可算不可識(shí)”。“可算不可識(shí)”是實(shí)現(xiàn)個(gè)人隱私保護(hù)的關(guān)鍵技術(shù)模式,在模型訓(xùn)練、數(shù)據(jù)分析等場(chǎng)景下確保個(gè)人身份不會(huì)被重識(shí)別,滿足法律法規(guī)的匿名化要求。可信隱私計(jì)算可以有效的通過(guò)在可信環(huán)境中的受控匿名化實(shí)現(xiàn)可算不可識(shí),同時(shí)讓數(shù)據(jù)的使用和流通實(shí)現(xiàn)可審計(jì)可舉證。
甲子光年:數(shù)據(jù)密態(tài)時(shí)代下的數(shù)據(jù)使用和流通需要可審計(jì)可舉證,如何通過(guò)技術(shù)手段真正實(shí)現(xiàn)?加密貨幣的區(qū)塊鏈技術(shù)、分布式記賬方法值得借鑒嗎?
韋韜:數(shù)據(jù)使用和流通的審計(jì)與舉證,的確是一個(gè)比較困難的技術(shù)挑戰(zhàn)。2021年,螞蟻集團(tuán)提出把隱私計(jì)算與區(qū)塊鏈深度融合,確保數(shù)據(jù)密態(tài)流轉(zhuǎn)過(guò)程中能有清晰的可審計(jì)的授權(quán)、確權(quán)、鑒權(quán)環(huán)節(jié),這是數(shù)據(jù)要素產(chǎn)業(yè)化的關(guān)鍵。在數(shù)據(jù)密態(tài)狀態(tài)下,所有的數(shù)據(jù)都以密態(tài)形式呈現(xiàn),溯源取證的難度比明文時(shí)期顯著增加,所以需要建立新的技術(shù)模式來(lái)解決這些問(wèn)題。
在這個(gè)新的技術(shù)體系中,我們認(rèn)為區(qū)塊鏈?zhǔn)欠浅:线m的。因?yàn)閰^(qū)塊鏈的本質(zhì)就是分布式賬本,它能夠以去中心化的方式實(shí)現(xiàn)審計(jì)固證。但值得注意的是,如果數(shù)據(jù)密態(tài)時(shí)代真的到來(lái),審計(jì)一定會(huì)成為數(shù)據(jù)密態(tài)基礎(chǔ)設(shè)施的關(guān)鍵組件,后期人們也會(huì)面對(duì)更大的數(shù)據(jù)量級(jí),很多細(xì)節(jié)還需要行業(yè)共同探索推進(jìn)。
甲子光年:隱私計(jì)算是否會(huì)面臨算力、電力等其他基礎(chǔ)設(shè)施的掣肘?
韋韜:實(shí)現(xiàn)隱私計(jì)算的不同技術(shù)路徑都面臨著各自的性能挑戰(zhàn)。傳統(tǒng)的多方安全計(jì)算和聯(lián)邦學(xué)習(xí)需要依靠網(wǎng)絡(luò)來(lái)完成計(jì)算,計(jì)算量的上升量級(jí)非常高,跨公網(wǎng)/專(zhuān)線的帶寬和時(shí)延是限制其性能、可靠性、普適性、成本的關(guān)鍵瓶頸之一,目前硬件加速的方式也難以緩解這個(gè)難題。而全同態(tài)技術(shù)通過(guò)完全密態(tài)的方式做計(jì)算,雖然不要求高頻率的交互,但是非常依賴硬件加速。另外,全同態(tài)導(dǎo)致數(shù)據(jù)急劇膨脹也會(huì)額外增加計(jì)算壓力,導(dǎo)致傳輸和存儲(chǔ)成本急劇升高,往往高達(dá)千倍以上。各個(gè)隱私計(jì)算技術(shù)路線在未來(lái)的商業(yè)化層面還要解決諸多難題,也給了行業(yè)更多技術(shù)創(chuàng)新突破的需求空間。前面提到的可信密態(tài)計(jì)算(TECC)也正是在這樣的場(chǎng)景之下誕生,對(duì)算力成本的需求增加可以控制在明文分布式計(jì)算一個(gè)數(shù)量級(jí)之內(nèi),從而有效的支持各種大規(guī)模密態(tài)應(yīng)用需求。
甲子光年:隱私計(jì)算路線眾多,各條路線如何將數(shù)據(jù)安全保護(hù)落到實(shí)處?是否有通用的標(biāo)準(zhǔn)?
韋韜:隱私計(jì)算技術(shù)路線五花八門(mén),針對(duì)隱私計(jì)算實(shí)現(xiàn)的安全性,當(dāng)前的安全分級(jí)標(biāo)準(zhǔn)是針對(duì)單個(gè)技術(shù)路線來(lái)制定的,但在應(yīng)用場(chǎng)景它們相互之間很難交叉比較,也無(wú)法對(duì)新興的隱私計(jì)算技術(shù)進(jìn)行安全評(píng)估。
實(shí)際應(yīng)用中,在不同的場(chǎng)景下,在應(yīng)用隱私計(jì)算上付出不同數(shù)量級(jí)的成本時(shí),在各個(gè)維度上都應(yīng)該有相應(yīng)的收益。在安全側(cè)則應(yīng)該有一個(gè)相對(duì)通的尺子來(lái)衡量收益,即如何比較完全不同的隱私計(jì)算技術(shù)的安全性。如何來(lái)做通用的衡量,對(duì)隱私計(jì)算實(shí)現(xiàn)的“數(shù)據(jù)密態(tài)”進(jìn)行安全分級(jí)。這件事情挑戰(zhàn)非常大,我們也是首次嘗試,這對(duì)于全球來(lái)說(shuō)都是一個(gè)新興的挑戰(zhàn)。
我們發(fā)現(xiàn)在本質(zhì)上,隱私計(jì)算產(chǎn)品安全性度量的本質(zhì)在于需要付出多大的成本、克服多大的不確定性來(lái)攻破給定的安全防護(hù)保障,造成信息泄露的后果或風(fēng)險(xiǎn)。在這個(gè)認(rèn)知的基礎(chǔ)上,我們目前正在嘗試將隱私計(jì)算產(chǎn)品安全從實(shí)戰(zhàn)角度劃分為如下五級(jí):
第一是基線防護(hù)級(jí),基本的安全基線要求,不能有已知中高危安全漏洞。
第二是審計(jì)追溯級(jí),能對(duì)隱私計(jì)算協(xié)議交互中已知無(wú)法阻斷的攻擊和泄露進(jìn)行審計(jì);對(duì)于允許信息熵泄露的技術(shù)應(yīng)該有泄露度量能力。特別的,對(duì)于密碼學(xué)半誠(chéng)實(shí)模型的隱私計(jì)算技術(shù),應(yīng)該能對(duì)“不誠(chéng)實(shí)”的行為有審計(jì)能力,否則無(wú)法感知和審計(jì)的攻擊在實(shí)際應(yīng)用中會(huì)引發(fā)不可控的數(shù)據(jù)泄露風(fēng)險(xiǎn)。有信息熵泄露的技術(shù)也應(yīng)用類(lèi)似的要求。
第三是廣度防護(hù)級(jí),對(duì)于已知的可以造成實(shí)際信息泄露的攻擊方法均應(yīng)有相應(yīng)的防護(hù)方案;不應(yīng)該包括漏洞頻發(fā)的高危組件。
第四是深度檢驗(yàn)級(jí),能夠通過(guò)2個(gè)安全攻防專(zhuān)業(yè)團(tuán)隊(duì)背對(duì)背1個(gè)月或以上的深度安全評(píng)估,且不被發(fā)現(xiàn)中高危漏洞。這樣的安全強(qiáng)度能夠在實(shí)戰(zhàn)中對(duì)抗變異攻擊,對(duì)數(shù)據(jù)安全提供高等級(jí)防護(hù)能力。
第五是安全證明級(jí),對(duì)于關(guān)鍵復(fù)雜性隱患,有代碼級(jí)形式化證明保障。包括像內(nèi)存安全驗(yàn)證這樣的復(fù)雜性證明,也包括像算法和代碼實(shí)現(xiàn)的一致性證明。
將隱私計(jì)算系統(tǒng)對(duì)數(shù)據(jù)安全的保護(hù)能力做技術(shù)中立的安全分級(jí),這樣有助于隱私計(jì)算技術(shù)更好的在實(shí)際場(chǎng)景中應(yīng)用推廣,同樣也需要行業(yè)共同的努力。
甲子光年:隱私計(jì)算的價(jià)值空間有多大?在諸如“東數(shù)西算”類(lèi)的國(guó)家重大工程中,隱私計(jì)算如何發(fā)揮作用?
韋韜:東數(shù)西算最明顯的特征是“原始數(shù)據(jù)在東部,大規(guī)模計(jì)算在西部”,讓西部的能源、空間發(fā)揮優(yōu)勢(shì)。但這個(gè)過(guò)程如何平衡效率和風(fēng)險(xiǎn)是一個(gè)全新的挑戰(zhàn)。
如果把原始明文數(shù)據(jù)直接搬到西部,那么不但源數(shù)據(jù)會(huì)直接明文暴露,而且分析建模過(guò)程中產(chǎn)生的大量中間數(shù)據(jù)也以明文方式暴露,這會(huì)顯著的增加了數(shù)據(jù)泄露的風(fēng)險(xiǎn)暴露面;而且這種方法使得西部數(shù)據(jù)中心匯聚大量高價(jià)值數(shù)據(jù),與東部相比又缺乏專(zhuān)業(yè)安全人員,整體安全風(fēng)險(xiǎn)壓力急劇增加。如果把原始明文數(shù)據(jù)保留在東部,那么像傳統(tǒng)模式的隱私計(jì)算技術(shù),如多方安全計(jì)算和聯(lián)邦學(xué)習(xí),其發(fā)起方和計(jì)算方都需要在數(shù)據(jù)源方,西部的算力難以發(fā)揮作用。所以在東數(shù)西算中,為了平衡效率和風(fēng)險(xiǎn),最佳的解決方案是數(shù)據(jù)以密態(tài)方式在西部數(shù)據(jù)中心存儲(chǔ)、分析、融合,既有效保障安全,又能充分發(fā)揮出西部算力、能源方面的優(yōu)勢(shì)。
從上面的分析可以看出,在東數(shù)西算場(chǎng)景下,可信密態(tài)計(jì)算TECC可以妥善地解決效率與風(fēng)險(xiǎn)的平衡,因?yàn)榭尚琶軕B(tài)計(jì)算TECC并不強(qiáng)烈依賴跨網(wǎng)絡(luò)交互,東部的數(shù)據(jù)只需要以密態(tài)方式傳輸?shù)轿鞑浚谖鞑繑?shù)據(jù)中心的存儲(chǔ)、計(jì)算、應(yīng)用中數(shù)據(jù)都是以密態(tài)方式存在的。數(shù)據(jù)持有方可以安全有效的進(jìn)行跨域數(shù)據(jù)管控、計(jì)算和融合,在這種模式下既節(jié)省了通信成本又能充分利用西部算力資源。
3.商業(yè):“數(shù)據(jù)要素商業(yè)化困境”
根據(jù)甲子智庫(kù)數(shù)據(jù)顯示,預(yù)計(jì)到2025年,國(guó)內(nèi)隱私計(jì)算的整體市場(chǎng)規(guī)模將超過(guò)200億元,2021~2025年均復(fù)合增長(zhǎng)率達(dá)133.4%
甲子光年:隱私計(jì)算(以及數(shù)據(jù)要素)商業(yè)落地的難點(diǎn)是什么?
韋韜:首先是需要政策的明確指導(dǎo),行業(yè)主管單位關(guān)于合法合規(guī)的標(biāo)準(zhǔn)、測(cè)評(píng)和試點(diǎn)支撐。比如今年中央深改會(huì)第二十六次會(huì)議上審議通過(guò)了《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見(jiàn)》,明確了要建立數(shù)據(jù)資源持有權(quán)、數(shù)據(jù)加工使用權(quán)、數(shù)據(jù)產(chǎn)品經(jīng)營(yíng)權(quán)等分置的產(chǎn)權(quán)運(yùn)行機(jī)制,這對(duì)于數(shù)據(jù)合規(guī)使用、數(shù)據(jù)要素市場(chǎng)化來(lái)說(shuō)是個(gè)非常積極的信號(hào)。
在技術(shù)上,與明文計(jì)算相比,隱私計(jì)算商業(yè)化的最大難點(diǎn)還是在性能與普適性瓶頸。目前行業(yè)應(yīng)用最多的隱私計(jì)算技術(shù)是PSI(Private Set Intersection,隱私集合求交),性能相對(duì)可控,所以應(yīng)用廣泛。稍微復(fù)雜一點(diǎn)的是邏輯回歸(Logistics Regression),由于一般數(shù)據(jù)量級(jí)有限(不超過(guò)100萬(wàn)),性能也能接受。但復(fù)雜度再上升,到了現(xiàn)在最廣泛使用的GBDT樹(shù)模型,即使是30萬(wàn)的樣本,在專(zhuān)線條件下聯(lián)邦學(xué)習(xí)完成訓(xùn)練也往往需要8個(gè)小時(shí)以上。對(duì)比一下,同樣的樣本與訓(xùn)練量如果在明文狀態(tài)下,可以做到在分鐘級(jí)就能完成,可以看出相差甚大。復(fù)雜度再往上是深度學(xué)習(xí),這方面?zhèn)鹘y(tǒng)隱私計(jì)算和明文分布式計(jì)算的性能差距更加顯著。這也是我們需要去研究像可信密態(tài)計(jì)算TECC技術(shù)等新興高性能可信隱私計(jì)算模式的原因。
另外,隨著隱私計(jì)算涉及的數(shù)據(jù)方從二方升級(jí)到三方、四方等,所適用的算法也截然不同,而且隨著數(shù)據(jù)的劃分方式還有很大差異。復(fù)雜程度、通信成本、安全成本都會(huì)顯著上升。這是現(xiàn)階段隱私計(jì)算應(yīng)用的場(chǎng)景還相對(duì)受限的原因。
在成本上,在過(guò)去很長(zhǎng)一段時(shí)間里,數(shù)據(jù)安全是個(gè)奢侈品,企業(yè)很難,也很少有意愿花資源投入數(shù)據(jù)安全。不過(guò)近幾年這種現(xiàn)象開(kāi)始有了改觀。隨著數(shù)字化浪潮的推進(jìn),數(shù)據(jù)安全保障已經(jīng)成為企業(yè)發(fā)展所必須的一環(huán)。《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》等法律法規(guī)的落地,也在極大程度上提高了合規(guī)底線,同時(shí)將各相關(guān)方的積極性調(diào)動(dòng)起來(lái)。當(dāng)數(shù)據(jù)安全的市場(chǎng)足夠大,規(guī)模效應(yīng)就會(huì)幫助整個(gè)行業(yè)攤薄成本,降到企業(yè)都能接受的程度。
甲子光年:在隱私計(jì)算方面,螞蟻目前有哪些已經(jīng)商業(yè)化的產(chǎn)品和應(yīng)用場(chǎng)景?
韋韜:螞蟻集團(tuán)一直堅(jiān)持嘗試多種技術(shù)路徑。在商業(yè)方面,我們已經(jīng)開(kāi)始給有需求的客戶提供商業(yè)化支持。比如自主研發(fā)的螞蟻鏈摩斯多方安全計(jì)算平臺(tái)(MORSE),目前應(yīng)用于金融、科研、政務(wù)等十多個(gè)行業(yè),服務(wù)了上百家機(jī)構(gòu)。
去年我們發(fā)布了數(shù)據(jù)隱私協(xié)作平臺(tái)(FAIR),將隱私計(jì)算和區(qū)塊鏈技術(shù)深度融合,構(gòu)建了自主安全計(jì)算硬件并獲得CFCA安全認(rèn)證,并聯(lián)合達(dá)摩院計(jì)算技術(shù)實(shí)驗(yàn)室和阿里安全雙子座實(shí)驗(yàn)室等團(tuán)隊(duì)設(shè)計(jì)全同態(tài)硬件加速,實(shí)現(xiàn)了百倍以上的性能提升。
在應(yīng)用場(chǎng)景方面,目前聯(lián)合風(fēng)控、聯(lián)合營(yíng)銷(xiāo)、政務(wù)業(yè)務(wù)是我們主要布局的應(yīng)用場(chǎng)景。
今年年初, IDC發(fā)布了《金融行業(yè)隱私保護(hù)計(jì)算探索與實(shí)踐》,螞蟻隱私計(jì)算應(yīng)用案例“網(wǎng)商銀行農(nóng)村金融在可信執(zhí)行環(huán)境技術(shù)下的實(shí)踐”被列入行業(yè)優(yōu)秀實(shí)踐之一。在可信隱私計(jì)算的保障下,銀行與合作方可以通過(guò)可信執(zhí)行環(huán)境同時(shí)融合各數(shù)據(jù)源的數(shù)據(jù)并保障數(shù)據(jù)隱私安全,為涉農(nóng)用戶提供融資金融服務(wù),解決了農(nóng)村金融服務(wù)匱乏、農(nóng)業(yè)經(jīng)營(yíng)者融資難融資貴的難題。
從去年開(kāi)始,螞蟻隱私計(jì)算還探索了醫(yī)療場(chǎng)景的應(yīng)用,已經(jīng)與醫(yī)院、衛(wèi)健機(jī)構(gòu)、藥械廠商展開(kāi)了合作。在近兩年醫(yī)保支付改革的背景下,2021年可信隱私計(jì)算開(kāi)源框架“隱語(yǔ)”和阿里云數(shù)字醫(yī)療團(tuán)隊(duì)合作,為浙江某三級(jí)醫(yī)院搭建了面向醫(yī)院運(yùn)營(yíng)管理的數(shù)據(jù)融合平臺(tái),病理質(zhì)控和醫(yī)保DRG(Diagnosis Related Group,疾病診斷相關(guān)分組)管理效能得到顯著提升,2021年三個(gè)月時(shí)間內(nèi),幫助醫(yī)院累計(jì)優(yōu)化數(shù)十萬(wàn)醫(yī)保結(jié)算,并通過(guò)編碼入組,將醫(yī)保反饋分析工作量顯著降低,甲級(jí)病案例病理質(zhì)控也提升了10~20%。
同時(shí),隨著工業(yè)互聯(lián)網(wǎng)時(shí)代的到來(lái),我們?cè)诠I(yè)和制造業(yè)領(lǐng)域也看到了大量場(chǎng)景對(duì)數(shù)據(jù)安全的需求。比如,我們常常可以看到,一些地區(qū)正在試點(diǎn)的自動(dòng)駕駛車(chē)輛,它的傳感器就是把周?chē)娜恕h(huán)境等數(shù)據(jù),與工業(yè)互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行耦合。如果這些傳感器數(shù)據(jù)缺乏相關(guān)安全管控,很有可能引發(fā)大量安全相關(guān)問(wèn)題。我們相信可信隱私計(jì)算技術(shù)將是工業(yè)制造業(yè)在數(shù)據(jù)密態(tài)時(shí)代的解決方案。如果有需要,螞蟻隱私計(jì)算愿意參與到工業(yè)及制造業(yè)隱私計(jì)算技術(shù)的生態(tài)建設(shè)當(dāng)中。
甲子光年:未來(lái)數(shù)據(jù)密態(tài)的市場(chǎng)空間將有多大?
韋韜:Gartner預(yù)測(cè),到2025年會(huì)有50%的大型企業(yè)機(jī)構(gòu)采用隱私計(jì)算,滲透率會(huì)超過(guò)50%。因?yàn)閿?shù)據(jù)一定會(huì)經(jīng)歷跨主體的計(jì)算、傳輸與融合,其技術(shù)會(huì)分幾個(gè)層級(jí),比如數(shù)據(jù)加密、身份保障等。對(duì)于企業(yè)內(nèi)部來(lái)說(shuō),數(shù)據(jù)加密可能成本過(guò)高,而隱私計(jì)算的“可算不可識(shí)”是企業(yè)更強(qiáng)的訴求,所以身份保障也是企業(yè)對(duì)隱私計(jì)算的剛需訴求。
我能夠看到的是,未來(lái)這種數(shù)據(jù)的融合流動(dòng)可能會(huì)超過(guò)50%。對(duì)于在企業(yè)內(nèi)部的整個(gè)用戶身份的“去標(biāo)識(shí)化技術(shù)”,現(xiàn)在有很多企業(yè)都在研發(fā)和改進(jìn)。傳統(tǒng)企業(yè)可能系統(tǒng)改造難度更高一點(diǎn),新的數(shù)字化企業(yè)可以直接上新的體系,但是這取決于整個(gè)社會(huì)對(duì)于隱私計(jì)算的訴求以及商業(yè)化支持的能力,但當(dāng)下我認(rèn)為肯定會(huì)超過(guò) 50% 。
而數(shù)據(jù)密態(tài)是一個(gè)更大的市場(chǎng),隱私計(jì)算只是其中的一部分,具體來(lái)說(shuō),數(shù)據(jù)密態(tài)包括了數(shù)據(jù)安全、隱私保護(hù)和隱私計(jì)算。值得注意的是,隱私計(jì)算并不等價(jià)于隱私保護(hù)。隱私保護(hù)的要求非常多,現(xiàn)在我們把它擴(kuò)展到可信隱私、數(shù)據(jù)密態(tài)的時(shí)候,也是希望能更好地承接隱私保護(hù)的要求。數(shù)據(jù)是一個(gè)非常復(fù)雜的東西,因?yàn)樗旧硎菢I(yè)務(wù)的血液,它跟具體的業(yè)務(wù)形態(tài)密切相關(guān),不同的業(yè)務(wù)模式,不同的場(chǎng)景,使用的數(shù)據(jù)會(huì)完全不一樣。
我們認(rèn)為未來(lái)數(shù)據(jù)密態(tài)市場(chǎng),可能所有的數(shù)據(jù)要素,都會(huì)建立在數(shù)據(jù)密態(tài)這樣的基礎(chǔ)設(shè)施之上,基本上和全社會(huì)的數(shù)字化轉(zhuǎn)型的市場(chǎng)成正比,是一個(gè)萬(wàn)億級(jí)市場(chǎng)。它有一套技術(shù)和基礎(chǔ)設(shè)施涉及到大量的轉(zhuǎn)型改造以及重構(gòu),這件事情的體量非常大,但是它需要投入的資源也非常大,是需要社會(huì)廣泛協(xié)同來(lái)做的一件事情。
4.行業(yè):“我能看到做這件事情的意義”
甲子光年:中國(guó)的數(shù)據(jù)安全保護(hù),商業(yè)、技術(shù)、法律三方應(yīng)如何配合?還有哪些不完善的地方?
韋韜:首先我們必須要承認(rèn)一個(gè)事實(shí),沒(méi)有什么東西是完善的,但我們能做的是在動(dòng)態(tài)過(guò)程中不斷嘗試和演進(jìn)。在數(shù)據(jù)安全與隱私保護(hù)這件事情上也是同樣的道理,商業(yè)、技術(shù)、法律領(lǐng)域的專(zhuān)家們需要緊密協(xié)同尋找平衡。目前歐盟和美國(guó)對(duì)隱私保護(hù)的態(tài)度是兩個(gè)極端,一個(gè)過(guò)嚴(yán),一個(gè)過(guò)松,都不是好的范例。法律和行業(yè)發(fā)展需要在摸索與實(shí)踐中前行。
值得肯定的是,在數(shù)據(jù)安全與隱私保護(hù)大方向上行業(yè)已經(jīng)基本形成了共識(shí),必須得重視數(shù)據(jù)安全,用高水平安全保障高質(zhì)量發(fā)展。我們了解到,很多相關(guān)部門(mén)領(lǐng)導(dǎo)和安全相關(guān)負(fù)責(zé)人對(duì)保護(hù)隱私的重要性也有了非常清晰的判斷。一方面要做到保護(hù)消費(fèi)者和企業(yè)的權(quán)益,另一方面要防止矯枉過(guò)正,不把數(shù)據(jù)市場(chǎng)鎖死。
甲子光年:如何看待近兩年全球隱私計(jì)算專(zhuān)利榜Top10中開(kāi)始出現(xiàn)中國(guó)企業(yè)的這一變化?
韋韜:數(shù)據(jù)安全和隱私保護(hù)領(lǐng)域是個(gè)非常新的學(xué)科。過(guò)去微軟、 IBM 的領(lǐng)先優(yōu)勢(shì)非常大,但近幾年螞蟻集團(tuán)做了大量的工作并實(shí)現(xiàn)反超。螞蟻集團(tuán)對(duì)隱私計(jì)算涉及的所有技術(shù)路徑都進(jìn)行了深入研究,相關(guān)專(zhuān)利數(shù)達(dá)1152件,在2022年全球隱私計(jì)算技術(shù)發(fā)明專(zhuān)利榜中排名第一。因?yàn)槲覀冋J(rèn)識(shí)到,在如今復(fù)雜的應(yīng)用場(chǎng)景之下,單一技術(shù)路徑無(wú)法解決所有問(wèn)題,數(shù)據(jù)密態(tài)的實(shí)現(xiàn)一定會(huì)基于多種技術(shù)的融合。
其實(shí)微軟和IBM非常重視隱私計(jì)算,但我們投入了更多的資源和更高的熱情。我們看到歐洲對(duì)隱私保護(hù)有過(guò)強(qiáng)的要求,這其實(shí)對(duì)于企業(yè)的技術(shù)發(fā)展不利。美國(guó)這邊又比較松,企業(yè)更沒(méi)動(dòng)力去推動(dòng)。中國(guó)處于比較均衡狀態(tài),行業(yè)會(huì)更加有熱情去做這項(xiàng)技術(shù)。
專(zhuān)利是個(gè)雙刃劍,一方面推動(dòng)技術(shù)的發(fā)展,另一方面方面其實(shí)又會(huì)造成技術(shù)壟斷。我們?cè)谖浵佉恢倍汲忠环N態(tài)度:我們的專(zhuān)利是為了更好地推動(dòng)社會(huì)發(fā)展,防止被卡脖子,不會(huì)用于壟斷。在國(guó)內(nèi),我們需要有很多的同行者,更好的能夠支撐國(guó)家在這個(gè)領(lǐng)域的發(fā)展。對(duì)于業(yè)內(nèi)競(jìng)爭(zhēng),我覺(jué)得這并不是一個(gè)值得擔(dān)心的事情,因?yàn)檫@個(gè)領(lǐng)域太復(fù)雜,技術(shù)挑戰(zhàn)太大,現(xiàn)在大家看起來(lái)已經(jīng)做了這么多專(zhuān)利,但是離我們真正要解決的問(wèn)題還有很遠(yuǎn)的距離。我們希望能看到更多的廠家進(jìn)入這個(gè)領(lǐng)域,已經(jīng)進(jìn)入這個(gè)領(lǐng)域的廠家能投入更多資源。
其實(shí),我很高興看到國(guó)內(nèi)同行們?cè)陔[私計(jì)算領(lǐng)域也申請(qǐng)了大量專(zhuān)利 。前些年中國(guó)在很多領(lǐng)域里都面臨著“專(zhuān)利卡脖子”問(wèn)題。比如說(shuō)大家很關(guān)注的 4G、5G ,當(dāng)重要專(zhuān)利都控制在國(guó)際巨頭手上的時(shí)候,中國(guó)是非常吃虧的。我很高興螞蟻集團(tuán)不是在孤軍奮戰(zhàn),當(dāng)越來(lái)越多的中國(guó)企業(yè)共同推進(jìn)數(shù)據(jù)安全,未來(lái)我們就不會(huì)在這個(gè)領(lǐng)域受制于人。
甲子光年:數(shù)據(jù)密態(tài)時(shí)代多久能真的到來(lái)?
韋韜:數(shù)據(jù)密態(tài)時(shí)代會(huì)經(jīng)過(guò)計(jì)算密態(tài)化、大數(shù)據(jù)密態(tài)化、數(shù)據(jù)要素密態(tài)化等三個(gè)階段。
“計(jì)算密態(tài)化”階段,指的是各個(gè)機(jī)構(gòu)出于業(yè)務(wù)發(fā)展的最急迫需求,在最核心的幾個(gè)場(chǎng)景開(kāi)始嘗試密態(tài)計(jì)算,通過(guò)聯(lián)邦學(xué)習(xí)、MPC等隱私保護(hù)技術(shù),開(kāi)展最基礎(chǔ)的計(jì)算、分析、建模等工作,相對(duì)固定且復(fù)雜度有限。主要目的是在保護(hù)自身數(shù)據(jù)的前提下,獲得更有價(jià)值的計(jì)算結(jié)果。一般直接從多方的明文數(shù)據(jù)源直接獲得結(jié)果,實(shí)現(xiàn)數(shù)據(jù)“可用不可見(jiàn)”的基本要求。
在“大數(shù)據(jù)密態(tài)化”階段,各個(gè)機(jī)構(gòu)開(kāi)始全面使用密態(tài)計(jì)算獲得收益,無(wú)論是要處理的數(shù)據(jù)規(guī)模還是復(fù)雜程度將遠(yuǎn)高于第一階段。在這一階段,數(shù)據(jù)密態(tài)處理將越來(lái)越多地呈現(xiàn)出大數(shù)據(jù)處理的特點(diǎn),包括留存大量的中間結(jié)果以供后續(xù)的環(huán)節(jié)使用。傳統(tǒng)的大數(shù)據(jù)平臺(tái)也將向密態(tài)大數(shù)據(jù)平臺(tái)演進(jìn),支持密態(tài)計(jì)算、密態(tài)存儲(chǔ)等密態(tài)能力在大規(guī)模、高性能的復(fù)雜場(chǎng)景中應(yīng)用。這一階段的核心在于實(shí)現(xiàn)數(shù)據(jù)持有權(quán)和使用權(quán)的分離,保障數(shù)據(jù)使用權(quán)的跨域管控。
在“數(shù)據(jù)要素密態(tài)化”階段,數(shù)據(jù)將會(huì)在全行業(yè)、全社會(huì)進(jìn)行廣泛和深入的流動(dòng),一次密態(tài)計(jì)算可能包含同行業(yè)、跨行業(yè)的大量機(jī)構(gòu)的數(shù)據(jù),一份數(shù)據(jù)也可能會(huì)流經(jīng)多家機(jī)構(gòu)并且在流動(dòng)的過(guò)程中不斷演進(jìn)。在這一階段,要在數(shù)據(jù)持有權(quán)和使用權(quán)分離的基礎(chǔ)上,實(shí)現(xiàn)多方、異構(gòu)互聯(lián)。同一份數(shù)據(jù)持有權(quán)僅由最初的機(jī)構(gòu)擁有,其他機(jī)構(gòu)僅能獲得使用權(quán),避免數(shù)據(jù)被到處復(fù)制、留存。除此之外,還需要解決數(shù)據(jù)的定價(jià)、平臺(tái)的公信力等問(wèn)題。
目前,密態(tài)時(shí)代仍處于第一階段,未來(lái)有著極其廣闊的發(fā)展前景。同時(shí),密態(tài)時(shí)代發(fā)展所面臨的技術(shù)挑戰(zhàn)既涉及的維度多,又有非常大的難度。因此,密態(tài)時(shí)代需要一個(gè)兼顧高安全、高性能、高穩(wěn)定性、高適用性、低成本等多方面能力的技術(shù)方案,為數(shù)據(jù)價(jià)值的充分挖掘提供堅(jiān)實(shí)底座。在技術(shù)要求方面,數(shù)據(jù)密態(tài)時(shí)代到來(lái)的標(biāo)志性事件有五個(gè)衡量標(biāo)準(zhǔn):一是性能強(qiáng)大,要達(dá)到每小時(shí)處理億級(jí)樣本數(shù)據(jù)建模;二是可靠穩(wěn)定,在關(guān)鍵應(yīng)用領(lǐng)域要夠達(dá)到99.99%的標(biāo)準(zhǔn);三是成本足夠低,要讓企業(yè)普遍負(fù)擔(dān)得起;四是適用性廣,要做到覆蓋全場(chǎng)及和支持不同處理邏輯;五是安全性足夠高,能夠有效抵抗實(shí)戰(zhàn)威脅,為行業(yè)發(fā)展提供有效保障。
其實(shí)我們已經(jīng)在逐漸接近這些技術(shù)門(mén)檻,近期就能看到階段性成果 ,所以技術(shù)本身并不是數(shù)據(jù)密態(tài)時(shí)代到來(lái)的最大難點(diǎn),治理和協(xié)同才是。數(shù)據(jù)密態(tài)的到來(lái)還需要三到五年,這個(gè)過(guò)程需要同行共同推進(jìn)。
甲子光年:數(shù)據(jù)密態(tài)時(shí)代,螞蟻扮演的角色是什么?
韋韜:過(guò)去中國(guó)在很多技術(shù)的發(fā)展上都滯后于國(guó)際水平,但是數(shù)據(jù)安全領(lǐng)域還處在發(fā)展早期,中國(guó)是有機(jī)會(huì)在世界范圍內(nèi)領(lǐng)先的。 “數(shù)據(jù)密態(tài)”是螞蟻集團(tuán)在數(shù)據(jù)安全與隱私保護(hù)技術(shù)領(lǐng)域展望的大趨勢(shì),我們認(rèn)為這個(gè)方向有可能成為國(guó)家在整個(gè)數(shù)字領(lǐng)域的核心競(jìng)爭(zhēng)力之一。在通往數(shù)據(jù)密態(tài)的道路上,螞蟻扮演的是建設(shè)者和推動(dòng)者的角色,努力為行業(yè)發(fā)展帶來(lái)微小而積極的改變。
今年9月,2022世界人工智能大會(huì)可信隱私計(jì)算高峰論壇成功舉辦。中國(guó)科學(xué)院院士王小云,美國(guó)三院院士Michael I Jordan,加州大學(xué)伯克利分校計(jì)算機(jī)系教授Dawn Song等20多位產(chǎn)學(xué)研界頂尖專(zhuān)家,共同探討了可信隱私計(jì)算技術(shù)的挑戰(zhàn)和未來(lái)。這場(chǎng)論壇被譽(yù)為全球范圍內(nèi)學(xué)術(shù)規(guī)格最高的一場(chǎng)隱私計(jì)算行業(yè)論壇。螞蟻有幸作為這場(chǎng)論壇的主辦方之一,為行業(yè)搭建高質(zhì)量的交流平臺(tái)。
在技術(shù)建設(shè)方面,螞蟻集團(tuán)由于業(yè)務(wù)屬性、布局早等原因,我們已經(jīng)在“數(shù)據(jù)密態(tài)”這個(gè)方向上已經(jīng)做了很多研究和嘗試。經(jīng)過(guò)6年多探索,螞蟻集團(tuán)自主研發(fā)了技術(shù)領(lǐng)先、應(yīng)用成熟的隱語(yǔ)可信隱私計(jì)算技術(shù)棧。這套工業(yè)級(jí)技術(shù)棧融合了千余項(xiàng)專(zhuān)利,功能全面、安全易用,能夠?qū)崿F(xiàn)數(shù)據(jù)的“可用不可見(jiàn)”“可算不可識(shí)”。隱語(yǔ)可信隱私計(jì)算技術(shù)棧入選了2022世界人工智能大會(huì)“八大鎮(zhèn)館之寶”。
我們很樂(lè)意把自己經(jīng)過(guò)沉淀的經(jīng)驗(yàn)和技術(shù)與同行分享,而且在持續(xù)通過(guò)開(kāi)源開(kāi)放、標(biāo)準(zhǔn)共建、人才聯(lián)合培養(yǎng)等形式,與外部共建隱私計(jì)算生態(tài)。螞蟻集團(tuán)先后開(kāi)源了TEE操作系統(tǒng)Occlum、隱語(yǔ)可信隱私計(jì)算框架。9月的可信隱私計(jì)算高峰論壇上,我們繼續(xù)加大開(kāi)放力度,面向全球用戶發(fā)布了“隱語(yǔ)開(kāi)放平臺(tái)”,希望幫助用戶低成本探索隱私計(jì)算應(yīng)用場(chǎng)景。
總體來(lái)說(shuō),實(shí)現(xiàn)“數(shù)據(jù)密態(tài)”的目標(biāo)不是靠一人之力能達(dá)成的。我們需要在主管部門(mén)的指導(dǎo)下,和同行伙伴、高等院校、科研機(jī)構(gòu)一起在技術(shù)創(chuàng)新、生態(tài)共建上持續(xù)發(fā)力,繼續(xù)加大開(kāi)放共創(chuàng)力度,與行業(yè)一道構(gòu)筑高技術(shù)、高水平的數(shù)據(jù)安全堡壘,共同推動(dòng)數(shù)據(jù)要素行業(yè)的安全健康發(fā)展。
本文來(lái)自微信公眾號(hào)“甲子光年”(ID:jazzyear),作者:張怡,36氪經(jīng)授權(quán)發(fā)布。
