国产精一区二区_午夜视频99_免费白白视频_中文字幕一区免费

數據密態時代還有多遠?專訪螞蟻集團韋韜

甲子光年
+ 關注
2022-12-12 14:42
949次閱讀
數據密態時代還有多遠?專訪螞蟻集團韋韜
數據密態時代還有多遠?專訪螞蟻集團韋韜

告別“明文”,邁進“數據密態”時代。

作者 | 張怡
編輯 | 栗子

隨著互聯網的不斷發展,數據在今天已然成為重要的生產要素。海量的數據以空前的規模產生、傳播乃至商業化。大數據在為人們生活提供便利的同時,也讓原本處于灰色地帶的數據泄露、越權使用等數據安全問題暴露無遺。

數字化時代,數據究竟如何使用?

隨著一年前《數據安全法》和《個人信息保護法》的相繼落地,讓數據在授權墻下實現無差別采集的難度激增。這給國內過去數據要素市場的粗放式發展畫上了句號。今年6月,中央深改委審議通過《關于構建數據基礎制度更好發揮數據要素作用的意見》進一步明確:“建立數據資源持有權、數據加工使用權、數據產品經營權等分置的產權運行機制,健全數據要素權益保護制度”。數字經濟建設離不開數據支撐,數字產業化和產業數字化的進程正在加速。如何在保障數據安全的前提下發展數據要素市場?

《數據安全法》、《個人信息保護法》等實施一年之際,螞蟻集團副總裁兼首席技術安全官韋韜博士接受了甲子光年采訪,韋韜博士告訴「甲子光年」 “只要數據流通是處于明文狀態,那么往往因為明文分發易失控導致數據泄露,加劇數據濫用,甚至引發數據要素的價值崩塌。邁進‘數據密態’時代,對數據要素的跨域流轉實現全程安全可控,已經成為建設數字要素市場、發展數據要素經濟的必然一步。”

何為數據密態?簡單來說,“在數據進入流轉進行共享、計算直到銷毀的完整傳播鏈路中,保持數據處于加密狀態不出現明文,將數據持有權與使用權分離,實現數據使用權的跨域管控,以確保數據流轉的全程安全可控”。這種數據加密流轉的狀態被稱為數據密態。

過去,數據加密在互聯網20多年的發展過程中被廣泛應用。但伴隨數字經濟建設的加快,東數西算、大數據交易中心等數據產業落地,數據的生產要素價值需要被進一步釋放,數據持有者和數據需求者兩端都對數據安全提出了更高要求。這些客觀因素都加速著數據密態時代的到來。

目前,可信隱私計算是實現數據密態呼聲最高的技術路徑之一,可以實現在不喪失數據持有權的前提下,有效實現數據使用權的跨域管控。隱私計算本身也在近幾年開始獲得市場與資本方的認可。Gartner更曾預計到2025年,全球將有50%的企業采用隱私計算,并將其列入2021年需要深挖的九項戰略科技趨勢。

不過,數據密態的到來并非旦夕之間,還面臨著諸多挑戰。如何實現滿足場景保障需求、低成本、高效率的數據安全,推動數據密態時代早日到來,正是螞蟻集團與合作伙伴們共同探索的目標。

好在,這些先行者已經開始看到曙光。

數據密態時代還有多遠?專訪螞蟻集團韋韜
1.認知:“數據安全需要再往前走一步” 數據密態時代還有多遠?專訪螞蟻集團韋韜

甲子光年:能否用一句話給“數據密態”下一個簡潔的定義?

韋韜:在數據進入流轉進行共享、計算直到銷毀的完整傳播鏈路中,保持數據處于加密狀態不出現明文,將數據持有權與使用權分離,實現數據使用權的跨域管控,以確保數據流轉的全程安全可控。

甲子光年:如何理解“數據密態”?

韋韜: “數據密態”是螞蟻集團洞察出行業數字化發展的一個新趨勢。在技術上看,數據密態其實是密碼學界一直希望達到的境界。在行業上看,數據密態也契合了未來數據持有權和使用權分離的發展趨勢。

在技術角度,數據加密本身并不新鮮。伴隨20多年的互聯網發展,數據加密已經在金融支付、電子商務等場景下廣泛應用。但這些數據加密大多停留在存儲和傳輸階段。一旦涉及“計算”,數據往往需要回到安全性弱、容易失控的明文狀態。而“數據密態”的核心任務,就是要把加密延展到計算環節,意味著即使在運算期間,也不會出現明文數據。這樣在技術上通過遠程驗證的可信鏈條以及密碼學密鑰機制來實現對數據要素跨域流轉的全程安全控制。

在行業發展角度,2022年6月中央深改委審議通過《關于構建數據基礎制度更好發揮數據要素作用的意見》明確:“建立數據資源持有權、數據加工使用權、數據產品經營權等分置的產權運行機制,健全數據要素權益保護制度”。我們注意到,數據密態也恰恰和數據的三權密切相關。只要數據傳播是處于明文狀態,那么往往因為數據的明文分發易失控導致數據泄露,即造成數據持有權失控;進而加劇數據濫用,導致數據使用權失控;數據明文的泄露也會引發數據要素的價值崩塌,給數據價值經營帶來嚴重阻礙。

數據的持有權主要是持有明文數據(或者明文數據等價物)的權利。有了明文數據后,在技術層面往往就獲得了數據的全部使用價值。傳統上,基于明文的數據流轉,難以將數據的持有權與使用權分離。數據密態技術第一次實現了數據的持有權與使用權分離,可以在保障數據持有權不喪失的前提下,對數據在跨域流轉的全程對其使用權實現管控。這種數據流轉全鏈路的使用權跨域管控能力,對于數據要素價值實現市場定價來說是至關重要的。數據的使用權流通,而非持有權流通,是數據要素行業發展的關鍵。

甲子光年:螞蟻集團提出,2022年,無論從法規要求還是技術成熟度來說,數據流通領域都將告別數據明文時代,進入數據密態時代。這種判斷的依據是什么?

韋韜:因為在明文狀態下,企業或個人都很難控制數據泄露的風險。并且數據的二次分發更會使這種風險呈指數增長。現在,數據已成為實質意義上的社會生產要素,它所能創造的價值是巨大的。中國眾多產業已經進入數字化轉型階段,這其中有大量數據流通、數據價值挖掘的需求。但明文數據可復制、低成本的特性卻與其價值形成反差。如果我們不告別明文,就永遠無法避免數據安全問題。最典型的例子就是明文數據泄露導致電信詐騙、網絡詐騙愈演愈烈。

與此同時,保障數據安全也是國家和社會經濟層面的強烈訴求,在行業自身發展需求之外,相關法規、政策的出臺更是進一步強化了打造數據密態基礎設施的行業需求。國家一直強調:安全和發展是一體之兩翼、驅動之雙輪。近兩年,《數據安全法》、《個人信息保護法》以及《密碼法》、《民法典》等法律法規的落地,都證明著國家對數據安全的重視。如果數據安全相關問題不能得到妥善治理,那將會對數字經濟建設,甚至社會安全穩定造成巨大風險。

另外在技術層面,隱私計算技術經過幾年來的探索,多個行業已經在一些小規模領域做了驗證。在實踐過程中碰到的困難、挑戰和受益,也逐漸明確。

所以我們認為,整個數據安全行業已經走到了邁入數據密態時代的節點。螞蟻集團提出“數據密態”,希望呼吁整個行業一起往新時代邁進。

甲子光年:過去企業不重視數據安全嗎?

韋韜:現代數字化企業是一種不斷演變進化的數字生命體。它的架構復雜性會爆炸性增長,不斷引入的外部數字化產品服務和行業技術體系演化,會推動其形成內部數字化基因的代差積累,就像碳基生命基因的演化,但更快更劇烈。

過去企業也重視數據安全。但總體而言,數據安全行業發展依然遠落后于互聯網和整個社會數字化的發展。盡管近幾年全行業都開始加強數據安全的投入力度,但差距依然顯著。比如今天依然有不少企業沒有專職數據安全團隊,現有的安全技術體系也往往難以跟上企業數字化基因代差的快速演變。

為了應對嚴峻的網絡安全攻擊威脅,符合嚴格的數據安全合規要求,保障企業數字生命體的健康發展,必須加快發展能夠適應這樣的數字生命體的安全技術、服務與行業引導機制。這對很多企業、行業來說都是巨大挑戰,也需要政府、行業、企業和社會更緊密的協同合作,共同進行安全建設和保障。

甲子光年:數據密態時代的到來,是否意味著數據安全問題將不復存在?

韋韜:數據安全的程度需要結合實現成本來看,沒有人能夠承受實現絕對安全的成本。如果把數據安全比喻成交通治理,不難發現,“平衡”是這個問題的關鍵:高速公路需要限速來控制風險,但也不能單純因為安全而過分限速。數據安全需要尋求效率和風險的平衡。這一點在數據密態時代下依舊有效。

特別的,數據密態相關技術主要開始逐步應用于跨主體間的數據流轉管控領域,這將顯著的提升這些領域的數據安全保障水位。但主體內部的數據流轉,以及沒有使用數據密態技術的跨主體數據流轉,依然需要其他技術和機制來提升其安全保障能力。

事實上數據安全是一個非常復雜的體系。達成數據安全是這個安全體系的整體效果,而實現路徑和方案現在都處于摸索階段,目前數據安全行業還需要更多相關方共同參與實踐。

2.技術:“尋求安全與效率的平衡”數據密態時代還有多遠?專訪螞蟻集團韋韜

甲子光年:數據密態和隱私計算、密碼學之間的技術關系是什么?隱私計算的技術路線已經基本確定了么?

韋韜:“數據密態”是螞蟻對數據安全行業發展階段的描述,而密碼學、隱私計算等技術是實現數據密態的技術手段。傳統密碼學技術主要應用于數據的傳輸和儲存;而隱私計算更聚焦于數據共享、計算、流轉階段的加密,在支持數據價值傳播的同時防止數據明文泄露。

實現隱私計算的技術路徑也很多,包括多方安全計算、聯邦學習、全同態、可信執行環境等等,但還有很多的實際需求沒有得到滿足,依然有很大的創新空間。其實隱私計算本身也有兩個概念定義。一個是李鳳華老師提出的隱私計算(Privacy Computing),是面向隱私信息全生命周期保護的計算理論和方法。另外一個是目前行業里討論的比較多的隱私計算,或者更準確的叫做隱私保護計算(Privacy-preserving Computation),是保證數據提供方不泄露原始數據的前提下,對數據進行分析計算的一系列信息技術,實現數據在流通與融合過程中的“可用不可見”。我們平時談論較多的概念是后者。

目前隱私計算技術領域也逐步形成了向可信隱私計算升級的共識。可信隱私計算將會在隱私保護計算概念(Privacy-preserving Computation)的基礎上,更好的融合前者概念(Privacy Computing)對于隱私保護的訴求:可信隱私計算是指在應用過程中,安全性、可用性和隱私保護符合設計申明預期的隱私計算,以滿足數據需求方、數據提供方、和監管方等各方的需求。可信隱私計算的特征包括安全可驗證,過程可審計,開放普適,滿足數據要素流轉場景的隱私保護,可靠性,性能等要求。可信隱私計算行業共識的形成明確了下一步技術演進的方向和要求,有助于行業更好的協同發力形成突破。

比如,為解決傳統隱私計算技術在計算效率和保護數據安全之間的平衡問題,螞蟻集團于2021年起推動發展新一代可信隱私計算技術“可信密態計算”(Trusted-Environment-based Cryptographic Computing,TECC),這項技術創新性地將密碼技術(MPC、FL)和全棧可信計算技術(TEE、TPM)融合在一起,將數據以全密態形式在高速互聯的可信節點集群中進行計算、存儲、流轉,可實現數據持有權有效保障、使用權出域可控,支撐任意多方大規模數據安全、可靠、高效地進行全密態的融合與流轉。TECC突破了使用單一技術的局限,獲得了更高的綜合能力,能在1小時內完成億級樣本密態分析和建模,在安全性、適用性、性能等維度上形成跨越式提升,是數據密態時代的有力支撐。2022年7月,可信密態計算(TECC)還因為技術的突破性入選了數字中國建設峰會“十大硬核科技”獎。目前TECC也正在主管部門指導下進行開源。

甲子光年:過去,數據的合規使用一直是個難題。開放授權數據獲取的業務場景就可能引發數據泄露,但授權嚴監管下獲取的數據價值又比較有限。如何解決這個矛盾?

韋韜:其實現在監管部門對數據授權已經有了非常嚴格的管控,面對企業違規獲取授權或者霸王條款,消費者和企業都可以通過各種渠道去申訴,這是一個非常大的變化。大約從2018年開始,許多互聯網公司已經把授權協議從概括授權更改到了單一場景授權。也就是說,現在的數據獲取已經實現了“一個授權只對應一個場景需求”,而不是把所有場景需求都綁定在一個授權上。

另外,《個人信息保護法》更明確了授權數據面向的場景、主體,以及應用范圍,關鍵詞“同意”在其中高頻出現了27次,意在強調企業獲取和使用信息,必須經過用戶的同意,授權程序必須規范。

同時我們也需要看到,今天的人工智能體系是依靠數據驅動的。在授權嚴監管下,如果采集不到足夠量級的無偏差的數據,智能體系則很難發揮作用,這對數據行業來說的確不是個好消息。

現在我們要努力達到的平衡是,既要保護公眾的隱私權益,又要實現“十四五”規劃中的數字要素市場化發展。至于如何在保護數據安全和發揮數據價值之間平衡,其實就是我們所提出的“可算不可識”。“可算不可識”是實現個人隱私保護的關鍵技術模式,在模型訓練、數據分析等場景下確保個人身份不會被重識別,滿足法律法規的匿名化要求。可信隱私計算可以有效的通過在可信環境中的受控匿名化實現可算不可識,同時讓數據的使用和流通實現可審計可舉證。

甲子光年:數據密態時代下的數據使用和流通需要可審計可舉證,如何通過技術手段真正實現?加密貨幣的區塊鏈技術、分布式記賬方法值得借鑒嗎?

韋韜:數據使用和流通的審計與舉證,的確是一個比較困難的技術挑戰。2021年,螞蟻集團提出把隱私計算與區塊鏈深度融合,確保數據密態流轉過程中能有清晰的可審計的授權、確權、鑒權環節,這是數據要素產業化的關鍵。在數據密態狀態下,所有的數據都以密態形式呈現,溯源取證的難度比明文時期顯著增加,所以需要建立新的技術模式來解決這些問題。

在這個新的技術體系中,我們認為區塊鏈是非常合適的。因為區塊鏈的本質就是分布式賬本,它能夠以去中心化的方式實現審計固證。但值得注意的是,如果數據密態時代真的到來,審計一定會成為數據密態基礎設施的關鍵組件,后期人們也會面對更大的數據量級,很多細節還需要行業共同探索推進。

甲子光年:隱私計算是否會面臨算力、電力等其他基礎設施的掣肘?

韋韜:實現隱私計算的不同技術路徑都面臨著各自的性能挑戰。傳統的多方安全計算和聯邦學習需要依靠網絡來完成計算,計算量的上升量級非常高,跨公網/專線的帶寬和時延是限制其性能、可靠性、普適性、成本的關鍵瓶頸之一,目前硬件加速的方式也難以緩解這個難題。而全同態技術通過完全密態的方式做計算,雖然不要求高頻率的交互,但是非常依賴硬件加速。另外,全同態導致數據急劇膨脹也會額外增加計算壓力,導致傳輸和存儲成本急劇升高,往往高達千倍以上。各個隱私計算技術路線在未來的商業化層面還要解決諸多難題,也給了行業更多技術創新突破的需求空間。前面提到的可信密態計算(TECC)也正是在這樣的場景之下誕生,對算力成本的需求增加可以控制在明文分布式計算一個數量級之內,從而有效的支持各種大規模密態應用需求。

數據密態時代還有多遠?專訪螞蟻集團韋韜

甲子光年:隱私計算路線眾多,各條路線如何將數據安全保護落到實處?是否有通用的標準?

韋韜:隱私計算技術路線五花八門,針對隱私計算實現的安全性,當前的安全分級標準是針對單個技術路線來制定的,但在應用場景它們相互之間很難交叉比較,也無法對新興的隱私計算技術進行安全評估。

實際應用中,在不同的場景下,在應用隱私計算上付出不同數量級的成本時,在各個維度上都應該有相應的收益。在安全側則應該有一個相對通的尺子來衡量收益,即如何比較完全不同的隱私計算技術的安全性。如何來做通用的衡量,對隱私計算實現的“數據密態”進行安全分級。這件事情挑戰非常大,我們也是首次嘗試,這對于全球來說都是一個新興的挑戰。

我們發現在本質上,隱私計算產品安全性度量的本質在于需要付出多大的成本、克服多大的不確定性來攻破給定的安全防護保障,造成信息泄露的后果或風險。在這個認知的基礎上,我們目前正在嘗試將隱私計算產品安全從實戰角度劃分為如下五級:

第一是基線防護級,基本的安全基線要求,不能有已知中高危安全漏洞。

第二是審計追溯級,能對隱私計算協議交互中已知無法阻斷的攻擊和泄露進行審計;對于允許信息熵泄露的技術應該有泄露度量能力。特別的,對于密碼學半誠實模型的隱私計算技術,應該能對“不誠實”的行為有審計能力,否則無法感知和審計的攻擊在實際應用中會引發不可控的數據泄露風險。有信息熵泄露的技術也應用類似的要求。

第三是廣度防護級,對于已知的可以造成實際信息泄露的攻擊方法均應有相應的防護方案;不應該包括漏洞頻發的高危組件。

第四是深度檢驗級,能夠通過2個安全攻防專業團隊背對背1個月或以上的深度安全評估,且不被發現中高危漏洞。這樣的安全強度能夠在實戰中對抗變異攻擊,對數據安全提供高等級防護能力。

第五是安全證明級,對于關鍵復雜性隱患,有代碼級形式化證明保障。包括像內存安全驗證這樣的復雜性證明,也包括像算法和代碼實現的一致性證明。

將隱私計算系統對數據安全的保護能力做技術中立的安全分級,這樣有助于隱私計算技術更好的在實際場景中應用推廣,同樣也需要行業共同的努力。

甲子光年:隱私計算的價值空間有多大?在諸如“東數西算”類的國家重大工程中,隱私計算如何發揮作用?

韋韜:東數西算最明顯的特征是“原始數據在東部,大規模計算在西部”,讓西部的能源、空間發揮優勢。但這個過程如何平衡效率和風險是一個全新的挑戰。

如果把原始明文數據直接搬到西部,那么不但源數據會直接明文暴露,而且分析建模過程中產生的大量中間數據也以明文方式暴露,這會顯著的增加了數據泄露的風險暴露面;而且這種方法使得西部數據中心匯聚大量高價值數據,與東部相比又缺乏專業安全人員,整體安全風險壓力急劇增加。如果把原始明文數據保留在東部,那么像傳統模式的隱私計算技術,如多方安全計算和聯邦學習,其發起方和計算方都需要在數據源方,西部的算力難以發揮作用。所以在東數西算中,為了平衡效率和風險,最佳的解決方案是數據以密態方式在西部數據中心存儲、分析、融合,既有效保障安全,又能充分發揮出西部算力、能源方面的優勢。

從上面的分析可以看出,在東數西算場景下,可信密態計算TECC可以妥善地解決效率與風險的平衡,因為可信密態計算TECC并不強烈依賴跨網絡交互,東部的數據只需要以密態方式傳輸到西部,在西部數據中心的存儲、計算、應用中數據都是以密態方式存在的。數據持有方可以安全有效的進行跨域數據管控、計算和融合,在這種模式下既節省了通信成本又能充分利用西部算力資源。

數據密態時代還有多遠?專訪螞蟻集團韋韜

3.商業:“數據要素商業化困境”數據密態時代還有多遠?專訪螞蟻集團韋韜

根據甲子智庫數據顯示,預計到2025年,國內隱私計算的整體市場規模將超過200億元,2021~2025年均復合增長率達133.4%

數據密態時代還有多遠?專訪螞蟻集團韋韜

甲子光年:隱私計算(以及數據要素)商業落地的難點是什么?

韋韜:首先是需要政策的明確指導,行業主管單位關于合法合規的標準、測評和試點支撐。比如今年中央深改會第二十六次會議上審議通過了《關于構建數據基礎制度更好發揮數據要素作用的意見》,明確了要建立數據資源持有權、數據加工使用權、數據產品經營權等分置的產權運行機制,這對于數據合規使用、數據要素市場化來說是個非常積極的信號。

在技術上,與明文計算相比,隱私計算商業化的最大難點還是在性能與普適性瓶頸。目前行業應用最多的隱私計算技術是PSI(Private Set Intersection,隱私集合求交),性能相對可控,所以應用廣泛。稍微復雜一點的是邏輯回歸(Logistics Regression),由于一般數據量級有限(不超過100萬),性能也能接受。但復雜度再上升,到了現在最廣泛使用的GBDT樹模型,即使是30萬的樣本,在專線條件下聯邦學習完成訓練也往往需要8個小時以上。對比一下,同樣的樣本與訓練量如果在明文狀態下,可以做到在分鐘級就能完成,可以看出相差甚大。復雜度再往上是深度學習,這方面傳統隱私計算和明文分布式計算的性能差距更加顯著。這也是我們需要去研究像可信密態計算TECC技術等新興高性能可信隱私計算模式的原因。

另外,隨著隱私計算涉及的數據方從二方升級到三方、四方等,所適用的算法也截然不同,而且隨著數據的劃分方式還有很大差異。復雜程度、通信成本、安全成本都會顯著上升。這是現階段隱私計算應用的場景還相對受限的原因。

在成本上,在過去很長一段時間里,數據安全是個奢侈品,企業很難,也很少有意愿花資源投入數據安全。不過近幾年這種現象開始有了改觀。隨著數字化浪潮的推進,數據安全保障已經成為企業發展所必須的一環。《數據安全法》《個人信息保護法》等法律法規的落地,也在極大程度上提高了合規底線,同時將各相關方的積極性調動起來。當數據安全的市場足夠大,規模效應就會幫助整個行業攤薄成本,降到企業都能接受的程度。

甲子光年:在隱私計算方面,螞蟻目前有哪些已經商業化的產品和應用場景?

韋韜:螞蟻集團一直堅持嘗試多種技術路徑。在商業方面,我們已經開始給有需求的客戶提供商業化支持。比如自主研發的螞蟻鏈摩斯多方安全計算平臺(MORSE),目前應用于金融、科研、政務等十多個行業,服務了上百家機構。

去年我們發布了數據隱私協作平臺(FAIR),將隱私計算和區塊鏈技術深度融合,構建了自主安全計算硬件并獲得CFCA安全認證,并聯合達摩院計算技術實驗室和阿里安全雙子座實驗室等團隊設計全同態硬件加速,實現了百倍以上的性能提升。

在應用場景方面,目前聯合風控、聯合營銷、政務業務是我們主要布局的應用場景。

今年年初, IDC發布了《金融行業隱私保護計算探索與實踐》,螞蟻隱私計算應用案例“網商銀行農村金融在可信執行環境技術下的實踐”被列入行業優秀實踐之一。在可信隱私計算的保障下,銀行與合作方可以通過可信執行環境同時融合各數據源的數據并保障數據隱私安全,為涉農用戶提供融資金融服務,解決了農村金融服務匱乏、農業經營者融資難融資貴的難題。

從去年開始,螞蟻隱私計算還探索了醫療場景的應用,已經與醫院、衛健機構、藥械廠商展開了合作。在近兩年醫保支付改革的背景下,2021年可信隱私計算開源框架“隱語”和阿里云數字醫療團隊合作,為浙江某三級醫院搭建了面向醫院運營管理的數據融合平臺,病理質控和醫保DRG(Diagnosis Related Group,疾病診斷相關分組)管理效能得到顯著提升,2021年三個月時間內,幫助醫院累計優化數十萬醫保結算,并通過編碼入組,將醫保反饋分析工作量顯著降低,甲級病案例病理質控也提升了10~20%。

同時,隨著工業互聯網時代的到來,我們在工業和制造業領域也看到了大量場景對數據安全的需求。比如,我們常常可以看到,一些地區正在試點的自動駕駛車輛,它的傳感器就是把周圍的人、環境等數據,與工業互聯網數據進行耦合。如果這些傳感器數據缺乏相關安全管控,很有可能引發大量安全相關問題。我們相信可信隱私計算技術將是工業制造業在數據密態時代的解決方案。如果有需要,螞蟻隱私計算愿意參與到工業及制造業隱私計算技術的生態建設當中。

甲子光年:未來數據密態的市場空間將有多大?

韋韜:Gartner預測,到2025年會有50%的大型企業機構采用隱私計算,滲透率會超過50%。因為數據一定會經歷跨主體的計算、傳輸與融合,其技術會分幾個層級,比如數據加密、身份保障等。對于企業內部來說,數據加密可能成本過高,而隱私計算的“可算不可識”是企業更強的訴求,所以身份保障也是企業對隱私計算的剛需訴求。

我能夠看到的是,未來這種數據的融合流動可能會超過50%。對于在企業內部的整個用戶身份的“去標識化技術”,現在有很多企業都在研發和改進。傳統企業可能系統改造難度更高一點,新的數字化企業可以直接上新的體系,但是這取決于整個社會對于隱私計算的訴求以及商業化支持的能力,但當下我認為肯定會超過 50% 。

而數據密態是一個更大的市場,隱私計算只是其中的一部分,具體來說,數據密態包括了數據安全、隱私保護和隱私計算。值得注意的是,隱私計算并不等價于隱私保護。隱私保護的要求非常多,現在我們把它擴展到可信隱私、數據密態的時候,也是希望能更好地承接隱私保護的要求。數據是一個非常復雜的東西,因為它本身是業務的血液,它跟具體的業務形態密切相關,不同的業務模式,不同的場景,使用的數據會完全不一樣。

我們認為未來數據密態市場,可能所有的數據要素,都會建立在數據密態這樣的基礎設施之上,基本上和全社會的數字化轉型的市場成正比,是一個萬億級市場。它有一套技術和基礎設施涉及到大量的轉型改造以及重構,這件事情的體量非常大,但是它需要投入的資源也非常大,是需要社會廣泛協同來做的一件事情。

4.行業:“我能看到做這件事情的意義”數據密態時代還有多遠?專訪螞蟻集團韋韜

甲子光年:中國的數據安全保護,商業、技術、法律三方應如何配合?還有哪些不完善的地方?

韋韜:首先我們必須要承認一個事實,沒有什么東西是完善的,但我們能做的是在動態過程中不斷嘗試和演進。在數據安全與隱私保護這件事情上也是同樣的道理,商業、技術、法律領域的專家們需要緊密協同尋找平衡。目前歐盟和美國對隱私保護的態度是兩個極端,一個過嚴,一個過松,都不是好的范例。法律和行業發展需要在摸索與實踐中前行。

值得肯定的是,在數據安全與隱私保護大方向上行業已經基本形成了共識,必須得重視數據安全,用高水平安全保障高質量發展。我們了解到,很多相關部門領導和安全相關負責人對保護隱私的重要性也有了非常清晰的判斷。一方面要做到保護消費者和企業的權益,另一方面要防止矯枉過正,不把數據市場鎖死。

甲子光年:如何看待近兩年全球隱私計算專利榜Top10中開始出現中國企業的這一變化?

韋韜:數據安全和隱私保護領域是個非常新的學科。過去微軟、 IBM 的領先優勢非常大,但近幾年螞蟻集團做了大量的工作并實現反超。螞蟻集團對隱私計算涉及的所有技術路徑都進行了深入研究,相關專利數達1152件,在2022年全球隱私計算技術發明專利榜中排名第一。因為我們認識到,在如今復雜的應用場景之下,單一技術路徑無法解決所有問題,數據密態的實現一定會基于多種技術的融合。

其實微軟和IBM非常重視隱私計算,但我們投入了更多的資源和更高的熱情。我們看到歐洲對隱私保護有過強的要求,這其實對于企業的技術發展不利。美國這邊又比較松,企業更沒動力去推動。中國處于比較均衡狀態,行業會更加有熱情去做這項技術。

專利是個雙刃劍,一方面推動技術的發展,另一方面方面其實又會造成技術壟斷。我們在螞蟻一直都持一種態度:我們的專利是為了更好地推動社會發展,防止被卡脖子,不會用于壟斷。在國內,我們需要有很多的同行者,更好的能夠支撐國家在這個領域的發展。對于業內競爭,我覺得這并不是一個值得擔心的事情,因為這個領域太復雜,技術挑戰太大,現在大家看起來已經做了這么多專利,但是離我們真正要解決的問題還有很遠的距離。我們希望能看到更多的廠家進入這個領域,已經進入這個領域的廠家能投入更多資源。

其實,我很高興看到國內同行們在隱私計算領域也申請了大量專利 。前些年中國在很多領域里都面臨著“專利卡脖子”問題。比如說大家很關注的 4G、5G ,當重要專利都控制在國際巨頭手上的時候,中國是非常吃虧的。我很高興螞蟻集團不是在孤軍奮戰,當越來越多的中國企業共同推進數據安全,未來我們就不會在這個領域受制于人。

甲子光年:數據密態時代多久能真的到來?

韋韜:數據密態時代會經過計算密態化、大數據密態化、數據要素密態化等三個階段。

“計算密態化”階段,指的是各個機構出于業務發展的最急迫需求,在最核心的幾個場景開始嘗試密態計算,通過聯邦學習、MPC等隱私保護技術,開展最基礎的計算、分析、建模等工作,相對固定且復雜度有限。主要目的是在保護自身數據的前提下,獲得更有價值的計算結果。一般直接從多方的明文數據源直接獲得結果,實現數據“可用不可見”的基本要求。

在“大數據密態化”階段,各個機構開始全面使用密態計算獲得收益,無論是要處理的數據規模還是復雜程度將遠高于第一階段。在這一階段,數據密態處理將越來越多地呈現出大數據處理的特點,包括留存大量的中間結果以供后續的環節使用。傳統的大數據平臺也將向密態大數據平臺演進,支持密態計算、密態存儲等密態能力在大規模、高性能的復雜場景中應用。這一階段的核心在于實現數據持有權和使用權的分離,保障數據使用權的跨域管控。

在“數據要素密態化”階段,數據將會在全行業、全社會進行廣泛和深入的流動,一次密態計算可能包含同行業、跨行業的大量機構的數據,一份數據也可能會流經多家機構并且在流動的過程中不斷演進。在這一階段,要在數據持有權和使用權分離的基礎上,實現多方、異構互聯。同一份數據持有權僅由最初的機構擁有,其他機構僅能獲得使用權,避免數據被到處復制、留存。除此之外,還需要解決數據的定價、平臺的公信力等問題。

目前,密態時代仍處于第一階段,未來有著極其廣闊的發展前景。同時,密態時代發展所面臨的技術挑戰既涉及的維度多,又有非常大的難度。因此,密態時代需要一個兼顧高安全、高性能、高穩定性、高適用性、低成本等多方面能力的技術方案,為數據價值的充分挖掘提供堅實底座。在技術要求方面,數據密態時代到來的標志性事件有五個衡量標準:一是性能強大,要達到每小時處理億級樣本數據建模;二是可靠穩定,在關鍵應用領域要夠達到99.99%的標準;三是成本足夠低,要讓企業普遍負擔得起;四是適用性廣,要做到覆蓋全場及和支持不同處理邏輯;五是安全性足夠高,能夠有效抵抗實戰威脅,為行業發展提供有效保障。

其實我們已經在逐漸接近這些技術門檻,近期就能看到階段性成果 ,所以技術本身并不是數據密態時代到來的最大難點,治理和協同才是。數據密態的到來還需要三到五年,這個過程需要同行共同推進。

數據密態時代還有多遠?專訪螞蟻集團韋韜

甲子光年:數據密態時代,螞蟻扮演的角色是什么?

韋韜:過去中國在很多技術的發展上都滯后于國際水平,但是數據安全領域還處在發展早期,中國是有機會在世界范圍內領先的。 “數據密態”是螞蟻集團在數據安全與隱私保護技術領域展望的大趨勢,我們認為這個方向有可能成為國家在整個數字領域的核心競爭力之一。在通往數據密態的道路上,螞蟻扮演的是建設者和推動者的角色,努力為行業發展帶來微小而積極的改變。

今年9月,2022世界人工智能大會可信隱私計算高峰論壇成功舉辦。中國科學院院士王小云,美國三院院士Michael I Jordan,加州大學伯克利分校計算機系教授Dawn Song等20多位產學研界頂尖專家,共同探討了可信隱私計算技術的挑戰和未來。這場論壇被譽為全球范圍內學術規格最高的一場隱私計算行業論壇。螞蟻有幸作為這場論壇的主辦方之一,為行業搭建高質量的交流平臺。

在技術建設方面,螞蟻集團由于業務屬性、布局早等原因,我們已經在“數據密態”這個方向上已經做了很多研究和嘗試。經過6年多探索,螞蟻集團自主研發了技術領先、應用成熟的隱語可信隱私計算技術棧。這套工業級技術棧融合了千余項專利,功能全面、安全易用,能夠實現數據的“可用不可見”“可算不可識”。隱語可信隱私計算技術棧入選了2022世界人工智能大會“八大鎮館之寶”。

我們很樂意把自己經過沉淀的經驗和技術與同行分享,而且在持續通過開源開放、標準共建、人才聯合培養等形式,與外部共建隱私計算生態。螞蟻集團先后開源了TEE操作系統Occlum、隱語可信隱私計算框架。9月的可信隱私計算高峰論壇上,我們繼續加大開放力度,面向全球用戶發布了“隱語開放平臺”,希望幫助用戶低成本探索隱私計算應用場景。

總體來說,實現“數據密態”的目標不是靠一人之力能達成的。我們需要在主管部門的指導下,和同行伙伴、高等院校、科研機構一起在技術創新、生態共建上持續發力,繼續加大開放共創力度,與行業一道構筑高技術、高水平的數據安全堡壘,共同推動數據要素行業的安全健康發展。

本文來自微信公眾號“甲子光年”(ID:jazzyear),作者:張怡,36氪經授權發布。

0
相關文章
最新文章
查看更多
關注 36氪企服點評 公眾號
打開微信掃一掃
為您推送企服點評最新內容
消息通知
咨詢入駐
商務合作