国产精一区二区_午夜视频99_免费白白视频_中文字幕一区免费

數據是新石油?Benedict Evans:沒有數據這回事

機器之能
+ 關注
2022-06-02 12:39
496次閱讀
我們被告知,數據是新的石油。每個國家都需要數據戰略,我們所有人都應該擁有自己的數據,并為此付出代價。但這種表述不僅含混而且意義不大。牛津大學社會人類學教授項飚曾談到,很多人都說「數據是新的石油」,他對這個說法一直不太明白,因為數據它當然是大型平臺公司、網絡公司的基礎,但數據本身是不是直接產生效益呢? 人的關聯性是不是比數據更重要?這一質疑在著名分析師 Benedict Evans 的最新博客中得到了一定程度的回應。他在文中指出,沒有數據這回事,它也不是你的,脫離流動的體系和上下文,數據分文不值。

作者 | Benedict Evans

技術充滿了敘事,但其中最響亮的是關于「數據」的。人工智能是未來,一切都與數據有關,數據就是未來,我們應該擁有它,也許還應該為此付出代價,國家需要數據戰略和數據主權。數據是新的石油!
這基本上是無稽之談。不存在所謂的「數據」,它沒有任何價值,而且它也不真正屬于你。

最明顯的是,「數據」不是一件東西,而是無數不同信息的集合,每一個都針對特定應用程序且不可互換。西門子有風力渦輪機遙測系統,倫敦運輸公司有刷卡售票系統,你不能用渦輪遙測技術來規劃新的公交路線。把這兩組數據都給谷歌或騰訊,也不會幫助他們建立一個更好的圖像識別系統。

直截了當地說,這似乎微不足道,但它指出了一些斷言的無用性,尤其是科技外行人的斷言,比如「中國有更多的數據」或「美國將有更多的數據」——更多的什么數據?美團每天送出 5000 萬份餐廳訂單,這讓它可以構建更高效的路徑算法,但不能用于導彈制導系統。在倫敦,甚至無法用它來打造餐廳外賣。

「數據」并非某個一體化的存在,你可以往一個巨大池子里不斷添加各種表格以獲取更多洞見。制定「國家數據戰略」的提法就像要求制定「國家電子表格戰略」或「國家數據庫戰略」一樣(奇怪)。

當然,當人們談論「數據」時,他們主要指的是你的數據——你的個人信息和在互聯網上做的事情,其中一些被科技公司篩選、聚合和部署。我們想要更多的隱私控制,也認為應該擁有這些數據的所有權,無論它們在哪里。

問題是,大多數「你的」數據的意義和價值并不在你自己身上,而在與他人的交集中。你在 Instagram 發的東西沒多大意義:真正有用的信號在于誰喜歡你的帖子、這些人喜歡什么、你喜歡其中多少、誰也喜歡這些;誰關注你、他們還關注誰、誰又關注他們?等向外構建起來的十億人的交互網絡。我喜歡你的照片,那不僅僅是「我的」數據或「你的」數據的問題,沒有點贊和關注你的人,它就沒多大價值。這些數據你也帶不走,因為這里頭也有許多別人的數據(還有隱私!),即使你這么做了,你也可能無法把它接入 TikTok,因為 TikTok 又是另一張交互網絡,和 Instagram 用戶少有重疊。

也就是說,許多類似這樣系統的價值并不在于「數據」本身,而是圍繞數據的活動流。——意義不在于你上傳的圖片或視頻,而在于網絡如何反應,如何打造產品并捕捉到這些網絡反應。你可以將 Instagram, TikTok 或 PageRank 視為一種巨型土耳其機器人( Mechanical Turk,一種眾包網絡集市,能使計算機程序員調用人類智能來執行目前計算機尚不足以勝任的任務——譯者注),畢竟我們還沒有可以看懂每一個網頁、圖片和視頻的 AI,還需要人類——社交網絡節點上的所有人——來做這些事情,比如點贊、觀看、點擊等。這些涉及的是系統,不是數據,價值誕生在系統的流動中。

這也是為什么 Tim O'Reilly(O'Reilly Media 出版公司創始人,Web 2.0 概念的首創者——譯者注)說「數據不是石油,而是沙子」,只有在數百萬的數據總和中才有價值。事實上,即使在簡單的現金流基礎上,這也是真的——2022 年第一季度,就每一位月活用戶來說,Meta 每月僅為其創造了 99 美分的自由現金流。

這也適用于所謂的「個人」數據,你可以有意義地說它是「你的」。你的用電量與他人無關,但它本身沒有價值,只有在倫敦南部或布魯克林的所有家庭用電量的總和中(它)才有價值。DeepMind 的研究人員或許能從100 萬張胸片中發現一些新的、具有臨床重要性的相關性——但你的胸片本身并沒有給他們帶來任何東西,他們也沒有把這些片子輸入 AlphaGo。再說一次,這和數據不是一回事。

我們以前也遇到過這種情況。今天關于人工智能和數據的討論很像上世紀80年代關于數據庫的討論。當時,我們變革了使用信息的方式,問問題的方式以及組織運作方式。數據庫還是新事物時,我們也曾擔心,有些擔心是真的,但今天沒有人會問美國是否有更多的數據庫,或者 SAP 是德國的是否重要。達沃斯也沒人談論「數據庫殖民主義」。這些技術不是國家戰略資產——任何人都可以擁有——關鍵是用來做什么?數據庫支持即時生產(just-in-time)供應鏈和沃爾瑪,讓蘋果在中國生產 iphone——這些是戰略問題。人工智能和「數據」也是如此——它不是新的石油,只是更多軟件,所以(關鍵是)你用它來構建什么?
參考鏈接
https://www.ben-evans.com/benedictevans/2022/5/27/theres-no-such-thing-as-data

本文來自微信公眾號 “機器之能”(ID:almosthuman2017),作者:Benedict Evans,36氪經授權發布。

原標題《沒有數據這回事》

0
相關文章
最新文章
查看更多
關注 36氪企服點評 公眾號
打開微信掃一掃
為您推送企服點評最新內容
消息通知
咨詢入駐
商務合作