以隱私的名義,一場數據的戰爭打響了
當數據已經成為新時代的石油,當數據所有權尚未清晰,科技圈的暗戰已然開打。
在舊金山的「新硅谷」SOMA 區,通往海灣大橋的高速公路旁,佇立著一塊鴨子廣告牌,上面寫著:「谷歌在追蹤你。我們不會。」
說這話的鴨子來自 DuckDuckGo,一家主打隱私保護的搜索引擎公司。
DuckDuckGo 在舊金山「新硅谷」SOMA 地區的廣告牌|圖片來源:WIRED
在美國,DuckDuckGo 有 2245 塊廣告牌,在歐洲是 2261 塊。這對于一家科技公司來說并不尋常。
通常,科技公司更傾向于在線上投放廣告。根據用戶數據生成的定向廣告可以讓公司更高效地找到他們的目標用戶。DuckDuckGo 選擇了廣告牌這種老派的方式——這是為了以行動樹立這家企業的價值觀:不追蹤用戶。
去年,DuckDuckGo 的應用下載量超過了 5000 萬次,比之前所有年份的總和還多,年收入也相應突破了 1 億美元(約合 6.5 億元人民幣)。要知道,這家成立于 2008 年的公司,在上一輪融資過后,估值也就 7480 萬美元(約合 4.86 億元人民幣)。看起來,它主打隱私的價值觀奏效了。
最近,DuckDuckGo 憑借 2.42% 的市占率,超越必應、雅虎成為了美國第二的移動搜素引擎。而第一名的谷歌,是 94.36%,DuckDuckGo 的 39 倍。
這是一個大衛挑戰哥利亞的故事,但在這個故事中,「大衛」揮舞的不是石子,而是「隱私」這桿大旗。
種種數據表明:在巨頭格局確立,新秀創業公司本沒有多少增長空間的當下,以隱私為名的新一代數據之爭已經拉開序幕。
2020 年 6 月,蘋果的隱私工程經理凱蒂·史金納(Katie Skinner)在 WWDC(世界開發者大會)上用 20 秒介紹了 iOS 14 的一個「小小更新」:App 在搜集用戶數據之前,必須征求用戶同意。一旦用戶不同意,就會關閉 IDFA 碼(Identifier For Advertisers),蘋果的廣告主標識符。
這個搜集用戶數據的 IDFA 開關,在去年 6 月之前還是默認開啟的。但在 iOS 14 上,這成為了一個顯性的可選項。當用戶第一次打開 App 時,iOS 會彈窗詢問:「是否同意 App 對你進行跨網站、App 的追蹤?」顯然,多數用戶并不會同意,這就直接切斷了定向廣告的數據來源。
這是蘋果應用追蹤透明度(App Tracking Transparency,ATT)的一部分。2021 年 5 月,一項針對美國 300 名 iPhone 用戶的調查指出,73% 的受訪者對這項隱私政策都表示贊同。蘋果的 CEO 蒂姆·庫克(Tim Cook)也在 2021 年第三季度的財報電話會議上回應,在 ATT 推出之后,蘋果受到了相當積極的回饋。
「你的 App 想要追蹤你的數據給你發廣告,你同意追蹤嗎?」|圖片來源:AppleFacebook 認為蘋果的做法扼殺了中小企業,而 Facebook 將立場鮮明地與中小企業站在一起。|圖片來源:Twitter@DaveStangis
但對于所有以線上廣告為商業模式的公司來說,這可能是一場性命攸關的大震蕩。反應最激烈的是 Facebook。2020 年 12 月,它買了下了《紐約時報》的一整個版面,公開反對蘋果。
在 Facebook 的口徑中,蘋果的做法嚴重限制了中小企業的生存。大企業有足夠的財力進行大規模廣告投放,但中小企業如果沒有精準投放技術,就很難找到潛在的用戶群,廣告投放的效率會大大降低。根據 Facebook 說法,這會平均降低中小企業 60% 的收入。
Facebook 認為蘋果的做法扼殺了中小企業,而 Facebook 將立場鮮明地與中小企業站在一起。|圖片來源:Twitter@DaveStangis
雖然 Facebook 的言論看起來是純粹利他的,但和大眾印象不同,表面上是一家科技公司的 Facebook 其實是一家廣告公司。2020 年四季度財報顯示,Facebook 的 280.7 億美元(約合 1825.84 億元人民幣)的收入中,96.8% 都來自廣告。Facebook 曾在 iOS 14 測試版上小規模測試過,結果廣告收入出現了 50% 的下跌。
在財報公布后的電話會議上,Facebook 的 CEO 扎克伯格更是直白地說道:「蘋果嘴上說他們在幫助用戶,但實際上這件事顯然是利益驅使。」
Facebook 和蘋果的本質矛盾在于這兩家公司商業模式的不同。廣告是 Facebook 的核心業務,廣告商是它的主要客戶。但蘋果是一家電子消費品公司,面向的是 C 端用戶,包括 iPhone、iPad、Mac 和其他可穿戴式設備的硬件銷售才是它的主要收入。
實際上,讓業界如此在意的 IDFA 就是蘋果隱私政策的產物。在 IDFA 問世之前,App 可以直接讀取到手機的唯一識別碼,無論是 MAC 地址、UDID 還是 UUID。IDFA 的不同之處在于用戶可以重置或者關閉這個識別碼。雖然 IDFA 的關閉入口隱藏得很深,但蘋果給了用戶一個選擇:是否要讓 App 給你推送定向廣告。需要注意的是,關閉 IDFA 并不會減少廣告數量,只是定向廣告的精度會下降。
但扎克伯格的「攻擊」不是沒有來由,蘋果并非隱私保護的「天使」。在打擊競爭對手廣告業務的同時,蘋果也在擴大自身的廣告版圖。
蘋果的廣告業務主要有兩種,App Store 的搜索廣告和新聞、股市應用的展示廣告。目前,蘋果的搜索廣告業務(Apple Search Ads)已經在中國上線。這項在 2016 年就推出的業務允許開發者以競價的方式投放廣告。
而根據 FT 中文網的報道,蘋果正在計劃為 App Store 增加第二個廣告位。
以抖音為例,在 App Store 搜索「抖音」后,排名第一的是「快手」的廣告
事實上,蘋果一直在試圖進入廣告業務。早在 2010 年,蘋果就推出了移動廣告平臺 iAd。在喬布斯看來,當時的移動廣告「實在太爛了」。他不想把 iAd 做成低俗的廣告平臺,而是希望這個平臺上可以呈現優雅的、不會讓用戶反感的廣告。也因此,iAd 設立了 50 萬美元的高門檻,這讓很多中小公司望而卻步。最終 iAd 于 2016 年 6 月關閉。
三年前,蘋果也自己設計了一套廣告追蹤框架——SKAdNetwork。它和 IDFA 一樣可以追蹤廣告投放的效果,但出于種種數據保護方面的限制,也很難稱得上好用。但是在眼下「嚴苛」的蘋果新政面前,SKAdNetwork 可能是廣告主們最好的選擇了。
雖然目前廣告業務只占蘋果營收中非常小的一部分,但是對于既當「裁判」又做「守門員」的蘋果來說,它用一套新的隱私規則,完成了「清場」。
根據投資管理公司 Alliance Bernstein 的分析師托尼·薩克納吉(Toni Sacconaghi)估計,蘋果公司在 2021 財年的廣告收入將從 2017 財年的 3 億美元增加到 30 億美元左右。到 2023 或 2024 財年,蘋果廣告的年銷售額可能會增至 70 億至 100 億美元之間,這將推動蘋果服務業務的增長高達 3 個百分點。
自 2011 年 iPhone4 問世以來已經過去了 10 年,蘋果領先業界的硬件優勢逐漸被各大安卓手機廠商追平,甚至超越。當用戶需要一個「為什么非得是蘋果而不是安卓」的理由時,隱私保護可能就是非常重要的一環。
在喬布斯選擇封閉系統開始,就為 iOS 種下了隱私保護的基因。蘋果的隱私政策并非橫空出世,而是在逐步收緊。IDFA 的風波切中了一個我們當下這個時代必須回應的問題:技術在侵犯用戶隱私嗎?
2006 年的時候,英國數學家克萊夫·漢比(Clive Humby)首次把「數據」比喻成了「新的石油」。此后,這種說法就在經濟學家、學者和 CEO 的口中頻頻出現。
石油的珍貴在于它是不可再生的能源,但數據是可以無限產生和重復利用的,今天的互聯網上每天都在產生海量的數據。
這個比喻成立的邏輯在于,整個 20 世紀,標準石油、荷蘭皇家殼牌、英國石油公司,這些控制著石油的公司也控制著經濟的命脈。放在今天,是谷歌、Facebook 這些科技巨頭。
本世紀初,手握海量數據的科技巨頭們發展出了一門新生意——線上定向廣告。到 2019 年,全球網絡廣告的市場規模已經突破 3000 億美元(約合 1.95 萬億元人民幣)。
在廣告業一直流傳著這么一句話:「我知道在廣告上的投資有一半是無用的,但問題是我不知道是哪一半。」說這話的是百貨業之父約翰·沃納梅克 (John Wanamaker),那是 100 多年前,傳統廣告的黃金時代。
情況在互聯網時代發生了變化,科技的進步讓廣告成為了一件很高效的事情。某種程度上,沃納梅克的迷思已經不再成立,各大科技公司可以很方便地追蹤用戶行為、記錄廣告投放所獲得的下載或購買轉化次數,而廣告主以此決定向各流量平臺支付多少廣告費用。
你或許有過這樣的經歷,在網頁搜索咖啡之后,就會在電商平臺發現咖啡相關的推薦商品,手機 App 似乎在時刻監視你的網絡生活。很多人甚至懷疑 App 在竊聽用戶,這在理論上可行,但實際上并不成立。
實時監聽對話有很高的帶寬成本,巨大的流量很容易被用戶察覺,也會給公司帶來很高的存儲和人員壓力,是一筆不劃算的買賣。并且,僅就定向推薦而言,已經有很成熟的技術支持,亞馬遜在二十年前就使用的鄰近算法推薦在今天依舊在廣泛運用。
最為關鍵的是,竊聽用戶本身就是違法的,越是大公司,對數據合規就越謹慎。
而科技公司之所以能做到這種近乎監控式的廣告推送,都建立在對用戶的信息采集上。科技公司通常會搜集三類用戶數據——行為數據:比如網頁瀏覽歷史、停留時長、使用了哪些在線服務;消費記錄:比如你購買了哪些商品、退換貨記錄;個人信息:用戶的年齡、學歷、性別、所在地區等。
這些信息在后臺就是一個個事實標簽。通過算法,這些標簽就形成了所謂的用戶畫像。在大公司內部,這些數據是流通的。這也就是為什么你在谷歌搜索的商品會出現在 Youtube 的前插廣告中,早在 2006 年,谷歌就以 16.5 億美元(約合 107.25 億元人民幣)的價格收購了 Youtube。
除此之外,這些大公司也會為中小 App、網站提供相似的用戶分析服務,并通過平臺聯系廣告主投放廣告,形成廣告聯盟。
這種做法最早由亞馬遜發明,時至今日,大型的科技公司幾乎都創建了類似的廣告聯盟,Facebook 的 Audience Network,谷歌的 Adsence,阿里巴巴的友盟,騰訊的廣點通和字節跳動的穿山甲。
在這些公司對外的口徑中,所有的數據都是經過脫敏處理的,所輸出的是一個群體畫像,無法從中反推出個人信息。但這些信息是如何采集的,又是如何在公司的內部和外部流通的,對于普通用戶來說依舊是一個無法打破的黑箱。而目前也并沒有一家科技公司明確地地向用戶披露這個過程。
當科技公司頻頻爆出數據泄漏丑聞時,這種「不透明」就成為了用戶恐懼的源頭。2018 年,英國咨詢公司劍橋分析(Cambridge Analytica)就被爆出在未經 Facebook 用戶同意的情況下,利用 5000 萬用戶數據為美國前總統唐納德·特朗普(Donald Trump)的競選活動提供幫助。
事后,有人在 Twitter 上發起了 #DeleteFacebook 的運動,好萊塢導演羅素兄弟甚至以此為題材拍攝了一部電影。
「為什么我的數據,成為了你牟利的工具?」這可能是絕大多數 Facebook 用戶的心聲。尤其當數據交易已經成為一門事實上的生意時,數據的歸屬權,就成為了一個繞不開的問題。
等價交換是通行千年的交易準則,買賣雙方一手交錢,一手交貨,完成價值交換。
而對于定向廣告而言,交易的雙方發生在公司和廣告主之間,用戶并不從中獲利。很多用戶對于信息采集的反感都來自于此:我好像失去了什么東西,但并沒有得到相應的回報,而那些科技公司卻輕松賺取了上億的利潤。
關于數據的歸屬權,主流的評論大致有兩種觀點。
有一方觀點認為數據的歸屬權應該歸平臺所有,因為用戶享受了科技公司提供的免費服務。經濟學家薛兆豐曾經引用過著名的「科斯定律」。
一項有價值的資源,不管從一開始他的產權歸誰,最后這項資源都會流動到最善于利用他、能最大化利用其價值的人受理區。這是科斯定律的一個重要含義。而在制度設計中,我們應該盡量讓這種資源的流動和分配更方便、容易,從而提高各項經濟資源的使用效率。
簡單來說,薛兆豐的結論是,(資源)誰用得好,就應該歸誰。從經濟學的角度來說,這是效率最高的方式。
市場研究公司愛德曼·博嵐(Edelman Berland)曾對全球 15 個國家的 1.5 萬名用戶展開調查:「你愿意以犧牲一些隱私為代價,換取更多便利與舒適嗎?」有 51% 的受訪者表示不愿意,27% 表示愿意,剩下的受訪者沒有意見或不知道如何回答。
這揭示了一個關于隱私的悖論:公眾越來越意識到在線共享數據的風險,但是,為了某種便利,人們依舊在披露自己的數據。
因為用戶往往是最沒有話語權的,也很難對數據使用產生有效的監督。當科技公司的產品已經成為了某種意義上的基礎設施時,用戶沒有別的選擇。舉個例子,即使你不同意微信的隱私條款,也很難不使用微信,因為你所有的社交關系幾乎都在微信上。
另一方觀點認為數據理所當然應該歸用戶所有。2018 年 5 月 25 日生效的《歐盟通用保護數據條列》(General Data Protection Regulations,GDPR)號稱「史上最嚴格的隱私保護法」。在這部條列中,人類首次在法律層面上明確了用戶數據的所有權屬于用戶,而平臺只能管理及合理使用這些數據。
但是在我國,數據的歸屬權問題還沒有明確的結論。我國 2021 年實施的《民法典》明確了「個人信息」的定義和處理原則,必須征得個人同意才能處理個人信息,但沒有明確個人信息的歸屬權。而 2017 年生效的《網絡安全法》,包括正在審議的《數據安全法》和《個人信息保護法》,也都未明確個人信息的歸屬權。法律的缺位,造成了個人數據確權的模糊。
20 世紀 30 年代,由于攝影技術的進步,新聞業開始在報紙中大量使用照片。但這些照片往往未經個人同意。
1980 年,律師薩繆爾·沃倫(Samuel D. Warren)和路易斯·布蘭戴斯(Louis Brandeis)就這個問題在《哈佛法學評論》發表文章《隱私權》,這是法學界首次提出了隱私權的概念。
沃倫和布蘭戴斯發表在《哈佛法學評論》上的文章:《隱私權》|圖片來源:布蘭戴斯大學
技術的擴張侵犯了個人的邊界,從一開始,技術就與隱私相伴而生。
在眼下數據流通越來越嚴格,而數據紅利將盡的情況下,包括谷歌、英特爾、微眾銀行在內的許多公司都在開發一種叫做聯邦學習或者共享學習的技術。
由于數據合規或者商業競爭的關系,許多數據在行業甚至公司內部都無法流通,這就是公司們頭疼的「數據孤島」問題。
聯邦學習是隱私計算的一種。在手機上訓練模型后,它只將模型加密上傳,而把用戶的數據留在了本地。
微眾銀行的首席 AI 官楊強曾經把這個模型比作是「羊」,而數據就是「草料」。
過去訓練模型的做法是從各個草場運草過來喂羊。但是在運送過程中,草有丟失的風險,這就是數據泄漏。
聯邦學習的做法是,讓這頭「羊」走起來,到各個草場自己吃草。這樣,草就永遠只留在本地,也就沒有了丟失的風險。
主人不知道羊吃了哪些草,但羊依舊長大了|圖片來源:微眾銀行
其實把模型訓練比作「耕牛」可能更好理解,這些耕牛原來是吃八方來的數據草料,變得強壯后再成為企業服務客戶的「生產力」。而現在是把「耕牛」送到用戶的田地里,吃用戶數據草料,也直接更好地服務用戶。加上「數據模型的集體升級能力」,這讓你家的牛也和其他的牛可以一起成長,更好地服務你。
顯然,通過技術模式的進步,才可以根本上避免數據泄露和惡意使用。對于日趨白熱化的數據爭奪而言,有了這種根本性的改變,才可以讓公司間的數據共享成為可能。而在技術上建立一套數據保護的制度,也才能贏得用戶的信任。
說到底,沒有任何的公司,可以依靠價值觀來成為個人數據問題的救世主。這些由技術帶來的問題,最終還是需要由技術來解決它。
本文來自微信公眾號 “極客公園”(ID:geekpark),作者:湯一濤,36氪經授權發布。
