Beyond演唱會超清修復的背后:字節的云端“野心”
作者|桑明強
“當他們再次出現時,就像失散的舊友重逢,所有的歌我都如此喜愛。”我們或多或少地都曾聽過卡朋特兄妹的《Yesterday Once More》(昨日重現),他們在上世紀八、九十年代風靡一時,當時的中國,和卡朋特樂隊同樣擁有享有盛譽的是黃家駒和他的Beyond樂隊。
1991年,Beyond樂隊首次站上香港紅磡體育館的舞臺中央,初次登臺便鑄就經典。31年后的今天,這段記憶被翻新、重現,一場沒怎么預熱的演唱會,在抖音直播間開場10分鐘后觀看人次就突破1600萬,待直播結束時,觀看數更是達到了驚人的1.4億人次,事后有歌迷稱:“清晰度高,讓觀眾更加熱愛”、“以前不知道原來家駒這么愛笑”。
這讓我想到——創意機器和社會進步。30多年的光陰,可以磨平一個人的棱角,也足以模糊一個人的記憶,當我們回看起兒時喜歡的影片時,卻總是覺得哪里不對味,一方面是因為我們的心境變成熟了;另一方面,緣于當時的制作和現在比起來確實略顯粗糙。
但創意機器的進步,讓社會的記憶又回來了,尤其是火山引擎對Beyond演唱會進行超清修復的這件事:
基于自研的自適應人像增強算法和深度學習模型,修復團隊對演唱會中的人物面部做了高清重建,所以在這次的超清修復版中我們終于可以看清,黃貫中solo完后,一邊笑著一邊用右手輕輕撓著黃家駒的后勃頸,也讓我們能在31年后的今天,看到黃家駒眼里的光。
不同于某種社會運動,專注于實現特定結果,現代創意機器往往能更好地反映當今人們的自我組織方式,與公共對話更緊密地交織在一起。“整個修復的周期在1周左右。”在火山引擎多媒體實驗室研究員趙世杰看來,對Beyond演唱會進行超清修復是一個相當棘手的任務,要兼具技術應用和大眾審美的匹配。
據火山引擎方面介紹,負責此次修復的都是90后,這些隊員本身就很喜歡Beyond,對每首歌都記憶猶新,所以在接到這個任務時,他們都很興奮,希望能通過算法最大程度地為人們獻上一場更清晰、生動的視聽盛宴。
畫質修復,是擺在修復團隊面前的第一個要攻克的點。受限于當時的設備和技術條件,早期演唱會片源需要解決畫面模糊不清、色彩/亮度/舞臺氛圍感以及人像面部修復三個環節的難題,這無疑讓修復難度陡增,火山引擎的解題思路是把片源中的偽像一層層剝離,通過清晰度增強和瑕疵修復算法、自適應分區域色彩亮度增強算法、自適應人像增強算法等技術適時介入,一點點還原出演唱會里的熱鬧氣氛。
以其中的清晰度增強和瑕疵修復為例,在AI修復過程中,早期片源在制作、壓縮、傳輸過程中都有可能引入清晰度上的退化和瑕疵問題,如何處理成因復雜退化的同時盡可能多地恢復多的細節,是算法處理的最難的地方。
為此,火山引擎多媒體實驗室特別設計了多幀輸入的神經網絡去交錯算法,相比于傳統固定去交錯算法,新的算法細節恢復得更好,運動場景的拉絲情況也能得到更好的解決。另外,基于在大量數據上訓練的深度學習算法,火山引擎將視頻的分辨率檔位的從低清處理至超高清,同時在缺少紋理的區域生成更豐富的細節。
和畫質修復相比,音頻修復并不會簡單多少,需要處理噪聲干擾、帶寬不足、響度問題,通過演示,火山引擎音頻技術團隊研究員舒曉峰給我播放了一段修復前后對比的音效。修復前的歌聲雖然動聽,但還是會聽到滋啦作響的背景音,而修復完成后的音頻,背景聲變干凈了。
“和畫質修復一樣,音頻修復也運用了多種算法技術,包括音頻降噪算法、音頻超分算法、響度算法。”舒曉峰以一部分Beyond Live 1991生命接觸演唱會為例,由于當時的拾音設備并不好,導致錄音時避免不了攜帶環境音,但傳統降噪方案主要針對人聲,并不適合演唱會場景,所以這個AI降噪算法得既能兼容音樂和人聲場景,還可以抑制其它噪聲。
火山引擎對Beyond演唱會超清修復只是表象,本質可以視為新派玩家的小試牛刀。
作為字節跳動旗下的云服務,雖然火山引擎2021年才正式對外發布品牌,但其在視頻技術上的實力已經不容小覷。除了本次超清修復的能力,火山引擎還有還有完整的畫質全鏈路端到端解決方案,以及面向體驗打造的視頻云。
一個完整的視頻消費鏈路包括上傳、轉碼、傳輸、消費等,如果要想對畫質和用戶體驗進行優化,整個消費鏈路都得考慮,并整體優化。火山引擎就擁有一套全鏈路端到端的畫質解決方案,在其中的多個環節中對視頻內容進行畫質、碼率、體驗的優化。據介紹,該解決方案主要包括服務端分析系統、服務端視頻處理系統,客戶端解碼后處理系統。
畫質全鏈路端到端解決方案之外,火山引擎還提供完整的視頻云能力,并為用戶的四大體驗負責,包括互動體驗、播放體驗、畫質體驗、性能體驗。
為用戶提供四大體驗的背后,火山引擎視頻云有很多的技術積累。這里簡單說下,比如說在播放側,火山引擎的首幀時間很短,能將首幀時間壓縮到100ms以下,讓用戶感覺不到首幀存在;其次,火山引擎的播放器穩定性好,崩潰率小于1/100000,每天刷100個短視頻,3年才能遇到一次播放器崩潰。畫質體驗上,火山引擎在MSU2020獲得17項冠軍的視頻編碼算法,能讓視頻體積小,但畫質卻很高清。性能體驗側,火山引擎自研的圖像編解碼算法效果更優,壓縮體積相比行業優化10%-20%,并且這個技術還在今年獲得第五屆國際深度學習圖像壓縮挑戰賽視頻賽道冠軍。互動體驗,就不多說了,抖音的美顏、特效、濾鏡應用,大部分人應該都體驗過,這個能力也被集成到火山引擎視頻云上來了。
對于普通人來說,視頻云是一個新概念,就像人們剛聽到火山引擎時的感覺一樣。但人們所不知道的是,在視頻云方向,火山引擎除了服務抖音、西瓜、飛書等產品,還服務了耳熟能詳的凱叔講故事、三七互娛、得到等外部公司,幫助他們給用戶提供體驗更好的視頻能力。
從零售革命到AWS、Kindle、Prime和一家電影制片廠,這么些年來,我們常常對貝索斯和他的亞馬遜的創意機器感到詫異,卻忽略了商業邏輯上最簡單的道理——產品其實是為需求而生,和其它公司相比,亞馬遜更注重為客戶創造價值,甚至他們會花18個月的時間來深入思考他們究竟要服務什么樣的客戶,以及什么樣的功能是被真正需要的。
在視頻成為一種主流的表達方式和傳播載體的今天,視頻的用戶體驗無疑是用戶真正需要且關心的點,火山引擎面向體驗的視頻云無疑是摸準了當下視頻技術最本質的脈搏。
視頻云只是火山引擎云服務版圖的其中一塊。火山引擎這個被外界稱為多云時代的攪局者,在一開始對云服務的設計初衷就是做數字化的中臺和增長引擎。就像劉潤所講到的,在沒有工具的時候,數字化只是一個哲學問題,但如果想要把哲學變成實學,那就需要工具,而數字化中臺就是能幫助企業夠到天花板的臺階。
作為字節跳動“能力溢出”后的技術層面的全新探索,從火山引擎官網正式上線那一刻起,它的衍變就分為兩個階段,第一階段推出的產品和服務以應用層和中間層為主,屬于SaaS和PaaS范疇,主要聚焦企業的智能增長,發揮推薦算法和相關技術的局部優勢;第二階段從去年開始,通過全面布局PaaS和SaaS領域,并逐漸向IaaS領域進軍。
“探索”速度非常快。火山引擎2021年6月舉辦“全擎而進”品牌發布會,發布“火種計劃”;同年11月,火山引擎成為BU,在字節內部變得更加獨立和重要;12月,火山引擎發布全系五大類 78 項云服務。
火山引擎瞄準的正是企業“從一云到多云”的趨勢,從而切入市場,這也是火山引擎另辟蹊徑的地方,避開國內云市場“三足鼎立”的激烈競爭區間,探索“先SaaS+PaaS后IaaS”新路徑,沿著市場需求脈搏跳動的地方,先卡點再做深,短期觀察產品架構初步完善,挑選標桿客戶并展開實踐。
具體到打法上,火山引擎總裁譚待曾公開強調,“追求極致性價比”是火山引擎的首要服務理念,但極致性價比絕不是商業策略,更不是打價格戰,而是通過技術驅動和資源共享,追求每個GB存儲、每一次計算的最優配置,某種程度上,這和AWS“客戶至尚”的理念如出一轍。
火山引擎和其它云的另一個不同在于,它重新詮釋了什么是云原生,很多人將Cloud Hosting等同于Cloud Native,淺顯地認為只要把應用搬到云上就是云原生,但就像面向體驗的視頻云理念所描述的,云原生的主語不應該是平臺或者工具,而是業務和應用,看它是否充分地把底層技術的能力向上傳遞至業務和應用側。
回到我們一開始談到的創意機器和社會進步問題,其實你會發現一些技術之所以能實現規模落地,關鍵在于它并不是按部就班規劃好的,而是向“實”而生。這里的“實”有兩層意思,第一,它得是真需求而不是偽命題;第二,它得有實實在在解決問題的能力。
最近,火山引擎在其官方微信公眾號上多次預告主題為“數字新引擎,云上新增長”原動力發布會。公開信息顯示,火山引擎預計將在7月20日全面發布云上增長解決方案。今年的外部挑戰非常大,相信大家應該有所體會,在這樣的時間點全面發布云上增長解決方案,火山引擎或許是通過開放字節最佳技術實踐和行業共創的方案,助力企業找到動力引擎,在慢下來的世界里依然持續增長。
本文來自微信公眾號“新眸”(ID:xinmouls),作者:桑明強,36氪經授權發布。
原標題《請回答2022:創意機器與社會進步》
