素質(zhì)教育進化,音視頻探路新風(fēng)口
近日,中共中央辦公廳、國務(wù)院辦公廳印發(fā)了《關(guān)于進一步減輕義務(wù)教育階段學(xué)生作業(yè)負擔(dān)和校外培訓(xùn)負擔(dān)的意見》,學(xué)科類培訓(xùn)機構(gòu)一律不得上市融資成定局。教育培訓(xùn)機構(gòu)轉(zhuǎn)型迫在眉睫,素質(zhì)教育賽道是其中的一個趨勢。隨著美育被納入中高考,相關(guān)課程學(xué)習(xí)變成剛需,教育政策向「音體美」方向靠攏,以思維訓(xùn)練、能力培養(yǎng)以及藝術(shù)素養(yǎng)為代表的素質(zhì)教育呈現(xiàn)「線上化」趨勢。市場表現(xiàn)最為突出的是,各大在線教育公司都在開辟「音體美」的在線教育場景。
除了政策驅(qū)動,素質(zhì)教育在線化的快速發(fā)展還依托于實時音視頻技術(shù)的不斷加速。拍樂云創(chuàng)始人兼 CEO 趙加雨認為,用戶體驗是在線教育產(chǎn)品的核心競爭力之一,更具互動性和沉浸感的在線課堂體驗將會有效提升學(xué)員的學(xué)習(xí)效率,也是影響續(xù)費率和轉(zhuǎn)介紹率的重要因素。
作為一家成立于 2019 年 8 月的音視頻公司,音視頻領(lǐng)域的「黑馬」,拍樂云從最難的素質(zhì)教育切入,服務(wù)教育領(lǐng)域的互動全場景。
「我們的愿景是構(gòu)建云上的每一次美好互動。」
說出這句話的是一家成立兩年的音視頻公司「拍樂云」的創(chuàng)始人趙加雨。這家公司的核心團隊成員均來自音視頻的黃埔軍校思科 WebEx。
WebEx 是云視頻會議的開創(chuàng)者,在視頻會議領(lǐng)域有著不可撼動的地位。2007 年,這家公司被思科納入麾下。當(dāng)時,WebEx 在視頻會議領(lǐng)域的市場占有率達到了 70% 以上,近乎占壟斷地位。
從創(chuàng)業(yè)核心團隊背景來看,拍樂云是國內(nèi)第一家視頻會議背景的實時通信云服務(wù)商,匯聚了一大批專注于音頻、視頻、網(wǎng)絡(luò)、AI 等領(lǐng)域的資深技術(shù)專家。
2003 年,畢業(yè)于東南大學(xué)計算機系的趙加雨加入 WebEx,歷經(jīng) 14年一路晉升為 WebEx 中國高級經(jīng)理、WebEx 美國架構(gòu)師。2017 年,他離開美國,進入網(wǎng)易云信擔(dān)任 CTO。
2019 年 8 月,趙加雨看見了音視頻為行業(yè)及社會帶來巨大價值的潛力,便毅然開始了創(chuàng)業(yè)之路。公司成立后即獲得了紅杉資本領(lǐng)投的天使輪融資。
碰巧的是,早在三年前,紅衫資本就曾投資與拍樂云一樣團隊背景的公司——Zoom。Zoom 在 2017 年初獲得紅杉資本 1 億美元的 D 輪融資。當(dāng)時紅杉資本發(fā)言人表示,多年來視頻會議行業(yè)都沒有一款真正受用戶歡迎的產(chǎn)品,直到 Zoom 出現(xiàn)。
「我們跟 Zoom 基因一樣。」趙加雨向多鯨表示,拍樂云的核心團隊都來自于音視頻的黃埔軍校「WebEx」,跟遠程辦公平臺 Zoom 的背景一樣。Zoom 的創(chuàng)始人袁征是趙加雨的多年好友、昔日領(lǐng)導(dǎo)。
直到 2020 年疫情來襲,當(dāng)時創(chuàng)業(yè)不到半年的拍樂云迎來了新機遇。「云上生活」成為人們熟悉的體驗。音視頻技術(shù)在辦公、教育、醫(yī)療、娛樂等垂直場景中大放異彩。「隨著疫情加速線上化、5G 及互聯(lián)網(wǎng)加速等多種因素疊加,未來留給音視頻公司的機會越來越多。」趙加雨說。
趙加雨發(fā)現(xiàn),視頻會議中積累的音視頻技術(shù)可以很好地應(yīng)用到教育場景中。因此,拍樂云通過 PaaS 的方式輸出實時通信能力,將視頻會議技術(shù)封裝成簡單易集成的 SDK,客戶通過集成 Pano SDK 即可在自身應(yīng)用里實現(xiàn)音視頻通話、互動白板、互動直播、云端錄制等各種能力。企業(yè)和開發(fā)者可在全球范圍內(nèi)快速構(gòu)建 1 v 1、互動小班、超級小班、雙師大班等教學(xué)班型,實現(xiàn) K12 教育、美術(shù)教學(xué)、音樂教學(xué)、編程教育、少兒英語、職業(yè)教育等多種場景互動。
「音視頻行業(yè)現(xiàn)在談市場市占率還尚早」,此前多鯨采訪的投資人反饋到。這就意味著,很多音視頻公司已初成規(guī)模,但也無法囊括所有客戶的場景需求。同時,不同教育場景對實時音視頻技術(shù)也提出了更高的要求,如 1 V 1 要求極低的延時、小班課要求更強的互動性、大班課要求超大并發(fā)、在線鋼琴陪練要求更好的音質(zhì)和更豐富的畫面、在線美術(shù)教學(xué)要求保證圖像的色彩和不變形、在線編程教學(xué)要求有穩(wěn)定的遠程控制和視頻標(biāo)注能力。
「無論是產(chǎn)品,還是功能,我們都想把『能用』變成『好用』。」趙加雨說。他表示,現(xiàn)在很多音視頻廠商的音視頻能力仍有許多需要提升的地方。
趙加雨是在內(nèi)業(yè)第一個提出實時音視頻「兩高一低」概念的人,即:高質(zhì)量、高流暢與低時延。實時音視頻非常講究「兩高一低」,即高質(zhì)量、高流暢與低時延。「為了實現(xiàn)實時音視頻的兩高一低,需要在系統(tǒng)架構(gòu)、音視頻編解碼、全球組網(wǎng)、服務(wù)端分發(fā)、弱網(wǎng)對抗等各個環(huán)節(jié)做到最優(yōu)。」他表示,這也是拍樂云的獨特之處。
除了針對不同場景的取舍之外,拍樂云還做了更為細致的調(diào)整,比如根據(jù)不同場景選擇不同的抗弱網(wǎng)算法。即使在弱網(wǎng)狀態(tài)下,也可以保障高質(zhì)量、高流暢和低時延。
拍樂云希望在兼顧「兩高一低」的情況下,將「能用」做到「好用」。所謂「能用」只是功能的簡單實現(xiàn),要做到「好用」就必須在功能實現(xiàn)的基礎(chǔ)上,再為客戶增加一層考慮,比如在在線課堂上實現(xiàn)更好的互動感和沉浸感。
以互動白板為例,作為在線教育場景下剛需最強的功能,最容易出現(xiàn)的問題是筆跡同步不及時、動效課件失真、音視頻同步錄制不及時等問題。針對這些難點,拍樂云做了很多方面的技術(shù)實踐。
一是針對低時延,筆跡同步不及時問題,拍樂云采用私有數(shù)據(jù)格式,進行極致壓縮,確保數(shù)據(jù)量盡量小。在白板繪制和渲染時采用原生技術(shù),確保內(nèi)存占用更低、CPU 消耗更小。在網(wǎng)絡(luò)傳輸上利用全球加速網(wǎng)絡(luò) Pano Backbone 確保跨國、跨運營商的實時傳輸。
二是針對動效課件失真問題,拍樂云自研轉(zhuǎn)碼引擎和白板引擎,可以做到動態(tài)課件的超高保真,也可以支持各種動效和音視頻文件播放。
三是針對白板和音視頻同步錄制和同步推流問題,拍樂云提供了白板轉(zhuǎn)視頻流的能力,讓白板和視頻能夠同步錄制在一個視頻文件中,也可以同步推流到 CDN 直播中。
從市場供給角度看,很多教育機構(gòu)會選擇無需研發(fā)的SaaS產(chǎn)品,產(chǎn)品基本能用就行,部分機構(gòu)會基于音視頻PaaS自研在線課堂,也多是出于品牌和數(shù)據(jù)等考慮,對于互動性和沉浸感要求都不高。趙加雨則認為,用戶會倒逼音視頻機構(gòu)提供更加優(yōu)異的在線課堂服務(wù)。「我們能做的是,引導(dǎo)客戶使用,當(dāng)他知道『可以變得那么好用的時候』,就會更加接受這種新的產(chǎn)品。」
讓產(chǎn)品更加好用的本質(zhì)是什么?趙加雨向多鯨提到「know-How」。做音視頻產(chǎn)品,并非靠單個模型和算法就能搞定,也沒有現(xiàn)成的方案。為此,他的考慮是,做技術(shù)要考慮得面面俱到,各節(jié)點之間要相互平衡,深刻理解技術(shù)。
起初拍樂云并未直接將業(yè)務(wù)定位在素質(zhì)教育,直到在洞察不同細分教育賽道客戶需求時,才確定方向。「素質(zhì)教育客戶的需求并未被現(xiàn)有廠商充分滿足。」趙加雨談到。在拍樂云的所有客戶中,素質(zhì)教育細分領(lǐng)域的客戶占比最多。
對比看,在拍樂云所服務(wù)的客戶當(dāng)中,K12 教育的音視頻需求大部分圍繞授課需求展開,1 對 1 或者 1 對多的多人通話便可滿足需求。而素質(zhì)教育面向的教學(xué)場景相對瑣碎且復(fù)雜,功能相對多元。因此,拍樂云從最難的素質(zhì)教育切入,服務(wù)教育領(lǐng)域的互動全場景。
在線素質(zhì)教育涉及鋼琴陪練、音樂教學(xué)、在線美術(shù)課、在線書法及在線編程等,聲音的清晰傳達、畫面的精準(zhǔn)傳遞及情緒的即時表達是重點,這需要老師在線上教學(xué)的過程中即時溝通與實時反饋,因此對實時音視頻技術(shù)要求較高。
例如,在鋼琴教學(xué)場景方面,對聲音進行處理,保證全頻段聲音從采集、編碼到前處理都非常清晰,讓線上音樂的傳輸不失真。
一方面,既需要滿足在線教育場景的低延時、高流暢性、高互動性以及高并發(fā)性,另一方面,又要解決特定線上素質(zhì)教育場景的痛點,因此音視頻公司需要做出更大的投入。
在 K12 學(xué)科培訓(xùn)強監(jiān)管的形勢下,國家正鼓勵青少年從「內(nèi)卷」的校外學(xué)科培訓(xùn),轉(zhuǎn)向全面發(fā)展的興趣教育。而音體美正好是政策層面積極鼓勵的方向。
針對市場需求與政策風(fēng)向,拍樂云聚焦了素質(zhì)教育的美術(shù)細分,推出了美術(shù)教學(xué)音視頻解決方案。在美術(shù)線上課堂上,拍樂云可提供高清視頻、多攝像頭、角度矯正、視頻標(biāo)注等功能。例如通過高清編碼可以保證圖像色彩的高度還原;通過多攝像頭功能可以實現(xiàn)老師、學(xué)生雙向同步看到對方的視頻和畫板;通過角度矯正可以將畫板調(diào)整為正對拍攝的效果;通過視頻標(biāo)注能力可以隨時指出繪畫時的重點和要點。
這當(dāng)中最大的難點在于如何在實時視頻過程保證畫紙圖像不變形。拍樂云通過幾何失真參數(shù)估計、映射關(guān)系計算等低復(fù)雜度高效率的毫秒級視頻處理算法對原始視頻進行矯正處理,解決美術(shù)視頻教學(xué)中產(chǎn)生的畫紙變形問題。
眼下,整個素質(zhì)教育賽道將迎來熱潮,隨著更多的選手入局,行業(yè)的競爭勢必會加劇。趙加雨認為,毫無疑問的是,無論是學(xué)科教育還是素質(zhì)教育,借助資本的力量蒙眼狂奔已無成功可能。回歸教育的本質(zhì),踏踏實實做好產(chǎn)品和口碑,才是長存之道。
至此,關(guān)鍵詞「好用」只是拍樂云在音視頻領(lǐng)域樹立競爭力的一半,當(dāng)與「簡單易用」合為一體便呈現(xiàn)出拍樂云核心競爭力的全貌。
對產(chǎn)品、服務(wù)的重視都非常關(guān)鍵。拍樂云從核心技術(shù)點突圍,降低教育企業(yè)使用音視頻技術(shù)的門檻,讓企業(yè)更專注于構(gòu)建自己獨特的優(yōu)勢。
事實上,不斷幫助客戶實現(xiàn)音視頻功能的「優(yōu)化」也已經(jīng)貫徹到拍樂云的產(chǎn)品體系中。
趙加雨一直堅持的產(chǎn)品理念是,要做「高內(nèi)聚、低耦合」的產(chǎn)品技術(shù),這指的是把很多復(fù)雜的技術(shù)要素藏在系統(tǒng)內(nèi)部,而開放給到用戶的交互接口是極簡的。
他提到一個共享的例子,很多廠商沒有提供移動端屏幕共享的能力,很多教育客戶在接入的時候,并非理解有關(guān)共享和視頻的很多基本概念,對于他們而言,學(xué)習(xí)成本和接入成本比較高。于是拍樂云就做了一個移動端屏幕共享的功能,將所有的功能封裝到 SDK 內(nèi)部,讓移動端的共享更加易用。
在拍樂云,所有的創(chuàng)新、產(chǎn)品迭代以及研發(fā)都是圍繞客戶需求開展。趙加雨表示,「想要做出被眾多客戶使用的世界級音視頻產(chǎn)品是很難的,但拍樂云愿意與客戶共同打磨產(chǎn)品,共創(chuàng)場景應(yīng)用,立志成為世界級的音視頻產(chǎn)品。」
未來音視頻行業(yè)的競爭將聚焦在技術(shù)本身。如何將產(chǎn)品從「能用」變成「好用」,持續(xù)考驗音視頻公司在技術(shù)方向的精進能力。尤其是 AI、VR 和 AR 等技術(shù)的成熟,將愈發(fā)考驗各家的技術(shù)創(chuàng)新能力、新技術(shù)應(yīng)用落地能力。
正如拍樂云創(chuàng)始人趙加雨所說:「2B 企業(yè)服務(wù)一定是由產(chǎn)品和服務(wù)主導(dǎo)的,我們將始終堅持與客戶一起,探索行業(yè)對于實時音視頻的更多場景和更高要求,打造服務(wù)的品質(zhì),保持對技術(shù)的匠心,對教育的敬畏之心,穩(wěn)步求進。」
本文來自微信公眾號 “多鯨”(ID:DJEDUINNO),36氪經(jīng)授權(quán)發(fā)布。
