大量簡單、機械、重復的工作,完全可以通過人工智能技術進行一定程度的替代和升級。
文 | 馮立男 云拿創始人兼 CEO
整理 | 周效敬 編輯 | 燕子 排版編輯 | 小雙
2022 年 8 月 27 日,以“雙模•躍升”為主題的「2022 未來 CIO 數字峰會」在安徽黃山成功舉辦。來自全國制造業、房地產行業、零售行業、金融業等行業的企業 CIO、信息總監、IT 經理及數字化決策者齊聚一堂,共同探討了對未來企業和未來 CIO 的思考,并就數字化浪潮下,企業如何在行業變革期活下來,活得更好建言獻策。
在會上, 云拿創始人兼CEO 馮立男作了精彩的主題演講,演講題目是 “3D 機器視覺、深度學習和多傳感器融合技術在醫療、制造業、零售行業的應用”。
以計算機視覺、機器學習為核心,精準識別顧客購物行為與商品信息,打造即拿即走、無感支付的新型購物體驗。
如果我們深入每一個行業,會發現勞動者在從事大量簡單、機械、重復的工作,這些工作完全可以通過人工智能技術進行一定程度的替代和升級。這樣整個價值鏈運作會更加高效,從而可以解放勞動力,讓他們從事更加有價值、有創造性的工作,提升從業者的幸福感。云拿做的是耗材或用品領用倉庫解決方案,是對各行業價值鏈其中一個環節的優化和改善,在一定程度上也是對勞動力的替代和升級。
馮立男介紹了機器視覺、深度學習和多傳感器融合技術等人工智能的發展現狀及商業價值,分享了云拿人工智能技術的發展情況,以及在醫療、工業和零售行業的案例及應用。

上海云拿智能科技有限公司創始人兼 CEO 馮立男
今天很榮幸能在這里跟大家分享一些人工智能技術、物聯網、大數據技術在相關行業的應用。
我們公司在上海,相比剛才介紹的字節跳動、阿里巴巴,云拿目前是創新創業型企業,公司目前有 100 多名研發人員,研發領域主要分布 AI、IoT,以及互聯網、云、大數據軟件等外部服務領域。
我本人技術出身,在上海交大讀的是電子信息工程,之后去美國加州大學讀了計算機科學博士,研究方向是人工智能,包括計算機視覺、機器學習等技術。我也在人工智能頂級期刊發表過關于 AI 的學術論文,2019 年因在創立云拿階段取得了創新性突破,被財富雜志評選為“中國 40 位 40 歲以下的商界精英”。
人工智能技術可劃分為機器視覺、深度學習和多傳感器融合三個板塊。
機器視覺:以 AI 四小龍為代表的人工智能企業發展日久,但過往很多技術停留在 2D 視覺的二維層面,即圖像處理——給機器一張圖片,讓它去分析、理解里面的信息、語義,從中獲得一些認知和洞察。最新一代技術是 3D 機器視覺,從自 動駕駛時代開始,人們就在用激光雷達一類的設備去感知這個世界空間里的人、物、場。
深度學習:它是 2013 年前后興起的技術,作為對比,過往的老的機器學習技術更像是數理統計、數理分析的統計學。到了深度學習時代,神經網絡的層次更多,更加豐富多元,可以進一步模擬人類大腦的運作機制。但是到目前為止,深度學習仍然只具備數據的“輸入—輸出”能力,不具備人腦推理、分析等更深層次認知的能力。
多傳感器融合:傳感器多種多樣,它是整個人工智能系統的觸點,可以從不同維度捕捉不同的數據,把這些數據輸入到人工智能系統里面,作為數據的來源。
所以,把這三種技術結合在一起,可以為各行業創造很多新的技術、新的解決方案,形成一些顛覆式場景的應用。
這四個小視頻里的人其實都是我本人。上面這兩個是我們用 3D 視覺傳感器實時把我自己重構到計算機里面,此時此刻我就坐在一個房間里,用一個毛絨玩具逗一只小狗,這個信息會實時同步到計算機里。上面兩個視頻里面,大家看到的是不帶顏色的 3D 重構還原。
下面的小視頻顯示,我可以把顏色的信息也同步疊加在不帶顏色的信息上面,在數據的還原維度上,除了深度的結構型數據之外,還可以還原顏色、材質、紋理等表面特征,可以從不同的角度實時查看我自己。
最下面是 3D 人臉識別技術,這個技術已經很普遍,手機解鎖、家里的智能鎖用的都是 3D 人臉識別技術。相對于 2D,它捕捉到的面部關鍵點更多,把這些關鍵點拼成一個脈視網格,每個人會有自己專屬的唯一由小點組成的脈視網格,這就形成了大家唯一的生物特征。
具體使用時,我們會用到行業里面叫“TOF”的傳感器,它跟激光雷達的區別是,它更便宜,激光雷達發射的是 360 度的激光,TOF 發的是紅外線,但他們都有相同的功能——通過發出和返回的時間長短,來判斷一個空間里人或者物體距離的遠近、形態體態的大小等等。
通常在實際使用情況下,自動駕駛只用裝一個激光雷達就可以,但是在醫療、零售等行業應用里,通常情況下我們會在一個空間里部署若干個 3D 視覺傳感器,對整個空間進行實時的三維重構。
我們不需要借助人臉來判斷這個人是誰,也不需要他外觀的穿戴、衣著去分析跟他個人相關的信息。在接下來進行分析的過程中,我們會把這些表面的信息剝離掉,僅僅留下三維人的信息。
我們訓練了各種行為姿態,研究識別的算法,所以可以判斷出一個空間里這些人在做什么。比如靜止站立、運動行走、蹲下、伸胳膊;與空間里的物體進行交互,比如拿起或放回。這些行為都會被我們的機器深度學習算法所捕捉和分析。
在制造業,可能涉及各種零部件,醫療行業也涉及各種耗材,關于物體品類的識別,我們是怎么做到的?我們自己研發了一款機器學習的盒子,我們叫物體學習機。它有點像大號的微波爐,當你把一個物體放進去之后,它就會旋轉,然后從不同的角度提取該物體的幾何 3D 特征。基于這些信息和數據,我們會給每一個物體訓練一個日后可以用來做識別的機器學習模型。
所以,當我們在真實的生產環境里,無論是工廠領用的耗材,還是醫院領取的止血棉,或是在零售商店里購物時,都可以通過這樣的技術分析,判斷和識別出與人交互的是什么物體。
如果我們深入每一個行業,會發現勞動者在從事大量簡單、機械、重復的工作,這些工作完全可以通過人工智能技術進行一定程度的替代和升級。這樣整個價值鏈運作會更加高效,從而可以解放勞動力,讓他們從事更加有價值、有創造性的工作,提升從業者的幸福感。
我們公司做的是各行業價值鏈其中一個環節的優化和改善,是對勞動力在一定程度上的替代和升級。接下來分享下我們技術具體的落地應用。
我們做的是耗材或用品領用倉庫解決方案。與大型倉儲倉庫不一樣,它可能是一個房間,或一個幾十平米到上百平米的空間。過往對倉庫的管理靠手工登記,有的倉庫甚至需要把鑰匙分給若干管理員。當有人領料或領備件時,需要管理員到現場開門,耗材的管理也需要手工登記。
第一,管理員沒法做到時刻在現場,大家的領料時間受到約束,無法 7×24 小時隨時隨地領料。第二,由于數字化或智能化程度不高,造成大量持續性耗材的損失。
第一,靈活,可隨意部署。能適配不同科室、不同倉庫空間的部署要求,最大化空間利用率和耗材存放密度,使寸土寸金的醫療倉空間能獲得高效利用。
第三,使用極度友好,技術實現完全符合使用者操作直覺,新人能快速熟悉。
第四,易于運營維護,方案需保證 24 小時不間斷的穩定運行,且運行中只需要極低的管理成本和資源消耗,減少非護理工時。
我們整個系統包含了軟件、硬件和 AI 算法。這是我們后臺系統的截圖,左邊是監控系統,右邊是給運營人員管理的系統。左邊系統實時在線監控,比如倉庫里有 5 個人,我們就能實時呈現出這 5 個人此刻在做什么,他此時此刻在這個空間的什么位置,他在跟什么物體進行交互,交互是發生在幾分幾秒,這個都會實時記錄下來。右邊系統的功能是,每一筆領料、補料的過程和記錄,都會自動存在系統里,日后復盤也非常方便,且實現了無人化、自動化值守。
在醫療領域,醫院各個科室早晨要做手術,需要在高峰時段同時領用耗材,各科室護士都想快速領取耗材,所以會導致擁擠排隊等待的情況,而且醫院管理倉庫拿鑰匙開門的人都是高學歷、高水平的醫生,用這樣的人去管理倉庫,一定程度上也是人才的浪費。
而在無人值守倉庫,領料只需 10 秒左右,這一過程會自動上傳到系統里,哪個科室的誰領過幾件什么耗材都自動化記錄在案。領用倉可以用在各種場景里,大到汽車制造行業的備件,小到手機 3C 的芯片管理、元器件的管理,都可以應用。
除此之外,持續性的物料耗損也是讓企業非常頭疼的事情,過往的跑冒滴漏,大家不經意間造成物料損失還是蠻多的。 3D 視覺技術最大的好處,是可以做到人機協同。
現在有兩種類型的人機協同:一種是機器做人看;還有一種是人做機器看。兩者的區別是什么?機器能做大量重復的工作,但是機器沒法保證 100% 的準確率。比如,硬質電路板這些輸出物,上面滴的膠是否按照標準滴到規定的高度,還是需要人的肉眼去看,這些需要肉眼才能看到。
過往技術搞不定是因為 2D 視覺沒有三維高低起伏信息,所以沒有辦法對高度層面進行很好地判斷。而現在的 3D 技術可以做到人機協同。機器做完之后,把人的部分去掉,讓機器視覺自動代替人去查看缺陷是否存在。
還有一種人機協同,比如人要把小螺絲擰到板子上,但是有沒有按規定擰好,過往靠人盯人,現在也可以靠機器自動識別。因為我們有行為的判斷,我們可以判斷這個人擰了幾下螺絲,有沒有擰緊,擰沒擰緊一定程度上很主觀,但可以通過行為判斷有沒有按照要求去做。
這個是我們在上海紅橋機場 2018 年開的無人零售的超市,當時一個網紅去打卡。這個網紅在門店里做了各種各樣拿放的測試。我們這個門店有一個特色,你可以打開直接在里面吃了喝了,因為這樣的行為已經被算法提前訓練過,甚至你裝在自己兜里、放包里都沒問題。該技術可以用在倉里,也可以用在零售店里,實現無感支付。消費者購物很快,通過掃碼或掃臉進去,隨意挑選,挑選完之后直接離開。
該門店產生了大量的數據,這些數據可以幫助零售行業的價值鏈降本增效。過往的零售商很少有這個數據可以轉化,比如,消費者進店離店,去過什么地方,看過什么商品,拿起放回什么,最后生成幾筆訂單,買了什么東西等。
我們認為,消費過程的轉化漏斗,可以在每個環節進行精細化的優化。為什么能夠優化?比如,通過在門店里裝一些數字化的觸點屏幕,我們可以給不同的人看不同的內容,每個人享受的都是個性化、精準化的營銷。
我們幫上海老牌本土便利地郝德做了數字化的門店,完全無感支付,7×24 小時無人值守。有移動的,可以擺在戶外,用 5G 技術做數據的傳輸,可以按季節的變換擺在不同的位置。
最近元宇宙虛擬人導購很火,虛擬人導購也是 3D 技術,我們把虛擬人 3D 技術跟門店 3D 技術結合在一起,用虛擬人代替真實的人去做營銷、推廣、推介,效果非常好。
目前我們業務大概分布在 14 個國家,除了中國本土在做制造業的升級,醫療行業的升級,零售行業的升級以外,也把這個技術輸出到其他的國家。
除此之外我們還跨了其他的行業,比如教育行業,我們跟各種職業院校、高等教育學校一起打造 AIoT 實訓基地,把智能零售倉或者門店搬到學校里,既可以買東西或領用耗材,也可以讓學生自己研究里面的算法……
截至目前,我們已經陸續推出了無人零售、醫療倉儲、教學實訓、工業檢測、煙草巡檢、養老監護等 AI 數智化解決方案,為教育、煙草、文體娛、交通、養老等行業的智慧升級、降本增效提供了新的視角。未來,我們還將秉持著“科技重塑生活”的理念,讓數字技術滲透更多行業、更多場景,成為提升從業者與受眾幸福感的關鍵力量。