大模型分化趨勢:更垂直、更專業
從今年年初以來,大模型的市場百花齊放,對于大模型未來的發展方向和分化趨勢,商界和學界眾說紛紜。6月26日,在世界互聯網大會數字文明尼山對話主論壇上,百度公司創始人李彥宏、阿里云智能集團董事長兼CEO張勇再次發表對大模型發展方向的表態。
而在前幾日,騰訊大模型也姍姍來遲,在發布會上,騰訊集團云與智慧產業事業群CEO湯道生也表達了產業觀點。
對于大模型的發展方向,大boss們目前達成了一些基本的產業共識:
與實體經濟相結合是大模型未來的發展路徑,云廠商正在嘗試將大模型落地到垂直領域,打造出金融、醫療、電力等領域的專業大模型。
大模型都絕不是曇花一現的風口,而是影響人類發展的重大技術變革,是拉動全球經濟增長的引擎,是絕對不能錯過的重大戰略機遇。
大模型是當下全球科技創新的焦點、全球人工智能競賽的主戰場,同時也帶來了諸多治理挑戰。
圖:互聯網大佬尼山聚首
以下是互聯網大佬近期的部分演講實錄:
李彥宏:大模型將滲透進更多的領域,并以“周”迭代
大模型如何重塑數字世界?我想從技術和應用兩個層面來談談。
技術層面,人工智能時代,IT技術棧發生了根本性改變,從原來的芯片、操作系統和應用三層架構,變成了芯片、框架、模型、應用四層架構:
底層是芯片層,主流芯片從CPU變成了GPU。芯片之上是框架層,主流框架包括百度飛槳,Meta的PyTorch,谷歌的TensorFlow。框架上面是模型層,ChatGPT和文心大模型就在模型層。大模型成為了人工智能時代的操作系統,所有應用都將基于大模型開發。模型之上是應用層,包括各種各樣的AI原生應用。
可以預見,大模型將滲透到越來越多的領域,以大模型為關鍵驅動的數字經濟,與實體經濟深度融合,將做強做優做大實體經濟,創造可觀的增量價值,帶來經濟社會發展和產業的深刻變革。
圖:百度公司創始人李彥宏
周鴻祎:公有大模型缺乏行業深度
“人工智能的發展要‘以人為本’,大模型不能引發大規模裁員,而是要幫助企業員工提升能力和效率,成為易用的工具。”360集團創始人周鴻祎首次提到現有公有大模型存在四方面不足之處:
第一,公有大模型雖然是通才,但它缺乏行業深度。“我們之前認為GPT什么都會,但如果你是一個行業專家,你會發現GPT在安全、金融這些垂直領域,知識深度是不夠的。很多公司自己訓練大模型都發現了這個特點,想讓它能力很均衡,就會犧牲深度。”周鴻祎表示。
他認為,未來垂直大模型是重要的發展方向,通用模型和各領域專有的知識數據結合,讓大模型從“萬事通”變成政府通、行業通和企業通,這才是真正的價值,“最新資料表明,GPT4也是由8個垂直模型組成的,從側面印證了這個觀點。”
第二,公有大模型容易造成企業內部數據泄露。一方面,公有大模型不是本地部署,它與外部進行信息交流時必然存在數據泄露的風險;另一方面,公有大模型也無法實現組織內部權限的分級管理。因此,政府、企業使用公有大模型必然存在安全風險。
第三,對企業來講,公有大模型無法保障內容真正可信。周鴻祎表示,大模型存在“幻覺”,也就是常說的“一本正經地胡說八道”,經常出現張冠李戴的問題,需要通過企業的內部搜索、內部知識庫進行矯正。
第四,公有大模型無法實現成本可控。他舉例稱,許多企業其實只需要大模型寫代碼的能力,百億級垂直大模型就能滿足需求,如果使用千億級大模型就是成本的浪費。在控制成本方面,垂直大模型將會有很大優勢。在用公開數據訓練的“通識”大模型基礎上,訓練專有大模型,就能做到“事半功倍”,為企業降本增效。
圖: 360集團創始人周鴻祎
張勇:未來將打造更多企業專屬模型
中國人工智能發展具備基礎扎實、場景豐富、數實融合這三方面的優勢,隨著社會各界的高度重視和創新生態的發展壯大,這些優勢正在不斷鞏固和加強。從數字化走向智能化,計算成為基礎設施不可或缺的組成部分。2009年阿里云寫下中國自研云計算操作系統的第一行代碼,開啟中國的云計算時代,經過14年的努力,中國已經形成全球第二的算力規模,算力產業年增長率近30%。阿里云的目標,是提供高質量、高性能的算力,“讓算力更普惠,讓AI更普及”。
今年4月,阿里云“通義千問”大模型開放對外測試,目前已有超過20萬企業用戶申請接入,幾乎覆蓋所有新興和傳統行業。與此同時,阿里云啟動了“千問伙伴計劃”,與行業伙伴攜手共建創新生態,已經覆蓋油氣、電力、交通、金融、酒旅、企服、通信等行業,未來將打造更多企業專屬模型,推動各行各業更快更好地分享智能化紅利。
圖:阿里云智能集團董事長兼CEO張勇
湯道生:大模型行業針對性與精準度不夠,數據噪音過大
大家對通用大模型期待很高,但它不一定是滿足行業場景需求的最優解。
目前,通用大模型一般都是基于廣泛的公開文獻與網絡信息來訓練的,網上的信息可能有錯誤、有謠言、有偏見,許多專業知識與行業數據積累不足,導致模型的行業針對性與精準度不夠,數據“噪音”過大。但是,在很多產業場景中,用戶對企業提供的專業服務要求高,容錯性低。企業一旦提供了錯誤信息,可能引起巨大的法律責任或公關危機。因此,企業使用的大模型必須可控、可追溯、可修正,而且必須經過反復與充分測試才能上線。
我們認為,客戶更需要有行業針對性的行業大模型,再加上企業自己的數據做訓練或精調,才能打造出實用性高的智能服務。企業所需要的是在實際場景中真正解決了某個問題,而不是在100個場景中解決了70%-80%的問題。
另外,訓練數據越多,模型越大,訓練與推理的成本也越高。實際上,大部分的企業場景,可能也不需要萬能的通用AI來滿足需要。因此,如何在合理成本下,選擇合適的模型,是企業客戶所需要思考與決策的。
接下來談談數據。數據是大模型的原材料,針對具體場景,相關數據的覆蓋與質量都至關重要,標注數據的管理也是模型迭代中的重要工作。
模型最終要在真實場景落地,要達到理想的服務效果,往往需要把企業自身的數據也用起來。在模型研發過程中,既要關注敏感數據的保護與安全合規,也需要管理好大量的數據與標簽,不斷測試與迭代模型。
接著講講應用。騰訊自身的企業級應用,已經率先應用了行業大模型,針對不同應用場景提供更智能的服務,為用戶提高工作效率。
圖:騰訊集團云與智慧產業事業群CEO湯道生
最后講講算力。算力是模型持續運轉的基礎,高性能、高彈性和高穩定的算力需要借助專業的云服務。
在大模型的訓練和使用過程中,需要大量異構算力的支持,對網絡速度與穩定性要求也很高,加上GPU服務器比一般服務器穩定性更低一些,服務器的運維、問題的排查更頻繁,整體運維的難度與工作量會高很多。
回顧過去,人工智能的發展是結合開放數據的積累、算法的創新與算力的突破共同推動的;也是全球科技企業、高校與研究機構共同努力,通過代碼的開源與研究成果的分享,開放共建的成果。
本文來自「華爾街科技眼」,作者:侯煜,編輯:羅卿,36氪經授權發布。
