国产精一区二区_午夜视频99_免费白白视频_中文字幕一区免费

開源,會是對手打敗 ChatGPT 的絕招嗎?

科技狐
+ 關注
2023-07-23 10:07
1.5w次閱讀
當我們在談論“開源”時,在談論些什么?

周二,Meta 發布了最新一代的開源大語言模型 Llama 2。

開源,會是對手打敗 ChatGPT 的絕招嗎?

與 Meta 在 2 月發布的第一代大模型 Llama 1 相比,Llama 2 在許多方面得到提升,比如訓練數據比 Llama 1 多了 40%、訓練所用的 token 翻了一倍,增加至 2 萬億、上下文長度限制也翻了一倍……總而言之,就是 Llama 變得更強了。

不過,使整個行業震驚的不是 Llama 2 的強大——當然,它足夠強——而是 Meta 宣布 Llama 2 對研究和商用都是免費。

開源,會是對手打敗 ChatGPT 的絕招嗎?

這也意味著眾多研究機構和商業公司可免費使用開源的 Llama 2,無需自己耗費巨大的成本來開發一個大模型,降低了企業的研發成本,有利于 Meta 爭取更多的合作伙伴。

目前與 Llama 2 合作的就包括了微軟、亞馬遜、IBM、高通、Spotify 等知名企業。

開源,會是對手打敗 ChatGPT 的絕招嗎?

關于 Llama 2 的介紹網上已經足夠多了,這里不再贅述,而本文,老狐想來介紹一下“開源”,這個在當今互聯網十分常見,但大家對它卻比較陌生的概念。

所謂“開源”,即開放源代碼,也稱源代碼公開,是軟件的一種散布形式,而開源軟件即公開源代碼的軟件。

開源,會是對手打敗 ChatGPT 的絕招嗎?

一般的軟件他人僅可取得已經編譯過的二進制可執行檔,只有軟件的作者或著作權所有者等擁有程序的源代碼,這類軟件稱為閉源軟件。

開源軟件不僅僅是源代碼公開,更重要的是其他人可以在開源協議的規定內對軟件進行學習,修改以及出于任何目的的再分發。

開放源代碼的定義最先由 Bruce Perens 提出,經由 Eric S.Raymond 發展,主要有以下十條:

開源,會是對手打敗 ChatGPT 的絕招嗎?

雖然現在人們用到的軟件,閉源居多,但最早期的軟件開發,軟件都是開源的,因為早期硬件發達,而軟件只是附屬品。

例如在 1970 年之前,IBM 出售的大規模計算機,采用的部分軟件,軟件公司會提供源代碼,讓懂程序的維護人員知道軟件是如何運作的,方便修正或添加想要的功能。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*IBM S/360 計算機,于 1964 年推出 

后來隨著軟件行業的發展,軟件公司意識到其中的商業利益,開始進入封閉式的開發模式,不再提供軟件的源代碼,人們稱其為“教堂式”。

所謂教堂式,就是將軟件開發比作建造一座教堂,應該由高手或專家來設計并建造,等到版本成熟時才開放提供給用戶,并利用知識產權制度將開放的軟件私有財產化,將其閉源,不被他人模仿,以滿足企業的商業利益。

我們熟悉的 Windows 系統便是閉源軟件開發模式的代表。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*Windows3.0 

但閉源軟件開發模式帶來了一系列問題,比如軟件費用高、安全漏洞多、新舊版支持問題、不符合個人需求等等,一部分軟件開發者對其不滿意,于是興起了“開放源代碼運動”。

開放源代碼運動的支持者認為不阻礙合作、可共享的研究風氣才是軟件開發應有的路徑,反對把軟件建立在知識產權與許可證的基礎之上,認為這樣限制了他人利用源代碼修改、調整軟件以適應自身的需要,阻礙了軟件的進一步完善和發展,導致軟件安全性下降、創新減少、不兼容等問題。

隨著開放源代碼運動的進行,產生了許多實際性成果。

Richard M.Stallman 于 1985 年創立了自由軟件基金會,并開啟了 GUN 項目,后者是一個自由的操作系統,其內容軟件完全以 GPL 的方式發布。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*Richard M.Stallman 

加州伯克利大學的計算機研究團隊發展并改進了 AT&T 的 Unix 系統,建立許多應用程序,并迅速成為“BSD Unix”,后來“BSD Unix”被蘋果的 macOS 采用。

1991 年,Linux 內核被芬蘭一名大二學生編寫出來。

開源,會是對手打敗 ChatGPT 的絕招嗎?

1999 年,Eric S.Raymond 出版了著作《大教堂與市集》,該書講述了黑客文化史、Linux的開發過程、以及作者本人主持開發的開放源代碼軟件 Fetchmail 的經歷,并討論了軟件開發的方法論。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*Eric S.Raymond 

與“教堂式”對應的,開源軟件開發模式被稱為“市集式”,就是通過不同的軟件開發愛好者,組成一個不同流程和不同方式的市集,共同開發軟件。

市集式的代表便是 Linux,最初由芬蘭大二學生 Linus Torvalds 于 1991 年首次發布 Linux 的內核,后來無數人加入合作使其可用性增強。現如今,采用 Linux 內核的系統已經運行在很多的設備上,比如大型計算機和超級計算機、服務器、手機(安卓)、路由器、電視等等。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*Linux 創始人 Linus Torvalds 

在前面提到了,開放源代碼運動旨在追求不阻礙合作、可共享的軟件開發路徑,并認為開放源代碼更有利于提高軟件的安全性、創新性和兼容性,這是開放源代碼最直接的意義。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*Github 上的開源項目 

將軟件源代碼公之于眾,使得所有開發者都成為軟件的潛在開發者,其中不乏許多優秀的網絡人才,共同開發軟件,能夠讓軟件存在的漏洞很快被發現并彌補,同時,每個人的想法也能在軟件上實現,促進了軟件的發展和迭代,有利于軟件的發展。

以上是軟件開源在軟件層面的意義,而像 Meta 將 Llama 2 開源,更多的是商業層面的考量,因為站在 Meta Llama 前面的是 ChatGPT 這個巨頭。

Meta 將 Llama 2 開源,能爭取更多的開發者支持,包括那些知名的合作企業,從而促進 Llama 的發展,提高市場占有率。過往不乏類似的案例。

Windows 從 3.0 開始取得了廣泛的成功,占據了個人電腦操作系統的大部分市場,對微軟不滿的科技行業從業者,在 Linux 的基礎上開發,將后者變成了網站和互聯網應用的運行系統。

開源,會是對手打敗 ChatGPT 的絕招嗎?

2007 年 1 月,蘋果發布了初代 iPhone,并展示了強大的 iOS 系統。該年11月,谷歌向外界公布了安卓系統,與 84 家軟、硬件企業以及電信運營商組成“開放手持設備聯盟”,并以免費開源的方式,發布了 安卓的源代碼,以此來與 iOS 競爭。

開源,會是對手打敗 ChatGPT 的絕招嗎?

從互聯網發展史來看,行業領先的巨頭往往會選擇閉源式開發,以保證技術領先,賺取更多的商業利益,而后來者選擇開源,爭取更多的市場和合作伙伴,以此抗衡行業領先者。

因此,“開源”成為部分企業以小博大的戰略選擇。

例如谷歌雖然不直接通過安卓系統授權獲利,但卻可以賺取 GMS 的授權服務費,而 Llama 如果取得成功,Meta 未來也能通過其他方式取得收益。

不過,現在站在 Meta 的 Llama 2 前面的巨頭不只是 OpenAI 的 ChatGPT,還有 Google 的大語言模型 Bard——是的,將安卓開源的谷歌,在大語言模型開發上選擇將 Bard 閉源。

開源,會是對手打敗 ChatGPT 的絕招嗎?

對企業來說,開發軟件選擇開源還是閉源不是基于主義,商業利益才是最主要的考量因素。

不過值得一提的是,Meta 的 AI 首席科學家楊立昆是一名開源主義者,當初扎克伯格邀請他出任臉書的 AI 實驗室主任一職時,他曾要求研究成果必須開源。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*楊立昆Yann LeCun

在前面,老狐介紹的都是開源的優點,事實上,開源的缺點某種程度上也是其優點帶來的,體現了一個事物的兩面性。 

首先是開源項目參與人數眾多,且自發進行,這必然造成管理困難,需要項目領導者付出更多精力去整合項目,做好決策。 

例如 80 年代與比爾·蓋茨齊名的技術天才米切爾·卡普爾曾出資幾百萬美元啟動一個名為 Chandler 的開源項目,旨在開發一個個人信息管理軟件,但因為項目管理混亂,開發人員更迭,項目最后失敗。 

開源,會是對手打敗 ChatGPT 的絕招嗎?

*米切爾·卡普爾

其次,開源項目迭代頻繁,不斷有新版本被開發出來,這需要軟件用戶不斷安裝新版本,這給用戶帶來了更高的使用成本。 

最后則是開源軟件未來的不確定性,因為其成員來自不同的人,軟件的質量和未來發展都沒法得到保證,一款軟件用戶正用著可能就沒下文了。 

以上開源的三個缺點恰好是閉源的商業軟件的優勢,以 Windows 為例,微軟有專業團隊負責開發,后期有穩定的更新和維護,能給用戶減少許多的麻煩。 

讀到這里,我想大家對“開源”已經有了大概的了解。

近些年,伴隨著互聯網的快速發展,尤其是大數據、物聯網、AI 等技術的火熱,開源軟件的開發者逐漸增多,相關的開源項目也越來越多,促進了開源軟件行業的發展。

一向封閉的微軟,也在納德拉上任后開始擁抱開源。2014 年,微軟在開源社區 Github 上開設了賬戶,并成為社區的最大貢獻者;2018 年,微軟花費 75 億美元收購了 Github,后者當時已是全球最大的開源社區和代碼托管平臺;如今,微軟也將與 Meta 的 Llama 展開合作。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*納德拉和扎克伯格

開源社區 Hugging Face 伴隨著 AI 的興起,成為了開源社區的頂流,如今 Hugging Face 上有超過 25 萬個模型,包括 Meta 的 Llama 2、國內王小川創立的百川智能的大語言模型“百川”。

開源,會是對手打敗 ChatGPT 的絕招嗎?

*Hugging Face上的大模型 

現在回到文章開頭的話題上來,小伙伴們認為 Llama 能通過開源的方式,擊敗閉源的 ChatGPT 和 Bard 么?

雖然結果老狐也無法預測,但非常樂意見到這樣的競爭,這是一場技術落后者借助群眾力量與技術領先者的競爭,也是開源的理想主義者與閉源的現實主義者的競爭,結果會怎樣呢?

答案在時間里。

參考資料

財聯社:Meta 發布 Llama 2 模型 與微軟、高通展開合作

晚點 LastPost:Llama 2 發布,一夜之間,大模型競爭來到新起點

維基百科:“開放源代碼”

石娟:開放源代碼及相關知識產權法理芻論[D].重慶:西南政法大學,2007.

遠川研究所:差一步稱霸AI:歷史進程中的扎克伯格

Web3 天空之城:楊立昆最新訪談:AI 威脅論是蒙昧主義,控制欲只有人才有 

維基百科:《Dreaming in code》

虎嗅:Github 50 億美元把自己賣了,為什么是微軟呢?

極客公園: 為了中國市場,Hugging Face 甚至玩上了小紅書 

本文來自微信公眾號“科技狐”(ID:kejihutv),作者:老狐,36氪經授權發布。

[免責聲明]

原文標題: 開源,會是對手打敗 ChatGPT 的絕招嗎?

本文由作者原創發布于36氪企服點評;未經許可,禁止轉載。

資深作者科技狐
0
消息通知
咨詢入駐
商務合作