国产精一区二区_午夜视频99_免费白白视频_中文字幕一区免费

如何利用人工智能幫你做事:工具選擇指南

神譯局
+ 關(guān)注
2023-07-25 10:29
1.2w次閱讀
這里對(duì)人工智能可以做的事情進(jìn)行了分類,并給出了免費(fèi)和付費(fèi)的最佳工具選項(xiàng)。

神譯局是36氪旗下編譯團(tuán)隊(duì),關(guān)注科技、商業(yè)、職場(chǎng)、生活等領(lǐng)域,重點(diǎn)介紹國(guó)外的新技術(shù)、新觀點(diǎn)、新風(fēng)向。

編者按:生成式人工智能的發(fā)展可以用日新月異來形容,層出不窮的工具令人眼花繚亂,出現(xiàn)選擇困難癥。ChatGPT 盡管名聲最響,但什么事情都用它來做未必是最合適選項(xiàng)。這里對(duì)人工智能可以做的事情進(jìn)行了分類,并給出了免費(fèi)和付費(fèi)的最佳工具選項(xiàng),希望能幫到你。文章來自編譯。

如何利用人工智能幫你做事:工具選擇指南

越來越強(qiáng)大的人工智能系統(tǒng)層出不窮,發(fā)布的速度越來越快。最近,Claude 2 首次亮相,這也許是公眾可用的第二強(qiáng)大人工智能系統(tǒng)。一周之前,Open AI 發(fā)布了 Code Interpreter,這是迄今為止最嫻熟的人工智能模式。在這的一周前,部分人工智能還獲得了看懂圖像的能力。

可是,似乎沒有一家人工智能實(shí)驗(yàn)室提供任何的用戶文檔。相反,唯一的用戶指南似乎是 Twitter 上面那幫網(wǎng)紅大V的推文串(treads)。對(duì)于聲稱關(guān)心自身技術(shù)是否得到正確使用的組織來說,靠小道消息傳播的文檔是個(gè)奇怪選擇,但現(xiàn)實(shí)情況就是這樣。

我不敢說這份用戶指南已經(jīng)很全,但為了解人工智能的當(dāng)前狀態(tài)提供一些指導(dǎo)還是可以的。我每隔幾個(gè)月就會(huì)為我的學(xué)生(以及感興趣的讀者)編寫一份人工智能入門指南,而且每次都需要做出重大修改。但過去幾個(gè)月尤其瘋狂。

這份指南是基于我的經(jīng)驗(yàn),純屬個(gè)人之見,重點(diǎn)是如何選擇正確的工具來完成任務(wù)。

主要的大語(yǔ)言模型

現(xiàn)在,當(dāng)我們說起人工智能時(shí),我們通常指的是大型語(yǔ)言模型(LLM)。大多數(shù)人工智能應(yīng)用都是由 LLM 提供支持,而 LLM 當(dāng)中其實(shí)基礎(chǔ)模型就那么幾個(gè),是由少數(shù)幾家組織建立的。每家公司都可以通過聊天機(jī)器人(Chatbot)直接訪問他們的模型:OpenAI 做出了 GPT-3.5 與 GPT-4, ChatGPT 以及微軟的 Bing(通過 Edge 瀏覽器訪問)背后用的就是這些模型。 谷歌的 Bard 品牌旗下也有多款模型。Anthropic 則建立了Claude 與 Claude 2 模型。

還有其他一些 LLM,但本文不會(huì)詳細(xì)討論。第一個(gè)是 Pi,這是由 Inflection 構(gòu)建的聊天機(jī)器人。Pi 針對(duì)對(duì)話進(jìn)行了優(yōu)化,并且確實(shí)非常想成為你的朋友(說真的,不妨嘗試一下,試過你才知道我是什么意思)。除了聊天之外,它不喜歡做太多事情,想讓它替你工作會(huì)是一次令人沮喪的練習(xí)。我們也不會(huì)介紹任何人都可以使用和修改的各種開源模型。這些通常無(wú)法訪問,或者對(duì)于今天那些只是想隨便用用的用戶來說沒有什么用,但其實(shí)那些模型確實(shí)很有前景。未來的指南可能把它們納入進(jìn)去。

下面是一份快速參考圖表,總結(jié)了 LLM 的現(xiàn)狀:

如何利用人工智能幫你做事:工具選擇指南

前四個(gè)(包括 Bing 在內(nèi))都是 OpenAI 的系統(tǒng)。目前 OpenAI 的人工智能主要就這兩種:3.5 和 4。GPT 3.5 在去年 11 月掀起了一股人工智能熱潮,GPT 4在今年春季首次亮相,功能更加強(qiáng)大。新的派生版利用通過插件介入互聯(lián)網(wǎng)及其他應(yīng)用。插件有很多,但大多數(shù)不是很有用,不過應(yīng)該根據(jù)需要自己去探索一下。 Code Interpreter 是 ChatGPT 的一個(gè)極其強(qiáng)大的版本,可以運(yùn)行 Python 程序。如果你從未給 OpenAI 付過費(fèi),那么你就只用過 3.5。除了插件版以及暫時(shí)停止瀏覽的 GPT-4 版以外,這些模型都沒有連接到互聯(lián)網(wǎng)。微軟的 Bing 混合使用了 4 和 3.5,并且通常是 GPT-4 家族當(dāng)中第一個(gè)推出新功能的模型。比方說,Bing 既可以創(chuàng)建和識(shí)別圖像,也可以在web瀏覽器中讀取文檔。它已經(jīng)接入了互聯(lián)網(wǎng)。Bing 用起來有點(diǎn)奇怪,但功能強(qiáng)大。

谷歌一直在測(cè)試自己的供消費(fèi)者使用的人工智能,也就是所謂的 Bard,但其實(shí) Brad 背后由各種基礎(chǔ)模型提供支持,其中最近的一個(gè)叫做 PaLM 2。LLM 技術(shù)就是由谷歌開發(fā)出來的,但他們的產(chǎn)品非常令人失望,不過昨天公布的改進(jìn)表明他們?nèi)栽谥铝τ谘芯康讓蛹夹g(shù),所以我對(duì)他們?nèi)员S邢Mrad 已經(jīng)獲得了跑有限代碼與解釋圖像的能力,但我現(xiàn)在一般會(huì)避免使用 Bard。

最后一家公司是 Anthropic ,他們發(fā)布了 Claude 2。Claude 最值得注意的是它的上下文窗口非常大- 即便上算是 LLM 的內(nèi)存了。Claude 的內(nèi)存幾乎可以容納整本書或許多個(gè) PDF。與其他大型語(yǔ)言模型相比,其惡意行為的可能性更小,這意味著,它可能只會(huì)訓(xùn)斥你一下。

接下來,我們講講怎么用:

寫東西

最佳免費(fèi)選項(xiàng):Bing 與 Claude 2

付費(fèi)選項(xiàng):ChatGPT 4.0/帶插件的 ChatGPT

目前,GPT-4 仍然是最強(qiáng)大的人工智能寫作工具,你可以通過 Bing 免費(fèi)訪問(選擇“創(chuàng)意模式”),也可以通過每月花 20 美元訂閱 ChatGPT 來訪問。不過,第二名的Claude差距并不大,而且有免費(fèi)選項(xiàng),盡管存在限制。

這些工具也已被直接集成到常見的辦公應(yīng)用之中。 Microsoft Office 將納入由 GPT 提供支持的copilot,Google Docs 將集成 Bard 的建議。這些創(chuàng)新對(duì)寫作的影響會(huì)相當(dāng)深遠(yuǎn)。

以下是利用人工智能幫助你寫作的部分方法。

  • 寫草稿,任何東西的草稿。博客文章、論文、宣傳材料、演講、講座、選擇你自己的冒險(xiǎn)、腳本、短篇故事——只要你能想得到,人工智能都能做到,而且做得很好。你所要做的就是給它提示。提示制作并不神奇,但基本的提示會(huì)導(dǎo)致寫出來的東西很無(wú)聊,不過提高提示的水平并不難,只需與系統(tǒng)交互即可。只要稍加練習(xí),你就會(huì)發(fā)現(xiàn)人工智能系統(tǒng)當(dāng)作家的能力要強(qiáng)得多。

  • 讓你寫得更好。把你的文本粘貼給人工智能。讓人工智能改進(jìn)內(nèi)容,或者讓人工智能給出建議,看看怎么更好地適合特定受眾。讓它寫出 10 份風(fēng)格截然不同的草稿。要求人工智能把文字變得更生動(dòng),或者添加例子。用它來激發(fā)靈感,讓你寫更好。

  • 幫助你完成任務(wù)。人工智能可以做你沒有時(shí)間做的事情。像實(shí)習(xí)生一樣使用人工智能,讓它撰寫電子郵件、創(chuàng)建銷售模板、為你提供商業(yè)計(jì)劃的后續(xù)步驟等等。比方說我曾在人工智能的幫助下在 30 分鐘內(nèi)完成了產(chǎn)品發(fā)布的各種支持工作。

  • 解鎖你自己。面對(duì)挑戰(zhàn)艱巨的任務(wù)很容易讓人分心。人工智能是為你提供動(dòng)力的手段之一。

如何利用人工智能幫你做事:工具選擇指南

不同模型生成效果對(duì)比

需要擔(dān)心的一些事情:為了響應(yīng)你的請(qǐng)求,人工智能很容易會(huì)產(chǎn)生“幻覺”并生成看似合理的事實(shí)。它可以生成完全虛假且看似完全令人信服的內(nèi)容。我要強(qiáng)調(diào)的是:人工智能經(jīng)常撒謊。它告訴你的每一個(gè)事實(shí)或信息都有可能是不對(duì)的。你需要檢查一切。讓人工智能(指未連接到互聯(lián)網(wǎng)的模型)提供參考文獻(xiàn)、引言、引用以及互聯(lián)網(wǎng)信息尤其危險(xiǎn)。與其他模型相比,Bing 產(chǎn)生幻覺的情況往往要少一些,因?yàn)?GPT-4 生成的東西通常有事實(shí)依據(jù),而Bing 接入互聯(lián)網(wǎng)意味著實(shí)際上它可以獲取事實(shí)。但幻覺不可能完全消除。

另外要注意的是,人工智能沒法解釋自己,它只會(huì)讓你認(rèn)為它可以做出解釋。如果你要求它解釋為什么寫出了這樣的東西,它會(huì)給你一個(gè)看似合理但卻是完全虛構(gòu)的答案。當(dāng)你詢問它的思維過程時(shí),它并不是去詢問自己的行為,那只是在生成看上去像是它正在這樣做的文本。這使得理解系統(tǒng)存在的偏見變得非常具有挑戰(zhàn)性,盡管這些偏見幾乎肯定是存在的。

它還可能被人不道德地用于操縱或欺騙。你要對(duì)這些工具的輸出負(fù)責(zé)。

圖像制作

最透明的選項(xiàng):Adobe Firefly

開源選項(xiàng):Stable Diffusion

最佳免費(fèi)選項(xiàng):Bing 或 Bing Image Creator(使用 DALL-E)、 Playgound (可使用多個(gè)模型)

圖像質(zhì)量最佳的選項(xiàng):Midjourney

可供大多數(shù)人使用的大型圖像生成器有四種:

  1. Stable Diffusion,這個(gè)工具是開源的,任何一款高端的計(jì)算機(jī)都能跑。開始要付出一些努力,因?yàn)槟愕脤W(xué)會(huì)正確地寫出提示,但一旦你能寫出好的提示,就會(huì)生成很好的結(jié)果。這個(gè)特別適合將人工智能與其他來源的圖像相結(jié)合。如果你選擇Stable Diffusion,這里有一份很好的指南(請(qǐng)務(wù)必閱讀第 1 部分和第 2 部分:https://www.jonstokes.com/p/stable-diffusion-20-and-21-an-overview)。

  2. DALL-E,來自 OpenAI,Bing(必須是在創(chuàng)意模式下)以及 Bing Image Creator已經(jīng)植入了DALL-E。這個(gè)系統(tǒng)很可靠,但比Midjourney要差一些。

  3. 截止2023年中,Midjourney是表現(xiàn)最好的系統(tǒng)。它的學(xué)習(xí)曲線在所有系統(tǒng)當(dāng)中是最低的:只需輸入“thing-you-want-to-see --v 5.2”(最后的 --v 5.2 很重要,這會(huì)提示人工智能采用最新的模型),你就會(huì)得到一個(gè)很好的結(jié)果。Midjourney需要通過Discord 使用。這里是 Discord 的使用指南

  4. Adobe Firefly,已內(nèi)置到多款 Adobe 產(chǎn)品之中,但在質(zhì)量方面落后于 DALL-E 和Midjourney 。不過,其他那兩個(gè)模型并未交代清楚用于訓(xùn)練人工智能的圖像來源,但 Adobe 已聲明自己僅使用其有權(quán)使用的圖像。

以下是這幾款工具的對(duì)比(每個(gè)圖像都標(biāo)記了用什么模型):

如何利用人工智能幫你做事:工具選擇指南

提示:“Fashion photoshoot of sneakers inspired by Van Gogh”——每個(gè)模型創(chuàng)作的第一張照片

需要擔(dān)心的一些事情:這些系統(tǒng)是圍繞著模型構(gòu)建出來的,但這些模型會(huì)存在偏見,因?yàn)橛脕碛?xùn)練模型的互聯(lián)網(wǎng)數(shù)據(jù)存在偏見(比方說,如果你讓它創(chuàng)建企業(yè)家的圖片,你可能會(huì)看到更多以男性而不是女性為主角的圖片,除非你指定要?jiǎng)?chuàng)建“女性企業(yè)家”),用這個(gè)瀏覽器(https://huggingface.co/spaces/society-ethics/DiffusionBiasExplorer)可以看看實(shí)際存在哪些偏見。

這些系統(tǒng)還使用了互聯(lián)網(wǎng)上的藝術(shù)來進(jìn)行訓(xùn)練,但卻是以不透明且可能在法律和道德上存在問題的方式進(jìn)行訓(xùn)練的。盡管從技術(shù)上而言,你擁有所創(chuàng)建圖像的版權(quán),但法律規(guī)定仍然模糊。

另外,目前這些模型是不創(chuàng)建文本的,只是創(chuàng)建了一堆看起來像文本的東西。但Midjourney已經(jīng)成功了。

提出想法

最佳免費(fèi)選擇:Bing

付費(fèi)選項(xiàng):ChatGPT 4.0,但由于有互聯(lián)網(wǎng)連接,Bing 可能更好

盡管(或者事實(shí)上,由于)人工智能存在諸多限制和怪異之處,但仍然非常適合生成點(diǎn)子。你經(jīng)常需要有很多想法才能想出好想法,而人工智能擅長(zhǎng)以量取勝。通過提供正確的提示,你還可以迫使它變得非常有創(chuàng)意。在創(chuàng)意模式下要求 Bing 找出你最喜歡的,不同尋常的創(chuàng)意生成技術(shù),比方說 Brian Eno 的間接策略(oblique strategies)或馬歇爾·麥克盧漢(Mashall McLuhan) 的四分法,并應(yīng)用它們。或者要求提供一點(diǎn)很奇怪的東西,比如隨便拿個(gè)專利來獲得靈感,或者你最喜歡的超級(jí)英雄......

如何利用人工智能幫你做事:工具選擇指南

制作視頻

最佳動(dòng)畫工具:D- iD ,用于為視頻里面的臉部制作動(dòng)畫。 Runway v2 可用于文本生成視頻

最佳聲音克隆: ElevenLabs

現(xiàn)在,生成這樣一段視頻已經(jīng)是小事一樁:包含完全由人工智能生成的角色、去讀完全由人工智能編寫的腳本、用人工智能制作的聲音說話、由人工智能制作動(dòng)畫,這些通通沒問題。它還可以對(duì)人進(jìn)行深度偽造。

第一個(gè)商用的文本生成視頻工具最近也發(fā)布了,也就是Runway v2。它可以創(chuàng)建 4 秒的短片,所以這更多的是對(duì)未來的可能性的一種演示,但如果你想了解這個(gè)領(lǐng)域?qū)頃?huì)如何發(fā)展的話,值得一看。

需要擔(dān)心的一些事情:深度偽造是一個(gè)大問題,這些系統(tǒng)需要以合乎道德的方式去使用。

處理文檔和數(shù)據(jù)

對(duì)于數(shù)據(jù)(以及對(duì)代碼有任何奇怪想法):Code Interpreter

文檔處理: 大型文檔或同時(shí)處理多個(gè)文檔可用Claude 2,Bing 側(cè)邊欄可用于小一點(diǎn)的文檔和網(wǎng)頁(yè)(側(cè)邊欄屬于Edge 瀏覽器的一部分,可以“查看”瀏覽器里面的內(nèi)容,讓 Bing 處理相關(guān)信息,不過其上下文窗口的大小有限)

我上周寫了一篇關(guān)于Code Interpreter的文章。它是 GPT-4 的其中一種模式,在這種模式下,你可以上傳文件給該人工智能,去編寫和運(yùn)行代碼,還可以下載該人工智能提供的結(jié)果。它可以用來執(zhí)行程序、進(jìn)行數(shù)據(jù)分析(盡管你需要對(duì)統(tǒng)計(jì)數(shù)據(jù)和數(shù)據(jù)有足夠了解才能檢查它做得好不好)以及創(chuàng)建各種文件、網(wǎng)頁(yè)甚至游戲。盡管自發(fā)布以來,關(guān)于未經(jīng)訓(xùn)練的人用它進(jìn)行分析的相關(guān)風(fēng)險(xiǎn)存在很多爭(zhēng)論,但許多測(cè)試過 Code Interpreter 的專家都對(duì)它的能力印象深刻,以至于一篇論文聲稱這個(gè)東西會(huì)要求我們改變培訓(xùn)數(shù)據(jù)科學(xué)家的方式。我還編寫了初始提示來設(shè)置Code Interpreter,好做出有用的數(shù)據(jù)可視化。初始提示給出了良好圖表設(shè)計(jì)的一些基本原則,并提醒它可以輸出多種文件。鏈接參見此處https://t.co/m4yAdKROiJ。

至于文本處理,尤其是 PDF的處理,Claude 2 到目前為止表現(xiàn)非常出色。我試過將整本書粘貼到以前版本的 Claude 里,效果令人印象深刻,而且新模型更加強(qiáng)大。我還喂給它大量復(fù)雜的學(xué)術(shù)文章并要求它給出結(jié)果摘要,它做得很好!甚至更好的是,你還可以提出后續(xù)問題,比方說:這個(gè)方法的證據(jù)是什么?作者得出了什么結(jié)論?等等…

如何利用人工智能幫你做事:工具選擇指南

需要擔(dān)心的一些事情:這些系統(tǒng)仍然會(huì)產(chǎn)生幻覺,盡管是以更為受限的方式出現(xiàn)。如果你想確保準(zhǔn)確性,就得檢查生成的結(jié)果。

獲取信息及學(xué)習(xí)東西

最佳免費(fèi)選擇:Bing

付費(fèi)選項(xiàng):通常 Bing 是最好的。如果是兒童的話,可汗學(xué)院的Khanmigo提供了由 GPT-4 支持的人工智能學(xué)習(xí)輔導(dǎo),效果不錯(cuò)。

如果你打算把人工智能當(dāng)作搜索引擎的話,我的建議是也許不要這樣做。產(chǎn)生幻覺的風(fēng)險(xiǎn)很高,而且大多數(shù)人工智能都沒有連接到互聯(lián)網(wǎng)(這就是為什么我建議你用 Bing。谷歌的人工智能 Bard 產(chǎn)生的幻覺更多)。不過,根據(jù)最近的一項(xiàng)試點(diǎn)研究,有部分證據(jù)表明,如果謹(jǐn)慎使用的話,相對(duì)于搜索,人工智能往往能提供更有用的答案。特別是在搜索引擎表現(xiàn)不太好的情況下,比方說技術(shù)支持、決定去哪里吃飯或獲取建議,以 Bing 作為起點(diǎn)往往要比用谷歌好。這是一個(gè)正在迅速發(fā)展的領(lǐng)域,但你現(xiàn)在應(yīng)該小心使用。畢竟你不想惹上麻煩吧。

但更令人興奮的是利用人工智能來輔助教育的可能性,包括幫助我們自己學(xué)習(xí)。我已經(jīng)寫過關(guān)于如何將人工智能用于教學(xué)并讓教師的生活變得更輕松、課程變得更有效的文章,但人工智能也可以用于自主學(xué)習(xí)。你可以讓人工智能解釋概念,一般可以獲得非常好的結(jié)果。鑒于我們知道人工智能可能會(huì)產(chǎn)生幻覺,所以明智的做法是(小心!)對(duì)照其他來源,仔細(xì)檢查任何的關(guān)鍵數(shù)據(jù)。

還有嗎?

正如過去幾個(gè)月的發(fā)展所表明的那樣,由于技術(shù)的快速發(fā)展,現(xiàn)在介紹的這些將來可能會(huì)變成你用過的最糟糕的人工智能工具。我毫不懷疑自己很快就需要制作一本新的指南。但關(guān)于人工智能,請(qǐng)記住這兩個(gè)關(guān)鍵點(diǎn)仍然是正確的:

  • 人工智能是一種工具。但未必總是合適的工具。鑒于人工智能存在弱點(diǎn),請(qǐng)仔細(xì)考慮它是否適合你計(jì)劃應(yīng)用它的目的。

  • 有很多道德問題需要注意。人工智能可能會(huì)被用來侵犯版權(quán)、作弊、竊取他人的作品或進(jìn)行操縱。特定人工智能模型的開發(fā)方式以及誰(shuí)從對(duì)它的使用中受益往往是個(gè)很復(fù)雜的問題,現(xiàn)階段還不是特別清楚。最終,你有責(zé)任以合乎道德的方式去使用這些工具。

我們正處于一場(chǎng)快速推進(jìn)的革命的早期階段。你還有其他用途想分享嗎?請(qǐng)?jiān)谠u(píng)論中告訴我。

譯者:boxi。

[免責(zé)聲明]

原文標(biāo)題: 如何利用人工智能幫你做事:工具選擇指南

本文由作者原創(chuàng)發(fā)布于36氪企服點(diǎn)評(píng);未經(jīng)許可,禁止轉(zhuǎn)載。

資深作者神譯局
0
消息通知
咨詢?nèi)腭v
商務(wù)合作