国产精一区二区_午夜视频99_免费白白视频_中文字幕一区免费

“我讓 AI 來處理我 24 小時的音頻信息——這會是未來嗎?”

CSDN
+ 關注
2022-11-22 10:57
498次閱讀

“我讓 AI 來處理我 24 小時的音頻信息——這會是未來嗎?”

整理 | 鄭麗媛
出品 | CSDN(ID:CSDNnews)

這幾年 AI 發展和進化的速度,幾乎可以用三個字來形容:殺瘋了。

AI 下棋、AI 編程、AI 作畫、AI 寫小說、AI 預測蛋白質結構……當 AI 逐漸融入我們的生活,你是否設想過,我們的未來會如何發展?會像許多科幻電影和賽博朋克類小說中說的那樣,讓 AI 管理和安排我們的日常?

正如未來學家尼葛洛龐帝所說,“預測未來的最好方法,就是去創造未來”,最近國外一位小哥 RoberDam 便提前“體驗”了一把他眼中的未來:“我 24 小時都用音頻記錄自己,然后用 AI 來處理這些信息——這會是未來嗎?”

“我讓 AI 來處理我 24 小時的音頻信息——這會是未來嗎?”

“我讓 AI 來處理我 24 小時的音頻信息——這會是未來嗎?”

恰好出現的 Whisper

說來有些好笑,RoberDam 會對這個測試提起興趣的原因之一,是 1TB 內存手機的出現:“迄今為止已經有多種型號的智能手機都具有 1TB 的內存,這能干什么呢?能全天候地記錄自己的音頻!”

恰好今年 9 月底,OpenAI 又發布了一個名為 Whisper 的語言 AI 模型,并聲稱它在英語語音識別方面的準確性已接近人類水平——RoberDam 靈光一閃,齊活兒!

“當然,這只是一個預測未來的實驗,就是想看看什么可能、什么不可能。”

首先,RoberDam 買了幾個麥克風帶在身上,整天開著,記錄他一天說的話。計劃當一天結束后,他就把這些音頻交由 OpenAI 的 Whisper 處理,轉化為文本文件,從中提取信息。

不過,畢竟每天說的話太多,RoberDam 認為還是有必要畫個重點的。因此,他創建了一個初級的“數字助理”程序,將一些重要信息通過關鍵詞“Robert”和“End Robert”主動讓其捕捉:“每次我說出‘Robert’這個詞時,表明我之后所說的一切都是我對助手的命令,直到我再次說‘End Robert’,意味著命令結束。”

舉兩個例子:

  • 想讓“數字助理”記錄當天的體重,RoberDam 只需大聲說:“Robert WEIGHT 60.1 end Robert。”

“我讓 AI 來處理我 24 小時的音頻信息——這會是未來嗎?”

  • 想讓“數字助理”記錄當天的睡眠時間,RoberDam 也只需說:“Robert SLEEP 7 hours 14 minutes end Robert。”

“我讓 AI 來處理我 24 小時的音頻信息——這會是未來嗎?”

等一天結束,Whisper 將當天的音頻處理并轉換為文本后,“數字助理”程序就會負責搜索命令的文本并提取關鍵詞之間的所有內容。

“我讓 AI 來處理我 24 小時的音頻信息——這會是未來嗎?”

足以確保 100% 的隱私,還等同于“模擬 API”

說到這里,可能有些人會覺得,何必如此麻煩搞個“數字助理”,直接用 Google 的“OK GOOGLE”和蘋果的“Siri”不香嗎?

以“OK GOOGLE”為例,RoberDam 總結了三點局限:

  • 命令受限:不夠了解“OK Google”可以交互式地做什么,對它的一些命令只會作為 Google 搜索返回。

  • 不夠隱私:你對“OK Google”說的命令和完整音頻文件都會一起保存在 Google 中,搜索歷史記錄就能查到。你不僅能聽到自己的聲音,旁邊人的對話可能也會被錄進去。

  • 同步處理:當你向 Google 發送命令時,通常會有幾秒的延遲,可能用于搜索也可能在辨別你的命令,而這會分散你的注意力,讓你關注它的反饋,有時候這比你直接手動操作還慢。

基于這三點,RoberDam 自己創建的“數字助理”就很好地解決了這些問題:

  • 命令受限:命令由 RoberDam 自己決定,他知道“數字助理”能處理什么。

  • 不夠隱私:所有音頻只有 RoberDam 一人擁有,確保 100% 隱私。

  • 同步處理:它是異步處理的,所以 RoberDam 不用費心盯著它有沒有及時響應,想到了就說出命令,一天結束后它會自己處理。

另外值得一提的是,這個“數字助理”某種程度上來說等同于一個“模擬 API”——一些電子設備原本只能與手機連接,但現在 RoberDam 通過將音頻交由“數字助理”處理,間接實現了多個設備之間的通信。

“我讓 AI 來處理我 24 小時的音頻信息——這會是未來嗎?”

目前還存在一些弊端

總之,某一天 RoberDam 終于克服了羞恥心,時不時就對著麥克風喊著:“Robert……end Robert”,最終他明確向“數字助理”說的所有信息都可以集中在日常控制面板中:

“我讓 AI 來處理我 24 小時的音頻信息——這會是未來嗎?”

不僅如此,RoberDam 表示,為了進一步了解當天的日程,還可以創建“我的日記”以生成當天所做事情的摘要:

“我讓 AI 來處理我 24 小時的音頻信息——這會是未來嗎?”

不過,RoberDam 也承認,這種 AI 處理方式還存在一些弊端。例如:現階段的“數字助理”并不會提醒他當天必須要做的事情;由于是異步處理的,只有到晚上才知道那些命令有沒有被成功處理;還有在別人眼里,他的“自言自語”可能有點奇怪。

除了 RoberDam 主動要求“數字助理”處理的信息,他日常被麥克風記錄下來的其他音頻也有作用。以下是他目前正在進行的嘗試:

  • 關系溫度計

根據對夫妻關系的研究,通過研究夫妻對話,特別有關夫妻之間積極和消極互動,可以以高達 90% 的準確率預測夫妻是否要離婚:https://www.gottman.com/blog/the-magic-relationship-ratio-according-science/

  • 情緒分析

嘗試按小時進行情緒分析,以便能夠確定白天產生最大壓力、放松、快樂和悲傷的情況。

  • 全面回顧

等于一個搜索引擎,可以完整回顧他對某個話題的確切看法。

對于 RoberDam 以上的研究,許多網友表示新奇和肯定:

  • 一般來說,我們不希望被別人監視,但我們自己活動的管理記錄可能非常有價值。

  • “好主意,以后可以搜索日志以供參考,因為它都是文本。”

那么,你認為這種形式會是 AI 發展的未來嗎?

參考鏈接:

  • https://roberdam.com/en/wisper.html

  • https://news.ycombinator.com/item?id=33608437

本文來自微信公眾號“CSDN”(ID:CSDNnews),作者:,36氪經授權發布。

資深作者CSDN
0
消息通知
咨詢入駐
商務合作