OpenAI 缺乏一個面向消費者的數位語音助理,但它確實透過 TTS(文本轉語音)等 API 提供語音辨識功能,用於語音轉文字轉換,以及 Whisper 用於通用語音辨識。
OpenAI 最近提交了商標申請,表明其有意開發「數位語音助理」和「語音引擎」。此舉表明,以山姆·阿特曼 (Sam Altman) 為首的人工智慧研究公司可能正準備挑戰蘋果的 Siri 和亞馬遜的 Alexa 等知名語音助理。
該申請於週二提交給了美國專利商標局,在前一天,阿特曼在採訪中討論了 OpenAI 計劃在備受期待的 GPT-5 模型之前發表多個重要版本的計劃。雖然商標申請並不保證產品上市,但 OpenAI 預計將在 2023 年年中推出一個增強版的更流行的ChatGPT軟體。
在與Podcast主持人萊克斯·佛雷德曼 (Lex Fridman) 的對話中,阿特曼預告了 2023 年將推出一個「令人驚嘆的新模型」,並表示 OpenAI 將在未來幾個月內推出「許多不同的東西」,承諾令人興奮的發展。他暗示了不同於 GPT-5 的版本,表明 OpenAI 的戰略規畫圖不僅只限於其旗艦語言模型的範疇。
目前,OpenAI 缺乏一個面向消費者的數位語音助理,但它確實透過 TTS(文本轉語音)等 API 提供語音辨識功能,用於語音轉文字轉換,以及 Whisper 用於通用語音辨識。
除了語音助理申請之外,OpenAI 去年 10 月還獲得了 GPT-6 和 GPT-7 的商標,涵蓋了廣泛的應用範例,例如透過人工智慧模擬對話、預測分析、音樂生成和開發程式碼。
隨著 OpenAI 雄心勃勃地開拓道路,它還將應對監管障礙;專利局最近拒絕了該公司註冊「GPT」商標的嘗試,認為該縮寫詞過於描述性。
「語音引擎」申請列出了十項預期的用途,其中包括構建語音助理、語音辨識、基於文字提示的音訊生成、多語言轉錄和由機器學習支援的語音服務開發。
加入電腦王Facebook粉絲團