最近,美國專利商標局 (USPTO) 一份檔顯示:OpenAI 於 7 月 18 日提交了「GPT-5」的商標申請,並且已經被 USPTO Office 接收(滿足最低申請要求),後續將由負責人員進一步審查。
OpenAI 在這份商標申請中提及了 GPT-5 的基本資訊。GPT-5 將是一個用於自然語言處理、生成、理解和分析的大型語言模型(LLM)。值得注意的是,除了文本,GPT-5 還將具備語音理解與生成的能力。
具體來說,GPT-5 的功能包括把文本或語音從一種語言翻譯成另一種語言、語音辨識、產生文本和語音等。此外,GPT-5 可能還具備學習、分析、分類和回應資料的能力。
有趣的是,今年上半年已經機器學習領域的專家、學者已經多次聯合發表公開信,呼籲人們重視生成式 AI 的潛在風險,並限制構建生成式 AI 大模型。其中,圖靈獎得主 Geoffrey Hinton 更是在 4 月從Google離職,警告人們生成式 AI 將「對人類構成威脅」。OpenAI 作為 ChatGPT、GPT-4 等大模型背後的公司,無疑被推上了風口浪尖。
當時,OpenAI 表示將會專注於改進 GPT-4 版本,GPT-5 不在其近期計畫內。
現在,雖然 OpenAI 已經提交了商標申請,但 GPT-5 也不會很快到來。OpenAI CEO Sam Altman 曾在 6 月也說明過這一點。
一般來說,科技公司會為尚未開發的概念申請商標,以保證其領先於競爭對手,並保護智慧財產權。申請中說明的 GPT-5 功能大部分 GPT-4 已經具備,在一定程度上 GPT-5 是 GPT-4 的改進版本。
GPT-4 發表之後,學界和業界對大模型有了更加深入的研究和探討。ChatGPT 和 GPT-4 強大的性能讓人們看到了大模型巨大的潛力,因而對 GPT-5 抱有很多期待。
首先在多模態能力方面,目前 GPT-4 只能處理文本和圖像兩種類型的資料,人們希望 GPT-5 能夠在語音、影片等其他模態上有所突破。
其次,在運算效率與成本上,GPT-4 的定價是每 1k 個 prompt token 0.03 美元,預設速率限制為每分鐘 40k 個 token 和每分鐘 200 個請求。而 GPT-3.5-turbo 的定價是每 1k 個 token 0.002 美元,只有 GPT-4 的 1/15。GPT-5 的價格或許會比 GPT-4 更高。
最後,ChatGPT、GPT-4 等大型語言模型都固有一些問題,包括「幻覺」、「偏見」等等,這些問題讓大模型難以直接實際應用。GPT-4 相對於以前的模型已經顯著減輕了幻覺問題。在 OpenAI 的內部對抗性真實性評估中,GPT-4 的得分比最新的 GPT-3.5 模型高 40%:
我們期待 GPT-5 在「幻覺」和「對齊」方面能夠進一步改善。
此外,近期一些新模型在上下文視窗方面有了新的突破,例如 Anthropic 將 Claude 2 的上下文視窗擴充至 200K token(目前發表版本僅支持 100K token),將大幅提升模型長文閱讀的能力。這也給以後發表的 LLM 帶來了新的壓力,包括 GPT-5。
當然,GPT-5 實際會具備哪些能力,還要等到它問世那一天才能揭曉謎底,我們拭目以待。
資料來源:
- GPT-5
- OpenAI Files Trademark Application For GPT-5
- Microsoft-backed OpenAI files trademark for ChatGPT powered by GPT-5