週三,Google公布了新的AI模型 Gemini(雙子星)。Gemini是該公司迄今為止最強大的AI,從今天開始將應用於Bard和Pixel 8 Pro智慧型手機,並將很快整合到Google的其他產品和服務中,包括Chrome、Search、Ads等。Google有一個重要的訊息想讓大家知道:這個東西比你從OpenAI獲得的任何東西都要好得多。
Google首席執行長桑達爾·皮查伊在一份聲明中說:「這新一代的模型代表了我們作為一家公司所進行的最大的科學和工程努力之一。我真正為即將到來的事物以及Gemini為全世界的人們所帶來的機會感到興奮。」
就在一年多前,OpenAI推出了ChatGPT,使得Google和其他公司急於證明他們的技術工具同樣先進。到目前為止,Google的聊天機器人Bard與ChatGPT相比相當遜色。搜尋巨頭表示,這一切從現在開始將會改變。Bard將是大多數人首次接觸Gemini的方式,雖然目前不會把這個模型的全部功能都公開讓大家使用。
認識新的Bard
Gemini分為三個等級。Gemini Ultra是Google最強大的模型,被定位為用來和OpenAI的GPT-4競爭。Gemini Pro是一款中階的模型,目的是超越GPT-3.5,即ChatGPT的基本款。最後是Gemini Nano,一個更高效的模型,目的是為了應用在行動設備上。
截至週三,Bard正在運行一個「精細調整的Gemini Pro版本」,Google助理和Bard副總裁Sissie Hsiao在新聞發表會上說。「這將具有更先進的推理、規劃、理解和其他能力。」
Hsiao表示,Google將在明年初推出一個付費版本的聊天機器人,運行在Gemini Ultra上,公司稱之為Bard Advanced。但她拒絕透露定價細節。
Google分享了一份長長的基準測試清單,顯示在幾乎每一項指標上,新的Bard都超過了ChatGPT的免費版本。公司展示了幾個新Bard超強能力的展示,包括與YouTuber Mark Rober的合作,其中AI幫助構建一架超精確的紙飛機。
除了Bard,Gemini也在週三的更新中進入Pixel 8 Pro Android手機,儘管能力有限。Gemini Nano 現在支援 Pixel 8 Pro 上 Android 記錄器應用的 Summarize 功能。谷歌表示,人工智慧也將為 Pixel 8 Pro 上的 Android 智慧回應功能提供支援,但前提是要使用Google鍵盤,並且目前僅限於 WhatsApp。該公司表示,Gemini 明年將推出更多訊息應用程式和作業系統的其他部分。
Google表示Gemini比GPT-4更好
目前,GPT-4是大眾可以使用的最強大的模型。Google表示它已超越GPT-4,而且當Gemini Ultra推出時,它將會是市場上最好的AI。
Google DeepMind的產品副總裁Eli Collins說:「在行業標準基準MMLU上,Gemini以超過90%的分數,成為首個在性能上超越人類專家的AI模型。」 MMLU,即Massive Multitask Language Understanding(大規模多任務語言理解),透過結合57個學科(如數學、物理、歷史、法律、醫學和倫理)的標準測試來衡量AI的能力。
然而,目前尚不清楚公眾何時能看到相關的證明。上週,《《The Information》報導稱,Google推遲了Gemini的推出,因為AI「對某些非英語查詢的處理不夠可靠」。原定於本週進行的Google Gemini現場展示被無限期推遲。針對有關外語問題的問題,Collins表示「實際上,Gemini在多語言能力方面表現相當出色。」Google並沒有透露更多的具體訊息,只是說Gemini Ultra將在「明年初」上市。
Collins表示:「Gemini的性能在32個廣泛使用的行業基準中的30個上也超越了目前的最先進結果。」
Google強調,Gemini是為「多模式性能」而構建的,意味著它可以理解不同種類的訊息,如文字、圖像、影片、聲音等。Google分享了一段影片,其中一個由Gemini驅動的Bard幫助學生完成物理作業,從一張寫著手寫問題的作業照片開始。然後,AI無縫地轉換為書面建議,包括方程式和逐步答案。
在11月,路透社報導稱,OpenAI已朝向「通用人工智慧」(AGI)取得進展,這是業界用來形容比人類更聰明的AI的術語,其秘密模型被稱為「Q-Star」或「Q*」。據稱,Q* 展示了回答基本數學問題的能力,這比聽起來更有意義,因為LLM(大型語言模型)並不是訓練來處理只有一個正確答案的問題。在數學方面的勝任力將展示高級推理能力。
加入電腦王Facebook粉絲團