微軟與 Google 圍繞 ChatGPT 的這場龍爭虎鬥,以出人意料的方式揭開了第一季的結局。
2月8日晚上,Google在巴黎舉行 AI 發表會,向外界正式披露聊天機器人產品 Bard。作為 ChatGPT 最重要的挑戰者,Google 過去兩周一直在為這場發表會造勢,但萬眾矚目的產品示範時卻出了重大紕漏!Bard 在回答「詹姆斯‧韋伯太空望遠鏡的新發現」這個簡單問題時,錯誤地把另一個望遠鏡取得的成就張冠李戴給了前者。
Google 的股價在盤後大跌 7.4%,市值一夜蒸發近千億美元。形成鮮明對比的是:投資 OpenAI 數十億美元的微軟,半天前剛剛舉行了一場小型媒體活動,發表整合最新版模型的搜尋引擎 New Bing 和新版瀏覽器 Edge,微軟在過去兩天上漲近 4%,市值重回 2 兆美元,並在 Google 翻車、全球 ChatGPT 概念回檔之際,盤後繼續微漲 0.5%。
將 Google 捲入這場生成式 AI 大戰,微軟毫不掩飾自己的想法。微軟總裁納德拉直言:"This new Bing will make Google come out and dance, and I want people to know that we made them dance."「新的 Bing 會讓 Google 起舞,我要讓世人知道是被我們逼的。」
微軟的嘗試取得了成果,除了市值上漲,AI 功能的加入也如他們預期般,看到了撼動 Google 搜尋引擎長城的曙光。新版功能小規模開放試用後,Bing 已經躍居至 iOS 免費榜的第 12 位,根據 data.ai 的初步估計,Bing App 的新下載量增長了 10 倍。
但這場圍繞 ChatGPT 的生成式 AI 戰爭才剛開始,聊天機器人能否動搖搜尋引擎的市場格局還有待時間觀察。此外,圍繞基礎模型的競爭也不止於搜尋引擎,今天人們正在使用的大部分軟體和服務都有可能被生成式 AI 重塑,更多產品和服務都會被捲入其中。
甚至更進一步,隨著類 ChatGPT 以及更廣泛的 AI 能力需求的增加,對微軟、Google、阿里、百度等所有的雲端服務平臺提供商而言,生成式 AI 相關能力將成為重要的基礎設施,圍繞後者的競爭,將成為未來數年改變雲端服務市場的因素。
先後發表新產品,Google跌了,微軟漲了
上一次科技巨頭之間這種拔刀互砍,還要追溯到疫情前 TikTok 掀起的短影音大戰。ChatGPT 爆火後,資本、創業者和科技巨頭紛紛捲入,科技圈的熱鬧恍如隔世。
打響第一場白刃戰的是 Google 和微軟,主題是搜尋引擎。2 月 2 日 Google 宣布,8 號將舉行現場發表會,介紹有關搜尋引擎的最新產品。一周內,先是微軟短暫上線疑似「整合 GPT-4 的 Bing 搜尋版本」激起人們的好奇,隨後 Google 總裁 Pichai於2月6日公布了用於搜尋服務的聊天機器人 Bard,同一天,微軟公布要在 Google 發表會的前一天 7 號舉行發表會,介紹最新的搜尋引擎 New Bing 和瀏覽器 Edge。
「這是搜尋的新一頁,新的典範已經出現,軍備競賽從今天開始。」發表會上,納德拉充滿信心地宣布。ChatGPT 走紅後,業界很快意識到,大型語言模型對於更新搜尋產品的臨界點到來了。在最新的產品發布中,Google 和微軟共同強調了這一點:以自然語言提問查詢,AI 基於多方資訊、返送重新創作後的針對性回答。使用者還可以基於首輪回答,再進行追問。
兩家都給出了購物場景下的查詢案例。
比如 Google:我想為家庭買一輛新車,應該考慮些什麼?Bard 會建議你考慮預算、座位數、設計特點、安全性、動力類型幾個維度。接下來,你可以追問,如果想買一個電動車型,有什麼優勢和不足?
還可以將對話的主題從選車,轉移到旅行計畫。你可以接著問 Bard:第一次長途自駕將會從舊金山到聖塔克魯茲,沿途有什麼停車點?
對比之下,微軟展示的產品體驗則更完善。
在微軟的示範中,給出了挑選電視的例子。當你在搜尋引擎中輸入「最好的 65 英吋電視」,Bing 就會為你羅列出不同的產品。在展示形式上,Bing 的回答會在頁面的右邊欄框中,這樣確保使用者可以同時看到傳統搜尋引擎給出的連結、以及生成式語言模型給出的綜合回答。這也是微軟所謂的「副駕駛」體驗。
當想進行追問,則可以從「chat」選項切入,進入對話介面。基於已有的答案進行追問:哪一款最適合遊戲?在給出的回答中,也可以繼續追問,哪一款最便宜?
從產品的形態設計上而言,微軟更為完備,考慮到了問答與傳統搜尋模式之間的自由切換。而 Google 目前僅僅展示了問答部分的產品形態。
更關鍵的部分在於,在 Demo 的展示中,微軟顯示了資訊來源,以腳註和「Learn More」的形式供使用者核實與進一步瞭解。在Google的 Demo 示範中則沒有這個部分。
此外,Google 還展示了向 Bard 提問開放式問題。例如:觀星時最好的星座是什麼?搜尋頂部的位置也會返回產生一段答案,同樣沒有顯示資訊來源。
這帶來的隱患是,當答案裡有資訊錯誤時,更難以核查。Pichai 在Google部落格中展示的第一個 Demo,就出現了這樣的問題。回答「怎樣向 9 歲的孩子解釋詹姆斯‧韋伯太空望遠鏡的新發現?」時,Bard 稱韋伯望遠鏡拍攝到了首張太陽系外行星的照片。這就是一個事實性錯誤,這一成就實際上來自 2004 年的智利甚大望遠鏡VLT;此外,第一條中「2023 年,韋伯望遠鏡發現了大量暱稱為『綠豌豆』的星系」的時間也出現了錯誤,應該是 2022 年 7 月。
這樣的事實性錯誤,ChatGPT 經常犯,如今出現在了為 Bard 提供技術支援的 LamDA。這種錯誤,成為搜尋引擎的服務時,就會影響到使用者對產品的信任。因為沒有資訊來源,使用者也無法透過核對發現錯誤。產品 Demo 中出一次生成答案就出現兩次錯誤,給使用者帶來了強烈的不良觀感。
而沒有顯示引用來源,也招致了搜尋引擎業界人士對目前產品形態的不滿。「引用必須要有,希望這不是 Google 前進的方向,這樣不對」,「在目前的實驗形式中,我沒有看到任何的歸因或引用,沒有連結,沒有點擊。這是對出版商的戰爭……」兩位行業人士評論道。
真實產品與期待值的落差,致使 Google 盤後大跌。但這也是今天聊天式機器人產品需要面對的現實,甚至從某種意義上來說,在大型語言模型積累多年的 Google,即使將最新功能加入搜尋產品,還有許多影響使用者體驗的問題需要解決。
Google 的謹慎與無奈
從目前更新的產品形態上來看,Google落後微軟。而從之前傳出的 Picha 在內部發起「紅色警報」(Red code)、搜尋引擎兩位創始人重回公司商討 AI 戰略等消息來看,Google 的確是在 ChatGPT 大紅之後,調整策略,緊急迎戰。
ChatGPT 的爆紅,讓公眾形成了印象,這是目前最先進的技術。但是在學術界則認為,ChatGPT 並沒有在技術上領先很多。
喬治亞理工學院的電腦教授、機器學習專家 Mark Riedl 對媒體表示,ChatGPT 背後的技術並不一定比 Google 和 Meta 更好。但 OpenAI 公開語言模型,讓公眾使用這一行為,帶來了極大優勢。
深度學習三巨頭之一、Meta 研究院院長 LeCun 對媒體表示:「(ChatGPT)這不是什麼革命性的東西,儘管公眾是這麼認為的」,「這是很好的組合,這是很好的做法。」不僅如此,剛剛離職的 OpenAI 的前產品負責人 Fraser 表示贊同 LeCun 的觀點,並說「這本不該引起爭議」。
LeCun 在 Twitter 上解釋,「我不是批評 OpenAI 的工作和他們的主張。我試圖糾正公眾和媒體的看法,他們認為 ChatGPT 是一個令人難以置信的全新的、創新的、獨特的技術突破,遠遠領先於其他所有人,事實並非如此。」
大公司差不多同時期開始研究大型語言模型。第一個重要的技術突破是 2017 年Google的神經網路架構 Transformer,這也是從去年開始爆紅的生成式 AI 模型所用到的底層技術。Transformer 能夠讓機器在處理語言資訊時關注單詞之間的聯繫,並預測接下來會是什麼單詞。這大大增強了模型對於語言的理解能力。
隨後,Google於 2018 年發表了預訓練大模型 BERT;2021 年,OpenAI 發布了預訓練模型 GPT-3,已經表現出了很強的寫作、對話能力,但也表現出致命缺陷,就是「口無遮攔」,會生產極端種族主義、暴力等相關的內容;同年,Google 發布了預訓練模型 LamDA,也顯示出了良好的對話能力。
ChatGPT 最初的項目名稱為「Chat with GPT-3.5」,是在 GPT-3 與即將發表的 GPT-4 之間,OpenAI 因為擔心對手公司提前發表聊天機器人 ChatBot,而臨時確定的專案。工作人員接到的任務是,在兩周之內快速發表一個聊天機器人。讓所有人驚訝的是,它能在短時間吸引如此多的使用者,並加速了 AI 進入搜尋產品的進程,隨之引發了 Google 與微軟間的較量。
ChatGPT 走紅不久,Google 內部便開始擔憂了起來。「對於 Google 來說,這是一次錯失良機嗎?畢竟我們已經擁有 LamDA 一段時間了。」
12 月初的內部會議上,這個問題為員工們所關注。那時,Google AI 部門主管傑夫・迪恩 (Jeff Dean) 表示,Google擁有類似能力,但如果出現問題,代價將更高,因為人們必須相信從 Google 得到的答案。在技術公開和產品化上一直行為保守,對聲譽風險的擔憂是重要因素。
Google 員工們表示,多年來,員工一直在提議將聊天功能加入搜尋,這也是很明顯的演變趨勢。但是 Google 有充分的理由不著急反覆運算,不僅僅因為返送更有針對性的回答會減少廣告空間。而是如果 Google 提供的聊天機器人給出一個不健康或者抄襲而來的答案,就會增加責任風險。而就外部環境而言,Google 這幾年一直面臨反壟斷審查或訴訟,再增加這樣的道德風險絕對會帶來更大壓力。
如今,像墨菲定律起作用一樣,Bard 所犯的錯誤,恰恰是 Google 原先所擔心的問題,並在 Google 與微軟第一次亮相比拼中,帶來了負面效應。在技術封裝進產品這一步上,Google 因前期保守、倉促應戰而落後。
摩根史坦利的分析師 Brian Nowak 表示,語言模型可能搶佔市場占有率,並擾亂 Google 作為網際網路使用者入口的地位。從 Bing App 下載量增長 10 倍來看,這個擔憂絕對不是空穴來風。但基於 Google 的技術儲備,他也表示,期待 Google 更多的產品表現。
搜尋引擎戰之下,AI 成為戰略重心
無論是微軟還是 Google,目前兩家發表的新產品尚未完全放開使用。微軟的 New Bing 需要登記 WaitList,等待功能發放。而 Google 的 Bard 目前僅開放給受信任的測試人員,在這之後,將是依託 LaMDA 羽量級模型版本發布。「在未來幾周,我們會繼續向更廣泛的公眾開放此服務。」Pichai 在部落格文章中寫道。
因此,產品模型僅僅是做了示範,還沒有大規模發放到使用者手中體驗。之前人們所關心的問題,比如胡說八道、大規模使用的成本問題,目前還只停留在討論階段。
成本是必然需要面對的因素。據瞭解,Google 未來會優先使用羽量級版本的 LamDA,就是出於運算成本的考慮。
此前,OpenAI CEO Altman 表示,ChatGPT 回覆一次的成本為幾美分。Brian Nowak 估計,ChatGPT 每次查詢的成本約為 Google 每次傳統搜尋查詢成本的 7 倍,如果依託微軟的雲端服務 Azure 提供最低價,可以降低到傳統搜尋成本的 4 倍。考慮到搜尋是一個日均百億級使用次數的高頻行為,長期運行,潛在的成本增加是一個天文數字。
微軟官方披露,這次的 New Bing 背後驅動的是下一代語言模型,比 ChatGPT 更強大,也是專門為搜尋制定的。在發表會後的問答環節,對於成本問題,微軟的態度也很乾脆,「我不打算回答這個。」對於模型胡編亂造的問題,回應則是「我們從一開始就在做這件事。我們正在衡量該模型在搜尋結果中哪些地方沒有站穩腳跟,但它並不完美。」
納德拉說,「AI 將從根本上改變每一個軟體服務類別,從最大的軟體服務類別——搜尋開始。」搜尋引擎的變革剛剛開啟,依舊有許多尾部問題需要花費時間解決。從產業角度而言,它或許意味著,以大模型為基礎,AI 進入了全新的階段。這或許是微軟、Google、Meta 甚至蘋果,以及中國的阿里、百度都在戰略層面開始規劃的原因。
目前,Google 和微軟都處於類似的時期,主要業務疲軟。前不久,兩家都交出了一份不太理想的 2023Q2 財報,接下來業務增長的預期也不高。Google 廣告收入出現上市以來第二次下滑,雲端業務雖然保持兩位數增長,但同期對比增速正逐季回落。微軟主要的 Office 和 Azure 業務增速都在放緩。整體業績疲軟,收入增速為 2%,持續下滑。納德拉表示,微軟在 2022 年末就面臨著核心業務 Windows+Office 的業績下滑。
與此同時,兩家都在財報電話會上強調了 AI 作為戰略的重要性。
Google 表示,從下個季度開始,其研究機構 DeepMind 的財務狀況將單獨列出,體現在季報中。「AI 已經成為 Alphabet 的戰略重心,我們也看到 AI 領域潛藏的巨大機遇。目前 DeepMind 的研發領域將成為 Alphabet 未來產品組合的核心。」前不久,Google 便通過投資 Anthropic 3 億美元,成為其雲供應商。
微軟主要強調了在過去的三年多時間裡,微軟致力於訓練超算、打造推理基礎設施,為未來 AI 進入應用程式做準備。也就是意味著,微軟的雲端設施和服務,需要嵌入更強的 AI 能力,「對於 Azure 來說,AI 將是其核心組成部分」、「我們希望為大家提供的也遠不止 Azure OpenAI 服務。如何將 OpenAI 與微軟的 Azure Synapse 分析服務相結合等,都在我們的考慮範圍之中。」
不難看出,無論是 Google 還是微軟,都將會以大模型為基礎設施,加快產業布局,其中的重要部分包括嵌入 AI 能力的雲端設施、基於大模型的 API。Forrester Research 公司 AI 分析師 Rowan Curran 表示,微軟可以利用目前與 Open AI 的合作與熱度,獲得更重要的短期回報,這便是擴大 Azure 、OpenAI API 及更廣泛 AI 和機器學習平臺的需求。
長期來看,當搜尋產品大規模上線,穩定提供服務,可靠性和成本將成為更重要的影響因素,這也將考驗雙方基礎設施的能力。
大模型領域獨角獸 Stability AI 的創始人 Emad 曾表示,ChatGPT 將打敗 Google 的故事聽起來有點愚蠢。因為 Google 擁有最好的 LLM(大型語言模型)全套團隊和定製晶片,沒有競爭對手可以在創新、成本或者市場上和其較量。這些基礎設施包括 PalM(單項語言模型)、LAMDA、Chinchilla(少量參數語言模型)、MUM(多工統一模型)、TPU 等。
很明顯,Google 首戰的表現出乎了所有人的預料。面對有 OpenAI 的模型能力加持、來勢洶洶的微軟,全世界見證了一場巨人的跌倒。
加入電腦王Facebook粉絲團