科技領域有些事情令人震驚,但也在情理之中——比方說一家陷入困境的公司的首席執行長失去了工作。當然,這個消息出乎意料,但仔細想想也是說得過去的。不過,其他一些消息卻既令人震驚又令人驚訝,Google今年 2 月份在巴黎進行的主題演講——這似乎是對微軟將 GPT 植入到 Bing 的公告做出的恐慌回應。
令人震驚的地方在於示範檔案之糟糕:新內容幾乎沒有,幻燈片和演講者不同步,當其中一位簡報者開始做示範時才意識到手頭沒有用於展示用的手機,則是糟糕到極致的表現。
令人驚訝的地方在於,Google在人工智慧方面居然會遭遇那麼大的困境,這不僅僅是因為 AI 似乎是Google的甜點:事實上,Google多年來一直在Google I/O 上大談特談人工智慧,而且我發現該公司對自身工作搭建的描述框架一直都非常令人印象深刻。回到 2016 年那時候,我摘錄了Google CEO Sundar Pichai 關於如何在自家產品使用機器學習的長篇大論,並寫道:
請留意其特殊性——對於主題演講來說這似乎講得太多了,但這絕對不是廢話。毫不奇怪:Pichai 所說的一切正是創建Google的目的。這與巴爾默高呼自己是多麼的熱愛 Windows 沒有什麼不同:Windows是微軟使命的產品代表,這也許給這位因為未能帶領微軟繼續前進而被廢黜的CEO帶來了一絲寬慰。
接下來的 30 分鐘非常棒:Google Now,尤其是 Now on Tap,給人留下了非常深刻的印象,Google Photos 看起來也很棒。而且,我可能要補充說一句,它有一個殺手級的口號:Gmail for Photos。當你正在做你註定要做的事情,也是你也是全世界最擅長做這件事情的人時,表達自我就是這麼的簡單明瞭。
兩年後,我對 Google I/O 的評價是很無聊,但那是恭維的意思:
所以我才認為Pichai「無聊」的開場白其實很棒。現在已經沒了早期Google I/O的那種好鬥,堅持說 Android 將會取代 iPhone。現在它也沒有上周 Nadella 描繪的宏偉願景,或者蘋果產品發表時的那種興奮。這裡有的是一種確定感,而且幾乎是舒適感:Google就是要組織全世界的資訊,鑒於 Pichai 認為未來屬於人工智慧,尤其是運行於資料之上的機器學習派生,那麼這也就意味著Google只需要做自己就可以在這個新世界裡取得成功了。無論是對個人還是對公司而言,這都是最好的去處。
那一年,Google發明了 transformer,這項關鍵發明為給 ChatGPT 提供動力的大型語言模型奠定了基礎,而 ChatGPT 在過去六個月的時間裡似乎讓Google十分地心煩意亂。今年的 Google I/O 令人印象深刻的地方在於,它成功地將Google最近幾次 I/O 的引人注目之處——其明確的 AI 能力以及體現這些能力的產品——與你的緊迫感和進取心結合了起來。而後面這兩種情緒,是你希望從一家多年來第一次感受到了威脅的公司身上能看到的東西。
Google人工智慧的進化
我在上面提到過,Google介紹 Google Photos 的時候稱之為 Gmail for photos;Pichai 的開場白裡面有兩張幻燈片我最喜歡,上面展示了這兩款產品如何可以成為Google不斷發展的人工智慧能力的證據。Gmail 從「Smart Reply」(智慧型回復)演變到「Smart Compose」(智慧型撰寫)再到「Help Me Write」(幫我寫):
Google Photos 從「Find Photos」(尋找照片)演變到「Magic Eraser」(魔術橡皮擦)再到「Magic Editor」(魔術編輯器):
這種展示方式非常聰明,強化了Google在人工智慧領域浸淫的時間不短了,這是真的!這也提醒我們,Google的一大優勢與微軟相似:該公司擁有一系列面向使用者的產品,而且是在以真正有用的方式展現其人工智慧功能。Pichai 指出,Google有 15 款產品的使用者超過了 5 億:
有 6 款產品使用者達 20 億:
不過,也許主題演講裡面最引人注目的地方是 Pichai 的開場白:
作為一家人工智慧優先的公司,我們的這條道路已經走過七年了,我們正處在一個激動人心的轉捩點上,有機會讓 AI 對人類、企業、社群和每個人都變得更有幫助。一段時間以來,我們一直在應用人工智慧來讓我們的產品變得更有説明。借助生成式 AI,我們正在邁出下一步。憑藉著大膽和負責任的做法,我們正在對所有的核心產品進行重新構想,其中也包括搜尋。
值得注意的是,「大膽」放在了「負責任」的前面;Google I/O 發出的最重要的訊息是,Google要參與這場遊戲,而且要贏,正如 Pichai 所指出的那樣,這也包括了搜尋。
生成式人工智慧與搜尋
在Google I/O 2019(我發現這一場開發者大會也十分令人印象深刻)之後,我提出了Google的長期商業模式問題:
更重要的是,雖然 Google Assistant 繼續給人留下了深刻印象——將所有內容都放在設備上有望在速度上取得重大突破,而速度是現在 Assistants 的主要限制因素——但Google的商業模式是什麼尚不清楚。很難想像有什麼東西能像搜尋廣告那麼賺錢,它不僅受益於精確定向——使用者明確地說出了自己想要什麼!—— 而且它們還有一種拍賣形式,利用使用者來選出獲勝者,並激勵這些獲勝者為與該使用者建立持續關係的機會多付錢。
正如我所預料的那樣,Google採用了混合的做法:大多數搜尋都不是商業搜尋,因此Google將把生成的文本放在頂部:
對於確實具有商業可能性的搜尋,廣告仍將獲得頭牌地位:
這似乎是一種合理的做法,因為非商業搜尋不管怎麼說都更有可能從人工智慧中受益;與微軟將 Bing Chat 嫁接到傳統搜尋的做法相比,這也是一種看起來更吸引人,而且是的,也是更大膽的做法。
當然,微軟其實已經推出了新的搜尋體驗,而 Satya Nadella 對蠶食Google市場占有率和利潤率的渴望仍然是個威脅:生成這些答案需要花錢,而且Google的模型在同等條件下進行比較的話,可能還是要落後於 GPT-4 的。儘管如此,今年的 Google I/O,尤其是這個示範,是對 Sam Altman 在 Bing 發表後告訴我的這番話非常強烈的回應:
我認為這對我們雙方來說都很棒。我覺得,這對我們雙方都有很大的好處。我們將會發現這些新模型可以做什麼,但如果坐在搜尋的壟斷位置上不思進取,現在被迫思考如何應對一個世界,一個對搜尋以及新的廣告單位的貨幣化方式構成真正挑戰,甚至可能還會暫時面臨下行壓力的世界的話,對此我的感覺是不會好的。
這些挑戰依然存在,但至少「昏昏欲睡的搜尋壟斷」已經甦醒。
持續性創新與顛覆性創新
如果有什麼是每個人都可以確定的話,那就是人工智慧具有非常大的顛覆性;不過,在今年 1 月的《人工智慧與五巨頭》中,我注意到人工智慧似乎更有可能是一項持續性創新:
2022 年的故事是人工智慧的湧現,首先是圖像生成模型,包括 DALL-E、MidJourney 以及開源的 Stable Diffusion,然後是 ChatGPT,第一個取得重大突破的文本生成模型。在我看來,這是技術進入了新紀元。
不過,要確定那個新紀元可能會如何演進,做一件事情會很有用,那就是回顧一下 26 年前有史以來最著名的戰略書籍之一:克萊頓·克里斯坦森(Clayton Christensen)的《創新者的困境》(The Innovator's Dilemma),尤其是關於不同類型創新的這段話:
大多數新技術都會推動產品性能的改善,我將這些技術稱為「延續性技術」。一些延續性技術可能不具有連續性,或者在本質上具有突破性,而其他一些則在本質上屬於漸進性技術。所有的延續性技術所具有的共同點就是,它們都是根據主要市場的主流消費者一直以來所看重的性能層面來提高成熟產品的性能。特定行業的大多數技術進步從本質上說都具有延續性……
顛覆性技術給市場帶了與以往截然不同的價值主張。一般來說,顛覆性技術產品的性能要低於主流市場的成熟產品,但它們擁有一些邊緣消費者(通常也是新消費者)所看重的其他特性。基於顛覆性技術的產品通常價格更低、性能更簡單、體積更小,而且通常更方便消費者使用。
回過頭看,透過觀察既有公司在創新進入市場後的表現,似乎很容易就能確定創新屬於延續性的還是顛覆性的:如果創新是延續性的的話,那麼既有公司會變得更強大;如果屬於顛覆性,那大概是初創公司收割掉大部分價值。
我在那篇文章得出的結論是,對於蘋果、亞馬遜、Meta 和微軟來說,人工智慧將是一項持續性創新;最大的問題是Google和搜尋:
那篇文章假設 Google Assistant 會作為獨家提供產品,用來為Google手機提供差異化優勢;結果表明這個假設是錯誤的,但分析的基礎仍然有效。在過去七年的時間裡,Google的主要商業模式創新一直是將更多的廣告塞到搜尋裡,這種策略在移動設備上特別有效。而且,說句公道話,Google最賺錢的搜尋類型,比如旅遊、保險等,無論如何也許都不太適合聊天介面。
不過,這只會讓Google管理層更加擔心,即在特定的搜尋環境下,生成式人工智慧可能代表一種顛覆性創新,而不是延續性創新。顛覆性創新比不上現有的,至少在開始時是這樣的;這就是為什麼它很容易被管理者忽視的原因,只要告訴自己,他們當前的產品更好(這個倒沒錯),就可以避免思考商業模式的挑戰。當然,問題是顛覆性產品會變得更好,而另一邊現有產品卻變得越來越臃腫,越來越難用——這聽起來很像Google搜尋當前的發展軌跡。
我不是說Google巔峰已過。我之前曾經下過這樣的結論,但錯得離譜。不過,犯錯的往往是時間問題:是,Google是擁有自己的雲服務,而 YouTube 的主導地位似乎有增無減,但即便多年來搜尋一直在製造現金和利潤,它的巔峰軌跡似乎已經很清晰了。
也許未必。我傾向於認為,顛覆性創新其實是很少見的,但當出現顛覆性創新時,既有公司基本上不可能做出回應:他們的商業模式、股東以及最重要的客戶讓管理層無法做出回應。不過,如果確實做出了回應的話,那麼既有者的回應實際上證明了該創新實際上不是顛覆性的,而是持續性的。
為此,我會把這次的Google I/O 大會作為證據,證明人工智慧實際上對於包括Google在內的所有大型科技公司來說屬於一項可持續技術。此外,如果真是這樣的話,那麼這就是對搜尋公司不用那麼悲觀的原因,因為預期他們擁有領導地位的所有理由——從能力到資料到基礎設施再到多到過剩的消費者接觸點——依舊。儘管如此,目前形式的搜尋,尤其是它的廣告模式所面臨的挑戰仍然存在。
革命或校準
另一個我一直感到困惑的問題是,人工智慧是否屬於 Carlota Perez 在《技術革命與金融資本》(Technological Revolutions and Financial Capital)一書中所記載的那種技術革命。
再一次,傳統觀點認為人工智慧代表了一種全新的範式。關於這一點,沒有人能比比爾·蓋茲發出的聲音更有力了:
人工智慧的發展與微處理器、個人電腦、網際網路以及手機的發明一樣重要。它將改變人們工作、學習、旅行、獲得醫療保健與相互溝通的方式。整個行業都將圍繞著它重新調整。企業要靠運用人工智慧的能力來實現差異化……
我有幸參與了個人電腦革命和網際網路革命。我對此時此刻同樣感到興奮。這項新技術可以幫助世界各地的人們改善生活。與此同時,世界需要確立規則,好讓人工智慧的任何不利因素都遠遠小於帶來的好處,並讓人人都能享受到這些好處,不管他們住在哪裡,或有多少錢都能享受。人工智慧時代充滿了機遇與責任。
蓋茲暗示個人電腦革命、網際網路革命和人工智慧革命是離散事件,但它們也可以被視為數位化的決定性經濟特徵——零邊際成本——對資訊的三種應用:
- PC 使得資訊複製的邊際成本為零;這就是文字處理器、試算表以及比爾·蓋茲專門研究的其他一些生產力應用等突破的基礎。
- 網際網路使得資訊分發的邊際成本為零。這帶來了一個以充裕而非稀缺為基礎的市場,進而誕生了像Google這樣的聚合者。
- 人工智慧使得資訊產生的邊際成本為零(好吧,相對於人類而言幾乎為零)。正如我去年所寫那樣,生成模型將創意創造與創意實現分開,然後再可以以零邊際成本複製和分發。
此外,這三場革命必須按順序進行:如果沒有各異的電腦,如果這些人工智慧模型不是在網際網路訓練的,網際網路的概念本身就沒有意義。
我還要指出,這樣的發展與我在 2020 年的那篇《開始的終結》裡面提出的觀點是一致的:我在那篇文章中的論點是,各種技術革命都是朝著無處不在的連續計算趨勢的體現;我在那篇文章裡面沒有提到人工智慧,但人工智慧似乎是一種持續性創新的事實支持了這樣一種觀點,即科技開始階段的大贏家將成為未來科技發展的基礎。
就Perez而言,她認為當前的革命仍處在安裝階段;在她看來,現在還少了一個要素:與政府的協調以及由政府主導的協調。
Bard與歐盟
Google在這次 I/O 大會上還發表了一個東西,那就是現在 ChatGPT 的競爭對手 Bard ,現在已經面向廣泛受眾開放了。而更有趣的消息是它還沒開放的地方;來自 Android Authority:
- Google在其 I/O 開發者大會上宣布,其 Bard 聊天機器人將面向 180 個市場開放。這象徵著這個平臺的一次重大擴張,因為一開始發表的時候它的適用範圍非常有限。不過,加拿大和歐洲不並在受支持市場的名單之中。現在,Google在對 Android Authority 問詢電子郵件的回復中暗示了那兩個市場未被納入進來的可能原因。一位Google發言人指出:
- Bard 很快就能支援 40 種流行語言,雖然我們還沒有最終確定拓展計畫的時間表,但我們會逐步地、負責任地推出,在駕馭這些新技術的時候,會繼續成為對監管機構有幫助作用、積極參與的合作夥伴。
- 該公司斷言自己是「對監管機構有幫助作用、會積極參與的合作夥伴」,這表明出於監管方面的考慮,Bard 目前繞開了歐盟和加拿大市場。
一個傳統觀點又一次出現:「哈哈,愚蠢的歐洲,愚蠢的歐盟監管政策,這意味著他們將錯過人工智慧」,而且,就目前而言,這種說法顯然是對的。不過,要是說Google、微軟、Meta 等科技巨頭出於自己的最終利益,確實將成為「對監管機構有幫助作用、會積極參與的合作夥伴」 似乎挺有把握的。畢竟,思考一下這些監管舉措可能是什麼樣子就知道了。從加拿大開始,來自同一篇文章的這一段:
加拿大立法者最近頒布了旨在規範人工智慧的法規。人工智慧與資料法案 (Artificial Intelligence and Data Act ,AIDA) 要求對人工智慧系統進行評估、風險管理、監控、資料匿名化、透明度和記錄保存等操作。 對於違規者,AIDA 還將處以最高占公司全球收入 3% 或 1000 萬美元的罰款。
大量的繁瑣程式絕對會讓Google等人難以應付,但考慮到它們的規模和資源,其實應付不難;不過歐盟擬議的人工智慧法規會帶來更大的監管負擔。
值得注意的是,我前面跟蹤的技術這條發展弧線正朝著強化政府控制的方向傾斜:個人電腦賦予個人難以置信的自由和能力,但網際網路向聚合者仲介網路的轉變賦予了政府一個明顯的堵點,讓政府可以在這些堵點上推動對分發進行控制(各國政府或明或暗都在這麼做)。與此同時,人工智慧被主要參與者掌握意味著對實際資訊的生成有直接的控制點。
這證實了 Perez 的論點,也就是這場 IT 革命尚未實現與政府的校準:這在之前從結構上來說是不可能的。上述校準是否真的像 Perez 預測的那樣意味著「黃金時代」即將到來還有待觀察。值得注意的是,這種校準的具體化非常符合Google的利益:阻止真正顛覆性技術的最佳手段是對它們進行監管。
人工智慧的激進改革(Radical Reformation)
歐盟監管政策的另一個方面似乎更加險惡。來自 Technomancers.ai:
- 一個大膽的舉措是,歐盟修訂的人工智慧法案禁止美國公司如OpenAI、亞馬遜、Google和IBM等提供對生成式 AI 模型的 API 存取。週四由委員會投票的這項修訂案規定,如果向歐洲提供未經許可的生成式模型的話,將處罰美國的開源開發者及軟體分銷商(如GitHub)。雖然這項法案給傳統機器學習模型開了開源的例外,但明確禁止了生成式系統的開源安全港條款。
- 任何模型,如果未事先取得廣泛且昂貴的許可就面向歐洲提供的話,將導致公司面臨高達 2 千萬歐元或全球營收 4% 的巨額罰款。開源開發者和託管服務(如GitHub)作為進口商將對提供未經許可的模型負責。從本質上來說,歐盟是在命令美國科技巨頭讓美國中小企業不要做了——並威脅對美國技術生態體系的重要組成部分施加制裁。
- 如果該法案頒布的話,執法權將不在歐盟成員國掌控之中。根據此項人工智慧法案,協力廠商可以起訴國家政府要求處罰。該法案具有域外管轄權。歐洲政府可能會被協力廠商強迫與美國開發者和企業發生衝突。
這是一項極易引發爭議的指控,但作者 Delos Prime 援引了擬議的法律來支持這種說法,我認為這個解釋是合理的。像這樣的提議一樣,沒有明確的語言,比如禁止 API 存取;相反,Prime 的結論是,這是有效的結果,例如,API 提供商對其 API 的所有使用負責,就像開源作者和分發者將對其模型的所有使用負責一樣。一如以往,類似提案通常沒有明確的語言,比方說禁止 API 存取;相反,Prime 得出的結論是,比方說,API 提供商將對其 API 的一切使用負責,就像開源作者和分發商將為其模型的一切使用負責一樣,這樣的實際效果跟禁止 API 存取一樣。
美國將如何回應這樣一項法律顯然是一個非常重要的問題:有理由認為,讓美國公司對根本就是開源的模型負責是對主權的公然侵犯;我敢肯定,歐盟會辯解稱,美國網際網路公司在輸出美國價值觀(如言論自由)其實是一回事。
這就是回顧歷史的有趣之處,尤其是我一直認為與網際網路最類似的一項發明:印刷機。我在《網際網路與平民階級》中寫道:
中世紀的時候歐洲的主要組織實體是天主教。相應地,天主教會事實上也壟斷了資訊的傳播:大多數書籍都是拉丁文的,是由修道士辛苦地手工抄寫出來的。在他們的土地上,貴族與平民的不同成員之間有著一定程度的種族類似性,但在天主教會的庇護下,那主要是獨立的城邦國家。
印刷機改變了這一切。突然之間,對天主教的批評跟百年前揚·胡斯(Jan Hus)的批評極為類似的馬丁·路德,不再受限於只能將他的信仰傳播到當地了(Hus的影響範圍是布拉格),相反他的那些理念可以傳播到整個歐洲;貴族抓住了這個機會,用複合其本地利益的方式去解釋聖 經,進而逐漸擺脫了天主教會的控制。
同時,印刷書籍的經濟學與手工複製的經濟學有著根本的不同。後者純粹是一項營運費用:產出完全取決於勞動力的投入。不過,前者主要是一項資本支出:首先,建造印刷機屬於資本支出,其次,要給一本書排字。支付這些巨額的前期費用的最佳方式是一本能賣出去的書要盡可能多地印。
那麼,如何才能最大限度地提高銷量呢?答案是用一種特定語言中使用最廣泛的方言進行印刷,這反過來又會激勵人們採用這種方言,進而令整個歐洲的語言標準化。推而廣之,這加深了具有共同語言的城邦之間的親和力,尤其是在幾十年的時間裡,隨著書籍和後來的報紙形成了一種共同的文化之後就更是如此。這種合併的速度各不相同——英國和法國的融合比德國和義大利早幾百年——但幾乎在每一種情況下,第一等級都不是天主教會的神職人員,而是國家君主,即便君主將權力讓給了一種新的,以柏克(Burke)為代表的賢能貴族。
這場巨變的高潮是西發里亞和約(Peace of Westphalia,威斯特伐利亞體系就是因此得名的);引自維基百科:
西發里亞主權體系(Westphalian sovereignty),是國際法的建立基礎,即:
- 每個主權國家對其領土和國內事務擁有主權,排除所有外部勢力侵擾;
- 各國互相承認主權並互不干涉他國內政;
- 每個國家(無論大小,或強或弱)的主權平等。
該學說以 1648 年簽署的《西發里亞和約》命名(該和約的簽署象徵著三十年戰爭和八十年戰爭的結束)。其基礎是讓博丹的國家理論和雨果格勞秀斯的自然法學說。它是現代主權國家國際體系的基礎,並載入《聯合國憲章》,其中規定「本憲章不得認為授權聯合國干涉在本質上屬於任何國家國內管轄之事件。」
從全球化到人道主義干預再到網際網路,威斯特伐利亞體系面臨著諸多挑戰。歐盟監管人工智慧的嘗試就是一個很好的例子:鑒於網際網路沒有邊界(除了個別),歐盟似乎準備讓美國公司對在美國伺服器上發表的模型負責;就Google而言,目前它發現單方面把歐盟排除在服務範圍之外是明智選擇,否則的話就會面臨與 OpenAI 同樣的挑戰。
從某種意義上說,這場鬥爭可以類比為歐洲的新教與天主教之戰;在這種情況下,美國科技公司是通用網際網路,而歐洲則尋求保護自己的主權。或者,也許你更喜歡一個相反的類比,即歐洲正在尋求將其信仰出口到世界其他地區,並且鑒於讓一款產品遍布各處的經濟激勵之大,歐洲很可能會成功。
不過,開源部分卻截然不同:在本地運行的開源模型對蘋果來說可能是一大福音,但對於Google和 OpenAI 等中心化的公司來說,這才是真正的顛覆性威脅。換句話說,開源是不同於監管機構以及中心化營運商的協力廠商力量;它們是激進改革。
在看到 Owen Cyclops 關於美國宗教的主題文章時,我萌生了這個想法。Owen Cyclops 的觀點是,印刷機導致了三個不同的宗教團體的誕生:天主教徒、新教徒,然後是一大群受到前兩者迫害的邊緣團體,而後者在美國歷史上發揮了重要作用。
美國似乎不是一個新教國家。美國是一個激進改革國家。
—— owen cyclops (@owenbroadcast) 2023 年 4 月 23 日
按照這種觀點,印刷機的應用對現代歐洲形成的影響是不完整的;你還得考慮邊緣地區,也就是美國。
而且,推而廣之,如果從個人電腦到網際網路再到人工智慧的數位化轉型可產生堪比印刷機的影響的話,那麼眼前的問題不僅僅是民族國家的性質會如何演變,還有邊緣地方的潛力如何。
誠然,這篇文章推測的成分頗多,有點牽強附會,尤其是考慮到我是從討論 Google I/O 開始的。不過,我認為重要的是,Google已明確表示把人工智慧看作一項持續性創新,並打算在自家的業務(包括搜尋在內)中全面實施生成式人工智慧。當然,這意味著在這種情況下必然要有仗要打:經歷了過去十年的停滯不前之後,我們從這些大型科技公司身上看到的進取心和好勝心是令人耳目一新的變化。
與此同時,所有科技巨頭都參與其中,並且鑒於其超國家的性質,它們將不可避免被激勵成為「對監管機構有幫助作用、會積極參與的合作夥伴」,這表明真正的戰鬥會發生在中心化模型與開源模型之間:普世的天主教會與國家性的新教徒之間有衝突,但二者對再洗禮派等持一致的鄙視態度。
從這個角度來看,這些擬議中的歐盟法規只是數位時代這場決定性戰爭的第一輪集中攻擊:究竟是中心化(因此可控)的實體會取勝,還是處在邊緣的,真正探索人工智慧潛能(不管好壞)的開放模型最後能開花結果?
加入電腦王Facebook粉絲團