搜尋引擎,可能真的要變天了!
Google 終於要迎來它 25 年來最大的改變,Google宣布了開始內測開放「生成式搜尋平臺(Search Generative Experience,SGE)」,並逐步捨棄那些甚至是臭名昭著的十條藍色連結(10 Blue Links)。
1998 年,賴利·佩吉與謝爾蓋·布林憑藉 PageRank 演算法,上線了 Google 網路搜尋引擎,最初的它是長下面這個樣子:
而 Google,也是我們現在所熟悉與理解的幾乎所有的搜尋引擎,輸入問題後它會透過 PageRank 或者其他更加複雜的搜尋推薦演算法,為我們排序出與我們的問題最相關的網頁作為答案,以這些「藍色連結」的形式羅列如下,我們閱讀這些網頁的標題,瀏覽下方的摘要,動腦筋判斷點進某條藍色連結會不會出現我們期望中的答案。
25 年,這樣子的搜尋引擎塑造甚至定義了我們的網路生活,25 年,我們也幾乎無數次的與這個小小的搜尋框與那些或真或假的藍色連結打交道,點進、退出、點進、停留、滑鼠滑動、定位到關鍵資訊,或摘錄或收藏,搜尋引擎作為一種不一樣的媒介,極大的延申了我們認知世界的邊界,25 年讓我們對搜尋引擎的熟悉彷佛自己的身體,心裡有種確信輸入某串字元後眼前會出現這些排列整齊的連結:
Google is done.
— josh (@jdjkelly) November 30, 2022
Compare the quality of these responses (ChatGPT) pic.twitter.com/VGO7usvlIB
因此,在去年 12 月,ChatGPT 剛亮相不久時,很多文章提到 ChatGPT 有可能會顛覆所有傳統的搜尋引擎時,我們還認為這些大模型革傳統搜尋引擎的命還只是一個誇張的修辭手法,評論區裡大家也都認為在那時談「革命」,談「替代」,甚至談「威脅」都只是一個天方夜譚的說法,雖然沒有人否認這項技術帶給我們對「搜尋本質」這個問題的思考以及思考背後幾乎無限的想像力,它迫使我們開始逐漸意識到這樣一個問題「搜尋的答案,其實不一定只能是那十條藍色的連結」
如果讓時間快進,這短短半年我們與各位一道經歷了一場基於大規模語言模型(LLMs)的狂飆突進運動,新技術、新應用、新問題、新實驗如雨後春筍,有人認為新一代的搜尋引擎會以「使用者智慧助手」的形式出現,而這種智慧助手不可能透過傳統搜尋引擎實現,它的核心必然是基於以 ChatGPT 為代表的大模型,儘管認為那時 ChatGPT 距離真正的搜尋引擎還有三個沒有解決的問題,分別是機器幻覺導致的真實性問題、模型的知識更新問題以及成本問題。
穿過這六個多月的技術井噴,而現在,在當下,Google 終於要迎來它 25 年來最大的改變,Google宣布了開始內測開放「生成式搜尋平臺(Search Generative Experience,SGE)」,並逐步捨棄那些甚至是臭名昭著的十條藍色連結(10 Blue Links),傳統上,陪伴了我們 25 年的我們熟悉的一整套搜尋流程將會被革新,在未來當我們輸入了問題,比如如果我問「如果我家有三個小孩並且帶著一條寵物狗,布萊斯峽谷與拱門國家公園公園哪個更適合我們進行家庭旅行?」,答案將不再是一條語焉不詳的「比較布萊斯峽谷與拱門國家公園」的旅遊筆記連結,而是直接告訴我們「雖然這兩個公園都禁止寵物狗在未鋪設好的小徑上活動,但布萊斯峽谷有兩條鋪設好的小徑,允許寵物狗進入。」
與此同時,SGE 改變的不僅僅只是單純的搜尋、依託於搜尋的電商、廣告等等都將迎來一場革命,如下圖展示的,在搜尋產品時,我們不再需要面對那些「xx折疊自行車xx英寸非變速男女式成人學生兒童城市通勤單車白紅」的符號堆砌,而是可以直接獲得產品圖片、產品說明、最新評論、分數、價格以及其他相關商品的對比。
毫不誇張的說,SGE 完全可以改變過去搜尋引擎的資訊整合方式,不僅僅在於一個顯示介面的重新排列組合,而是整個「搜尋」的關鍵流程發生了變化,答案將是以更加直接的方式呈現在使用者面前,我們不再需要貨比三家般的在多個連結間來回跳轉,也不用花心力判斷那個連結背後預設的網址的真偽,更不用在面對一些個性化問題時在不同頁面間組合資訊完成小心翼翼的推斷,搜尋將真正變成一問一答的過程,答案將直接化的呈現在我們的面前。
但是回到去年 12 月提到的三個問題,機器幻覺導致的真實性問題、模型的知識更新問題以及成本問題,拋開成本問題不談,顯然 SGE 的未來還面臨著「這種 AI 產生的摘要如何保證真實性」以及「模型更新」的問題,在模型更新方面, Google 的 Bard 幾乎有著近乎即時的時效性。同時,學術界也有對模型更新問題進行的研討。
而對於機器幻覺所有可能導致的大模型錯誤回答的問題,可能是更加關鍵的一個問題,一直有使用者反應,比如問大模型「新薩爾達什麼時候發表?」得到的答案卻是 2017 年 3 月,即「曠野之息」的發表時間而非 2023年 5 月 12 日「王國之淚」的發表時間。對於這個問題,我們曾經構想了大模型搜尋引擎化的兩步走,即從傳統搜尋引擎為主大模型為輔到大模型為主傳統搜尋引擎為輔,無疑,當Google的 SGE 正式向大眾開放時,大模型搜尋引擎化也就真正到了大模型為主傳統搜尋引擎為輔的新階段,即使用大模型作為搜尋答案的主要提供者,而使用傳統搜尋引擎作為驗證答案真實性與否的輔助工具,在 SGE 中,可以看到一組卡片在大模型提供的回答的右側,這些卡片對應連結作為大模型答案的證據。
回到文章開頭,搜尋引擎變天了,是的,如果去年 12 月的我們還無法相信陪伴了我們 25 年的搜尋典範將被大模型以直接問答的形式取代,那麼在今天伴隨著 SGE 的出現,我們已經無法否認搜尋引擎的新時代已經悄悄的突然到來,從藍色連結到現在的私人助手式的回答,這些大公司大模型的軍備競賽也是催生了這 25 年以來 AI 應用的一個巨大高潮,可以看到舊的問題還沒有被完全解決,新的問題還在不斷提出,SGE 能否在搜尋真實性、隱私保護、模型更新等等方面適應那些被 1998 年 Google 搜尋的藍色連結培養出來的挑剔使用者的需求,SGE 又能否真正完美的代替傳統搜尋引擎成為真正理想中的私人智慧助手,且讓我們拭目以待,未來馬上就來!
SGE體驗
目前,SGE 功能需要先申請加入Search Labs 的 Waitlist,在排隊獲得資格後才可以嘗試與體驗 SGE 的功能,並且目前 SGE 功能尚不支援中文,只能使用英文進行體驗。
加入電腦王Facebook粉絲團