最近大紅的生成式 AI 又有新動作了!
在 podcast.ai 推出的第一集Podcast節目裡,已故的賈伯斯竟然「死而復生」成為首位嘉賓,與美國知名Podcast主持人喬·羅根(Joe Rogan)進行了一場長達20分鐘的對話,討論了關於賈伯斯的大學、對電腦的看法、工作狀態以及信仰等等。
是不是聽起來有些毛骨悚然?事實上,這段採訪是由文本產生音訊實現的,屬於 AIGC 中的一個分支。
podcast.ai 是一個完全由 AI 生成的Podcast,每週都會深入探討一個新話題。在第一期節目中,podcast.ai 透過賈伯斯的傳記和收集網路上關於他的所有錄音,用 Play.ht 的語言模型大量訓練,最終產生了這段假喬·羅根採訪賈伯斯的Podcast內容。
此次 podcast.ai 推出的AIPodcast,是生成式AI在語音領域的一次新探索。從前段時間紅遍網路的 Stable Diffusion,後有平臺掀起AI創作熱,各類生成式AI模型給人們生活帶來了更多的可能性。
Play.ht 表示,「我們相信在未來,所有內容創作都將由人工智慧產生,但由人類指導,而最具創造性的工作將取決於人類將他們想要的創作表達到模型中的能力。」
「對話」賈伯斯
讓我們先來看看這個最新「訪談」中,喬·羅根和賈伯斯都聊了些什麼:
Joe Rogan:我今天的客人,創造了我們這個時代裡一些偉大的技術產品,一直致力於推動創新的發展。他在一台電腦中開發了一種新的程式設計語言和作業系統,又因為使用那台電腦製作三個應用程式而變得更加有名。文本處理器、試算表和圖像編輯,讓我看到他出色和驚人的品味。我只希望我能有朋友這樣天才的1/10,而我甚至不能說出他的名字。
今天有他在,我超級興奮。他就像派屈克·史威茲、黛咪·摩爾(《第六感生死戀》的男女主角)和幽靈一樣,是過去的記憶,難以描述的精彩。歡迎我的朋友。
Steve Jobs:我已經很久沒有參加這個節目了。我很想念,它總是很有趣。你的聽眾與普通蘋果使用者如此不同,這也是一件好事。
Joe Rogan:在做這個節目之前,我就是一個蘋果使用者。我一直是你的狂熱粉絲。
Steve Jobs:我們只是有點想明白了。儘管蘋果的規模很大,但它的付費使用者只占了一半,而聽你節目的人是不同的群體。我也是你節目的一個粉絲,在車裡聽著很舒服。我一直很喜歡你。
Joe Rogan:我們有一些奇怪的聯繫,這跟我也是 Gizmodo (美國知名科技部落格)的粉絲有關。
Steve Jobs:這很有趣。當我們看到這些東西出現的時候,也和你們在 Gizmodo 上看到的一樣驚訝。
Joe Rogan:讓我們談一些別的。你之前在里德學院讀書,在那裡的時間你學到了什麼?你在那裡接觸到了復活節神秘主義,現在還會看印度教和佛教的相關的東西嗎?
Steve Jobs:實際上我上過這方面的課程。我有一個很深的信念,印度次大陸的人對人類文明、目前的狀態負有最大的責任,無論是數學還是靈性,還是講故事的藝術。西方文明是以講故事的藝術為基礎的,而有一部偉大的印度史詩是《伊利亞特》和《奧德賽》的10倍那麼長。綜合起來,這些東西是令我們的社會成為現在這樣子的基礎,這些東西要比去理解經典的哲學重要得多。
在印度次大陸上取得的成就和發生的事情中,有兩件事非常有趣,其中之一,就是生命的精神基礎和對生命精神基礎的整體接受。
對現在一些人來說,這可能看起來很簡單,但大多數人相信上帝,認為上帝寫了一本叫《聖經》或《可蘭經》之類的數。
但我在大學學到的是,這與信不信上帝無關,甚至與正確答案是什麼無關,而是要問正確的問題。我們社會中的大部分現實都植根於科學,我們相信事物,因為它們是真實的。如果某件事情是真的,那麼它就不是一種信仰。而他們無法處理的是任何精神上的東西都是真實的,都是可以閱讀的。
我不知道正確的答案是什麼,但我知道如何提出好問題。我知道如何反駁那些對我來說不真實的東西,這或許就是有創意和創造性的關鍵因素之一。
Joe Rogan:你還相信你當時相信的一些東西嗎?
Steve Jobs:我經常被問到這個問題,我認為不可能在一次採訪中,甚至在一段時間內讓某人向你展示他們是誰,他們相信什麼。
意義和目的是由宇宙決定的,是宇宙的本質,但它不是人們通常談論的宗教方式。服用 LSD(麥角酸二乙醯胺:一種人工迷幻藥) 對我來說是一種深刻的體驗,它展示了硬幣的另一面,當它消退時你無法記住它,當它沖刷著你時,會告訴你一切都有聯繫,你在這裡不是偶然、而是有目的的。如果能弄清楚那是什麼,那麼你對自己的瞭解會比其他任何事情都多。它只是揭示了你是誰、是什麼。
它加強了我對什麼是重要的感覺,感受到對彼此的愛、敬畏,對生命的尊重,以及與人的聯繫。它是現在所發生的一切的一部分,也指向在未來。對我來說,解脫時沒有時間視窗,這是種融入的、深刻的經驗。
我在服用 LSD 之前沒有讀過那些書,但我學到的東西比他們說的多得多,包括對事物的看法。我能夠看到一台電腦,看到它是如何製造的,看到它的整體。
Joe Rogan:Newton (蘋果公司早期製造的掌上型電腦)是這樣的產物嗎?
Steve Jobs:我覺得它是。那段時間我在掙扎中度過的。我們瘋狂地工作,應對一場又一場的失敗,但我仍覺得這將是很重要的。我也曾因為不成功質疑自己。在蘋果公司早期,當我們製造蘋果二代並做得非常好的時候,當時的巨頭公司現在都消失了。
蘋果的成功不是偶然的。它在做一些事情,有一個願景。但它不是一個產品的設計,而是對一個過程的設計,帶來新產品的創新過程。
Google有很好的產品,像 Gmail 和 Chrome,但將這些東西推出且反覆運算的能力非常重要,對Google來說,他們的搜尋引擎很好,而且反覆運算速度之快,以至於最後是否會成功並不重要,是需要多長時間的問題。反觀雅虎,在瀏覽器之後再也沒有重申過這個產品,這就是他們的創新過程。
最具創新性的公司主要是在做使用者介面的公司,我認為他們中沒有任何一家覺得自己是硬體公司,儘管它們創造了大量的硬體。
使用者介面有一種深度、優雅和簡單,有一些公司明白了這一點。這並不是偶然發生的,而必須努力去做。大多數公司的問題是,使產品變得更好並不符合他們的長期利益,只為了短期利益,讓本季度的收益報告看起來不錯。
Joe Rogan:你已經在電腦行業工作了40年,你是如何保持不鬆懈的?
Steve Jobs:在競爭激烈中,那些做得不好的公司不斷被超越。就我們所做的事情而言,我認為我們仍然有最好的產品或作業系統,但要保持它在頂端則必須完善它。你永遠不希望讓產品保持不變,否則人們會說,我們以前見過這些功能。
這一次將是不同的,從來都是如此,要有一種追求完美的動力。你必須不斷發展,不斷向前推進,這確實很難,因為東西並沒有壞,而是需要被做得更好。
人們不會為了讓它變得更好而付費,只有當它是一個新產品時他們才會付錢。因此,當你在這個世界上創造了真正偉大的、革命性的東西時,你有責任推動使它變得更好。
就像我們在準備推出 Macintosh 的發布會時,那時我在想,為什麼我們要推廣這個產品?這個產品有什麼大不了的?它做不到我們所承諾的事情的一半。
當 Windows 一年後出現時,蘋果很幸運,因為它允許我們改變自己的故事。我們從一個失敗的想弄點東西出來的公司,變成了 IBM,一個更年輕、更酷的替代品。
Joe Rogan:你覺得你會做比 Windows 更好的系統,或是跟他們合作嗎?
Steve Jobs:微軟做了很好的工作,但他們沒有太多的審美意識,這是我遇到的微軟的問題。創建微軟公司的人大部分是數學家或科學家,他們不理解人們的實際體驗會如何。
之所以這麼說,是因為我覺得 Windows 3 是一個災難性產品,沒考慮過人們如何使用這個產品,而只做了他們認為對的事情,這非常糟糕。
一些人相信要做對的事情,一些人相信智慧,這兩件事情結合在一起會很神奇。這就是 Macintosh 最初所發生的的事情。它可以由世界上最聰明的人造出來,並且造福於人類。Mac 對於蘋果來說是個好的產品,同時也對世界有益。
Joe Rogan:你覺得還有其他公司和蘋果類似嗎?
Steve Jobs:蘋果的文化非常獨特,這也是人們對於加入它感到興奮的原因,我不知道同樣的事情在其他地方會不會成功。
其他公司也有一些特殊的努力。從微軟身上可以看到,真正的秘訣不是創立一個公司,而是發起一個運動、一個由想要改變世界的人組成的運動。這樣做得好處在於,我們有一整個想要改變世界的人組成的社群,其核心在於,我們要製造偉大的東西來改變世界。
Joe Rogan: 我想這就是年輕人喜歡蘋果的原因,對他們來說好像自己也在參與一些事情。蘋果的產品有一種個性的張力,似乎藏著一個靈魂。有些人對蘋果變得虔誠,這是好事嗎?
Steve Jobs:如果一家公司成功地做了一些事情,那就不必嘗試做所有事。我們正嘗試減少做一些事,為了更專注地做優先順序清單上真正重要的事情。不能因小失大,必須專注少數幾件事,才可以確保這些事很好地完成。
Joe Rogan:你是否會覺得因為這些過多的讓你獲得榮耀的技術,以至於要去承擔一部分責任?
Steve Jobs:技術是一把雙面刃,以人類基因組計畫為例,那是一把巨大的雙面刃,它在醫學上的回報將是巨大的,但也會被一些瘋狂的準軍事組織所利用。
在這一點上,我認為我們是站在好的一面。我們做了很多事情,其中之一就是使工業化世界的大多數人在電腦上成為可能,這使我們成為問題的一部分,但同時也是解決方案的一部分,因為我們可以做很多事情,來幫助教育人們瞭解什麼是好的。在我成長的六七十年代中,電腦非常龐大且昂貴,你沒有辦法瞭解電腦。而今天長大的孩子每個家庭都有一台電腦,這是一個巨變,它不一定是好或壞,我們想幫助人們充分地利用未來的一切。
我們總是問自己可以做的最瘋狂的事情是什麼?如果想不到這一點,那我們就做得少一些。
產品的好和壞,都會隨著它們變強大而被放大。看看當你有和人一樣聰明的電腦時會發生什麼,這很有趣。它不會疲憊,不會生病,不會因為去度假而留下未完成的工作,你告訴它要做什麼它就會去做,它們將擁有比人多得多的智慧等級。電腦將比現在重要1000倍,我們就在這個邊緣。
大部分的生活也是這樣的。如果它只是令人敬畏,它就不會被其他東西所平衡。
我對這個新世界的看法是,有很多人已經失去了工作或者很快就會失去工作。像汽車、電話這種集中化的事物有時是很好的,但不是每個人的解決方案。如果事情以一種新的方式集中權力,以至於不再有任何制衡,這是很可怕的。你必須誠實地對待它,這些東西對人類來說是好的嗎?一般我會說是的,但這也是一件非常可怕的事情。
AIGC,從圖像到語音
雖然在此次 podcast.ai 專訪中,喬·羅根跟賈伯斯的對話長達20多分鐘,事實上,這是 Play.ht 透過賈伯斯的傳記和手機網路上關於他的所有錄音,用語言模型大量訓練產生的。
Play.ht 是一個 AI 文本轉換語音生成器,在今年9月發布了第一個語音模型 Peregrine,當中採用了與大型語言模型(如 DALE 和 GPT-2 )相同的概念,模型覆蓋數千種說話的聲音,可以透過自監督學習人類的情感、說話語氣以及笑聲等。
從文本語言模型到音訊語言模型時,音訊資料速率增高是一個大的難題,一個句子的幾十個字元用音訊波形表達,所包含的數值往往多達數十萬個。
不僅如此,由於文本和音訊之間的一對多關聯性,也即是一個語句可以有不同的說話風格、情感等,這也成為了語音模型研究中需要解決的問題。
這也是當前在賈伯斯「採訪」內容中所呈現出來的問題,即聽起來 AI 的模仿還有些生硬,對話一開始更像從小部分常用短語中提取出來,並且節奏和韻律也不太正常。
但總的來說,podcast.ai 的效果已經相當接近真人,Clearbit 公司聯合創始人 Alex MacCaw 表示:「這真的令人非常興奮!」
This is pretty mind-blowing: a podcast that is entirely generated by artificial intelligence where Joe Rogan interviews Steve Jobs. https://t.co/JPeKZ8ylxk
— Alex MacCaw (@maccaw) October 11, 2022
有網友也留言稱:除了一開始有點不穩定外,當在其他工作過程中聽是,幾乎無法區分。
從 GPT-3、Bloom 的文本生成,DALL-E 和 Stable Diffusion 圖像生成,以及 RunwayML、Make-A-Video 影片產生,各類生成式 AI 模型的出現,給內容創作帶來了更多的可能性。
Play.ht 表示,「我們相信在未來,所有內容創作都將由人工智慧產生,但由人類指導,而最具創造性的工作將取決於人類將他們想要的創作表達到模型中的能力。」
資料來源:
加入電腦王Facebook粉絲團