用於翻譯、在Facebook上標記照片以及最佳化導航最佳路線的人工智慧,一開始都要靠人類提供的訊息開始學習。我們向演算法展示哪些句子在其他語言中意思相同,某個人在不同照片中的樣子,以及如何為汽車規劃一條理想的路線。
但是,一些人工智慧研究人員正在探索如何如何賦予算法好奇心,讓它們能夠在沒有任何人類指導的情況下學習。由伊隆·馬斯克、山姆·阿特曼和其他矽谷大佬創立的非盈利人工智慧實驗室OpenAI與加州大學柏克萊分校和愛丁堡大學的研究人員合作的新研究發現,當一個人工智慧演算法被賦予簡單的好奇心定義時,它可以在沒有任何人類提供的訊息的情況下探索超過50多個電子遊戲,甚至有些遊戲還能打通關。
但好奇心是有代價的。研究人員還發現,由於人工智慧會因為看到新事物而被獎勵,所有玩遊戲時,它會故意死亡只是為了看到遊戲結束畫面,或者被一個假的電視及其遙控器所吸引,不斷地切換頻道看新東西。
什麼是人工好奇心?
OpenAI團隊用於人工好奇心的定義相對簡單:演算法會嘗試預測其環境在未來一個影格的樣子。當下一影格發生時,演算法將根據其預測的錯誤程度獲得獎勵。這個想法是,如果演算法能預測環境中會發生的事情,那麼它之前已經見過這種情況。
這就是為什麼人工智慧在像超級瑪利歐這樣的遊戲中表現如此出色——該遊戲基於探索前方並進入下一個關卡。
電視有什麼特別之處?
OpenAI的研究員哈里·愛德華茲(Harri Edwards)說,讓人工智慧能隨意切換頻道的想法來自一個叫做「雜訊電視問題」的思想實驗。電視上的雪花雜訊是極其隨機的,所以一個好奇的人工智慧永遠無法真正預測接下來會發生什麼,所以會被被吸引在那裡永遠看電視。在現實生活中,你可以把它想像成一些完全隨機的東西,比如瀑布上閃爍的光。
研究人員透過在3D環境中放置一台數位電視,並允許人工智慧按按鈕來換頻道來測試他們的理論。當人工智慧找到電視並開始換頻道時,不斷出現的新圖像使電視變得難以抗拒。
愛德華茲說,有一些情況下,人工智能能夠迫使自己遠離電視,但前提是周圍環境比電視上的下一個節目更有趣。
超越遊戲
這項研究的目的不僅僅是用人工智慧打敗電子遊戲,還在於了解演算法如何更好地解釋周圍的世界。由於這些演算法被證明能夠高效地探索電子遊戲的各個角落,研究人員表示,它們還可以用於簡化調試程式碼或打通關電子遊戲以確保沒有漏洞
加入電腦王Facebook粉絲團