最近在AI界,每個人或許都應該都聽說過這款當下最酷的AI模型 DALL‧E 2。它堪稱AI界的繪畫大師,「恐讓藝術家們集體失業」的言論傳得沸沸揚揚。
去年,OpenAI開源了DALL‧E,它能夠從文本產生圖像,效果已足夠驚豔。然而,在今年4月,升級版DALL‧E 2問世了,這一年內的進步也不可小覷!DALL‧E 2不僅能夠更好地從文本產生照片等級真實的圖像,而且解析度提升了四倍!
躍躍欲試的開發者早已在門外排起了長隊,大家都想對DALL‧E 2真實能力一探究竟。而就在幾周前,造訪的「大門」已經打開,等待名單上的很多人都得到了存取權限,這群人也包括今天的主人翁:Jacob Martin,他用DALL‧E 2為自己所開發的開源軟體「OctoSQL」設計了一個Logo,一起來看看AI的能力是否真的能取代設計師吧。
為資料查詢工具設計Logo
Jacob Martin花了一天時間,透過學習了一些基本知識來進行「熱身」。學會操作後,Jacob Martin就著手給自己的開源專案OctoSQL(一個CLI查詢工具,可在一個SQL查詢中查詢多個資料庫和檔案格式)設計Logo了。
先為大家展示一下最終的設計成果:
接下來,Jacob Martin將介紹自己是如何得到這張他所鍾愛的Logo圖的。
首先,他先介紹了DALL‧E 2的運作方式:一開始,你會得到一堆免費的積分點數,當然你可以購買更多的積分。一個積分可以讓你做以下事情:
- 產生:為一個給定的短句產生4張圖片。
- 編輯:為一個給定的短句和原始圖像產生3張圖像,並將區域標記為透明(可以使用圖像編輯軟體,或使用內建的透明化工具)。
- 最佳化:基於給定的圖像產生3個變化,但不提供短句。這意味著你不能對DALL‧E 2說:「先複製一個上述圖片,並且做xxx方面的修改」這樣的事情,除非你能先在第二個步驟中透過標記一個透明區域來實現。
Jacob Martin對他的Logo有一個相當具體的想法,但他卻無法用語言來具體描述它。「OctoSQL」這個名字來源於「章魚」和「SQL」,其想法是章魚有許多手臂,可以同時抓取許多物品,就像「OctoSQL」可以同時操作許多資料來源一樣。
所以Jacob Martin最初想要實現的是一個可愛卡通的章魚玩弄一堆資料庫(或能代表資料庫的象徵,並且他決定不使用資料庫的實際標誌)。
因此,他第一次輸入如下短句:小章魚玩弄資料庫、數位藝術、卡通、繪圖的圖表,得到了以下的圖片。
Jacob Martin對初次嘗試就得到了這樣一些可愛的圖像感到驚喜,並希望再做一些其他的改變,得到了以下圖片:
儘管它確實看起來很卡通,但Jacob Martin更希望它們能更有內涵一些。然而,主要的問題是,這些章魚是拿著圖表的,而OctoSQL並不處理圖表,它處理的是資料。這可能會讓人對OctoSQL的用處產生誤解。
於是,Jacob Martin打算為章魚添加一些抽象的形狀。他嘗試輸入了抽象的立方體來表達抽象的資料,又因為OctoSQL是一個重視資料安全的嚴肅的資料庫,因此後來又為章魚寶寶加上了黃色的安全帽來激發人們的信心,再後來又加上了黑暗的圓圈作為背景....
DALL‧E 2也按照他的要求一步步輸出了如下的圖片:
最終,而正如大家在一開始看到的,最後一排中間的那張贏了。小章魚正在操縱一些物體,它相當可愛,黃色安全帽也能激發人們的信心,而且沒有其他微小的元素,遠看讓Jacob Martin很滿意,經過他的微調之後就得到了文章開頭的那個Logo。
Jacob Martin表示,總而言之,這是一個有趣的體驗。儘管最終的結果並非完美,但他也已經非常滿意了。就DALL‧E 2而言,他認為現在它的重點功能和目的都在「首次描繪」階段。並且,從目前來看,藝術家還沒有什麼可擔心的(這與Copilot的情況很相似)。
從花費的角度來看,Jacob Martin為整個事情花費30美金,也不算太多。但他認為真正的突破將在DALL‧E 2變得便宜10-100倍,並且能更快地輸出圖片時出現。
DALL‧E 2對藝術家們有沒有威脅?
Jacob Martin的嘗試性實驗引起了Hacker News上的廣泛討論,600多人都發布了對於DALL‧E 2這位「AI 繪畫大師」的評價。
一部分網友認為DALL‧E 2儘管沒有傳說中那麼神乎其神,但卻可以幫助人類更高效地獲得自己想要的圖像:
然而也有一部分網友認為,DALL‧E 2對於要求不高的客戶來說,還是有受眾的,且隨著技術進步,未來對於藝術家們的威脅性如何也未嘗可知。
資料來源:
加入電腦王Facebook粉絲團