能夠知道這些內容是不是由 AI 所產生的,這對於促進人們對資訊的信任至關重要。雖然 SynthID 並非解決諸如假訊息或錯誤歸屬等問題的萬靈丹,但它卻是針對此項緊迫的 AI 安全問題的一套可行的技術解決方案。
該工具目前處於測試階段並持續發展。它正被整合到越來越多的產品中,幫助個人和組織負責任地使用 AI 生成內容。
SynthID 如何運作?
SynthID 使用各種深度學習模型和演算法來為 AI 產生的內容加入浮水印並進行辨識。
- 加入浮水印:SynthID 會將數位浮水印直接嵌入 AI 產生的內容之中,並且不會損害原始內容。
- 辨識:SynthID 可以掃描圖像、音訊、文字或影片中的數位浮水印,幫助使用者確定內容(或部分內容)是否由 Google 的 AI 工具所產生。
- 延伸閱讀:用魔法打敗魔法!ChatGPT的「剋星」,AI文本檢測器GPT-2 Output Detector來了
- 延伸閱讀:Google發表辨識工具SynthID,為AI產生的圖像加上「浮水印」,更改顏色或壓縮後還能被檢測出來
- 延伸閱讀:OpenAI用來驗證文章是否由AI生成的工具AI Classifier悄悄關閉,原因是準確率太低還不如用猜的
SynthID 用於 AI 生成文字
我們已將 SynthID 的功能擴展到為 Gemini 應用程式和網路體驗生成文字加入浮水印並進行辨識。
對於 AI 研究人員來說,找到一種既能為 AI 生成文字加入浮水印又不會影響其品質、準確性和創意輸出的穩健解決方案一直是一大挑戰。為了解決這個問題,我們的團隊開發了一種技術,可以將浮水印直接嵌入大型語言模型(LLM)用於生成文字的過程之中。
大型語言模型會逐個標記生成文字。這些標記可以代表單個字元、單詞或短語的一部分。為了創造連貫的文字序列,模型會預測下一個最有可能生成的標記。這些預測基於先前的詞語以及分配給每個潛在標記的概率分數。
例如,對於短語「我最喜歡的熱帶水果是 __。」,大型語言模型可能會使用「芒果」、「荔枝」、「木瓜」或「榴槤」等標記來完成句子,並且每個標記都賦予一個概率分數。當有多種不同的標記可供選擇時,SynthID 可以調整每個預測標記的概率分數,前提是不會影響輸出的品質、準確性和創造力。
這個程序會在生成的文字整段內容中不斷重複,因此單個句子可能包含十個或更多調整過的機率分數,而整頁文字可能包含數百個分數。包含模型詞彙選擇以及調整過機率分數的最終分數模式,即被視為浮水印。此技術僅需三個句子即可使用。隨著文本長度的增加,SynthID SynthID 的穩健性和準確性也會隨之提高。
SynthID 用於 AI 生成音樂
2023 年 11 月,SynthID 的功能擴展到為 AI 生成音樂和音訊加入浮水印並進行辨識。SynthID 的首次部署是透過 Lyria,這是迄今為止我們最先進的 AI 音樂生成模型,由 Lyria 模型生成的 AI 音訊都直接在其波形中嵌入 SynthID 浮水印。
首先,SynthID 將音頻波(聲音的一維表示形式)轉換為聲譜圖。這種二維視覺化顯示了聲音的頻率頻譜如何隨時間演變。
計算完聲譜圖後,數位浮水印就會被加入進去。最後,聲譜圖會轉換回波形。在此轉換過程中,SynthID 利用音訊屬性來確保浮水印對人耳不可聞,進而不影響聆聽體驗。
浮水印具有魯棒性,能夠抵抗許多常見的修改,例如加入噪音、MP3壓縮或加快和減慢曲目的播放速度。SynthID 還能夠掃描音軌以檢測不同位置是否存在浮水印,幫助使用者判斷音軌的部分內容是否可能由 Lyria 生成。
SynthID 用於 AI 生成圖像和影片
SynthID 會直接向 AI 生成圖像的圖元或 AI 生成影片的每一個影格中加入對人眼不可見的數位浮水印。我們設計此浮水印不會影響圖像或影片品質,並允許浮水印保持可檢測性,即使經過裁剪、加入濾鏡、更改顏色、更改影格率(對於影片)以及使用各種有損壓縮方案(通常用於 JPEG 圖像)等修改之後浮水印仍然可以被檢測到。
SynthID 可以在哪裡取得?
這項技術可供使用我們的文字轉圖像模型 Imagen 3 和 Imagen 2 的 Vertex AI 客戶使用,這些模型可以生成各種藝術風格的高品質圖像。SynthID 技術也正在為 ImageFX 上的圖像輸出加入浮水印。
我們還將 SynthID 整合到 Veo 中,這是迄今為止我們功能最強大的影片生成模型,可供 VideoFX 上精選創作者使用。
SynthID 也能夠掃描單個圖像或影片的各個影格以檢測數位浮水印。使用者可以透過搜尋或 Chrome 中的「關於此圖片」功能來辨識圖像(或圖像的一部分)是否由 Google 的 AI 工具生成。
資料來源:
加入電腦王Facebook粉絲團