ASRock推出的AI QuickSet軟體套件包含Stable Diffusion WebUI並支援透過Microsoft Olive加速算圖效能,根據實測可以帶來10倍效能表現。
安裝與模型最佳化
先前AMD在官方部落格張貼了在Stable Diffusion WebUI DirectML分枝版本的使用教學,可以透過Microsoft Olive工具將原本PyTorch格式的模型轉換為ONNX格式,並在運算時使用DirectML API,達到接近10倍的效能表現。
不過筆者在跟隨教學操作的過程中遇到一些技術問題,目前尚無法排除,導致無法套用效能最佳化,好在ASRock推出的AI QuickSet軟體套件,大幅簡化整體安裝流程,使用者只需在精靈的協助下安裝程式,不需額外的設定就可以享受效能AI大幅提升的優勢。
不過需要注意的是,電腦中需要有ASRock AMD Radeon RX 7000系列顯示卡才能安裝AI QuickSet。ASRock官方也表示目前AI QuickSet程式將會持續發展,並在未來加入更多實用的AI應用程式,為使用者帶來更多元便捷的AI功能。
AI QuickSet下載位置:
https://www.asrock.com/microsite/aiquickset/index.html
出圖效能提升10倍
如果想要使用最佳化效能的AI算圖環境的話,可以執行「Launch Stable Diffusion WebUI ONNX」捷徑。不過需要注意的是,目前DirectML版本僅支援使用Stable Diffusion 1.5基礎模型,網頁介面中的Olive模型轉換工具無法用於轉換其他Checkpoint模型(程式以Hard coding方式指定模型檔案),且尚不支援套LoRA,功能限制比較多。若想要使用其他模型則可以執行「Launch Stable Diffusion WebUI」捷徑。
開啟DirectML版本的Stable Diffusion WebUI介面後,需在左上角的Stable Diffusion checkpoint下拉式選單選擇「stable-diffusion-v1-5-olive [Optimized]」,其餘操作則與一般版本相同。
筆者使用ASRock Radeon RX 7800XT Steel Legend進行測試,過程將Batch size分別設定為1、4,Batch count則固定為1,執行2輪測試確定測試結果無極端值後,取平均作為測試成績。
從結果可以看到,AMD陣營顯示卡在最佳化之後,效能有接近在768 x 768解析度下,Batch size為1時每次計算1張圖片,DirectML版本的效能為一般版本的約4.64倍。若將Batch size設定為4,每次同時計算4張圖片,DirectML版本的速度不會受到太大的影響,但一般版本的速度卻會嚴重下降,導致效能落差達到45.29倍。
AMD陣營的Olive工具可以帶來有效的效能提升,但與NVIDIA提供的TensorRT最佳化工具相比方便性與實用度都稍嫌不足,同樣有待日後更新改善。
(回到系列文章目錄)
加入電腦王Facebook粉絲團