Channel: 電腦王

↧

輕量版ChatGPT訓練方法開源圍繞LLaMA打造，號稱訓練速度比OpenAI快15倍

March 1, 2023, 5:00 pm

≫ Next: Humble Bundle舉辦遊戲土耳其敘利亞震災義賣，30鎂打包70款遊戲還能做公益

≪ Previous: 英特爾 CEO 反擊 3nm 延遲傳聞，Arrow Lake 等產品都會在 2024 年亮相

輕量版ChatGPT訓練方法開源，僅用3天圍繞LLaMA打造，號稱訓練速度比OpenAI快15倍 Ce65abc0c1789094fea56a8b16bbe799

Ce65abc0c1789094fea56a8b16bbe799

Meta宣布推出LLaMA才三天，業界就出現了把它打造成ChatGPT的開源訓練方法，號稱比ChatGPT訓練速度最高快15倍。

LLaMA是Meta推出的超快超小型GPT-3，參數量只有後者的10%，只需要單張GPU就能執行。

把它變成ChatGPT的方法名叫ChatLLaMA，基於RLHF（基於人類回饋的強化學習）進行訓練，在網上很快掀起了一陣熱度。

ChatLLaMA - an open-source implementation of LLaMA based on RLHF.

Claims a 15x faster training process than ChatGPT. It allows users to fine-tune personalized ChatLLaMA assistants.https://t.co/puc3BF1JSU pic.twitter.com/bpZBbxoOfV
— elvis (@omarsar0) February 27, 2023

所以，Meta的開源版ChatGPT真的要來了嗎？

事情倒也沒那麼簡單。

把LLaMA訓練成ChatGPT的「開源方法」

點進ChatLLaMA專案主頁來看，會發現它實際上整合了四個部分——

DeepSpeed、RLHF方法、LLaMA和基於LangChain agent產生的資料集。

其中，DeepSpeed是一個開源深度學習訓練最佳化庫，包含名叫Zero的現存最佳化技術，用於提升大模型訓練能力，具體指幫模型提升訓練速度、降低成本、提升模型可用性等。

RLHF則會採用獎勵模型來對預訓練模型進行微調。獎勵模型即先用多個模型產生問題問答，再依靠人工對問答進行排序，讓它學會評分；隨後，基於獎勵學習給模型產生的回答進行評分，透過強化學習的方式增強模型能力。

LangChain是一個大語言模型應用開發庫，希望將各種大語言模型整合起來，結合其他知識來源或運算能力創建一個實用的應用程式。LangChain agent則會像思維鏈一樣放出GPT-3思考的全過程，將操作記錄下來。

這時候你會發現，最關鍵的依舊是LLaMA的模型權重。它從哪裡來？

嘿嘿，自己去找Meta申請吧，ChatLLaMA並不提供。（雖然Meta聲稱開源LLaMA，但依舊需要申請）

輕量版ChatGPT訓練方法開源圍繞LLaMA打造，號稱訓練速度比OpenAI快15倍

所以本質上來說，ChatLLaMA並不是一個開源ChatGPT專案，而只是一種基於LLaMA的訓練方法，其庫內整合的幾個專案原本也都是開源的。

實際上，ChatLLaMA也並非由Meta打造，而是來自一個叫做Nebuly AI的初創AI企業。

Nebuly AI做了一個叫做Nebullvm的開源庫，裡面整合了一系列隨插即用的最佳化模組，用於提升AI系統性能。

例如這是Nebullvm目前包含的一些模組，包括基於DeepMind開源的AlphaTensor演算法打造的OpenAlphaTensor、自動感知硬體並對其進行加速的最佳化模組……

輕量版ChatGPT訓練方法開源圍繞LLaMA打造，號稱訓練速度比OpenAI快15倍

ChatLLaMA也在這一系列模組中，但要注意的是它的開源license也是不可商用的。

看完這個專案後，有網友表示，要是有人真搞到LLaMA的模型權重（程式碼）就好了……

輕量版ChatGPT訓練方法開源圍繞LLaMA打造，號稱訓練速度比OpenAI快15倍

但也有網友指出，「比ChatGPT訓練方法快15倍」這種說法是一個純純的誤導：

所謂的快15倍只是因為LLaMA模型本身很小，甚至能在單個GPU上運行，但應該不是因為這個專案所做的任何事情吧？

這位網友還推薦了一個比庫中效果更好的RLHF訓練方法，名叫trlx，訓練速度要比通常的RLHF方法快上3~4倍：

For a signficiantly faster RLHF implementation, check out trlX. https://t.co/YG7eXE0OZB Its usually 3x-4x faster than competing implementations. Including this one.
— Louis Castricato (@lcastricato) February 27, 2023

你拿到LLaMA的程式碼了嗎？覺得這個訓練方法如何？

ChatLLaMA地址：

https://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/chatllama

加入電腦王Facebook粉絲團

↧

Trending Articles

《沈冰自述——我和周永康的故事》全本

February 8, 2015, 9:08 pm

Moog - Subsequent 25

January 16, 2020, 12:00 am

出售: 林憶蓮•回來愛的身邊 (東芝1A1頭版)

March 9, 2013, 11:02 am

筆記 - 使用 PowerShell 清除停用 AD 帳號與 OU

July 16, 2019, 11:03 pm

df-dferh-01 中国区 Android 安装 Google Play Store 后报错的解决办法

April 24, 2019, 6:56 am

「一棒接一棒、棒棒強棒」108學年度家長會長交接典禮

October 28, 2019, 8:49 pm

吸烟与MBTI类型判断捷径 (豆瓣 INFJ的奇幻之旅小组)

December 28, 2017, 6:55 pm

acermark龍璿國際展出多款包裝設備

April 18, 2016, 6:02 am

枋寮北勢寮隆山宮睽違12年再辦迎王祭典

October 15, 2018, 6:03 am

日本女优有村千佳COS集锦：狂三&黑白岩&亚丝娜&绫波丽

September 4, 2013, 2:57 am

有遇到过这个问题么。/jsb-videoplayer.js not found, possible missing file.

June 23, 2020, 2:17 am

MAS v2.8 magicgenius 汉化版 - 11.11更新

November 10, 2024, 5:46 pm

出售: Monster Cable Interlink Reference 2

May 23, 2018, 2:00 am

福建佛教人士望云和尚(林斌)的九仙禅寺被强行收走，望云妈妈被赶出寺庙

August 17, 2015, 1:12 am

R 语言中的OpenBLAS*和英特尔® 数学核心函数库的性能比较

December 21, 2016, 9:38 pm

[转载]煞貢、直星、人專吉日\金神七煞歌

March 3, 2016, 6:37 am

HAKERS哈克士戶外 12月8~14日廠拍

December 6, 2016, 3:52 am

OBS Studio 23.2.1 免安裝中文版 - 免費網路實況廣播軟體實況主必備軟體取代Fraps

June 16, 2019, 8:10 am

<請教>行駛中安卓機會重新開機

August 5, 2018, 7:25 am

Udp2raw-tunnel 及其一键安装脚本

October 23, 2017, 6:46 pm

© 2024 //www.rssing.com