AI領域,重心已從學術界轉移到了產業界,並且失衡還在繼續。
Science在最新一期正刊上發了一篇文章,整理了近幾年AI領域的相關資料,結果也是一目了然:
AI競賽,學術界輸了。
Science統計了論文、AI最大模型以及SOTA模型在各個領域的占比。
從2016年開始,產業界在領先的人工智慧會議上發論文的占比開啟了野蠻增長的趨勢。
4年時間,在論文數量上,產業界幾乎從學術界「奪取」了20%。
AI領域的10大模型,2013年之前還都是學術界居於主導地位。
之後,產業界持續發力,到了2016年,之後10大AI模型幾乎全都來自產業界。
SOTA模型就更不用說了,去年一年,產業界直接佔據了語言模型和圖像分類的SOTA,
分析情感、語義分割和目標檢測的SOTA大概是產業界和學術界各自一半的成果,機器翻譯的SOTA則全都來自學術界。
當然,這一趨勢在網友們的心中也都是心照不宣的事實,甚至有人做出meme圖來調侃:
學術界人才流失慘重
之所以造成現在的局面,最最最重要的一個原因就是:
人才流失。
以北美大學的資料為例,目前專門從事AI研究的電腦博士正在湧入產業界:
2004年,只有21%的博士選擇進入產業界,到了2020年,進入產業界的博士比例已經將近70%。
並且,這個資料僅限於AI研究方向的人才。
可以從近幾年的資料看出,普通電腦科學的產業需求並沒有明顯的變化,倒是專攻AI領域的人才,市場需求從2006年至今增為8倍。
為什麼AI人才都從學術界流向產業界了呢?
從大的層面上來講,和Science之前提到的算力有關。
顯而易見,在這部分,產業界相較於學術界有很大的優勢。
工欲善其事,必先利其器,誰的算力強大,自然也就能吸納更多的人才。
但其實說白了,算力強不強大很大程度上依賴於資金投入。
學術界的科研資金來源主要來自政府的支持,2021年美國相關部門在人工智慧上的投入是15億美元,同年歐盟的投入是12億美元。
而相比之下,全球AI產業這一年的支出已經超過了3400億美元。甚至,2019年Google母公司Alphabet在其子公司DeepMind上的投資就已經高達15億美元。
當然,上面這些都是站在比較宏觀的角度來談的,那作為單獨個體的研究人員又是如何考慮的呢?
博士畢業剛剛入職OpenAI的研究員Rowan Zellers就現身說法。
Rowan Zellers直言他當時在就業選擇時也有在產業界和學術界之間有所糾結,但最終還是選擇產業界,而原因呢,他也一一列了出來:
- 學術界進行開創性的系統建設研究會變得越來越困難
- AI領域的科研成本正在以指數級增加
- 學術界轉向應用研究是大勢所趨
- ……
基礎研究到應用,產業界包圓了
而人才的流失和算力的傾斜,在一定程度上也可以說是必然結果,在Science的文章中,列出了兩點原因:
- AI領域相較於其他學科領域有特殊性;
- 產業界更注重技術商業化。
先來說一下AI領域的這個特殊性。
在其他學科領域,學術界和產業界都會自然而然形成一個勞動分工,基礎研究交由大學來完成,應用研究和開發則是產業界的工作。
不過,這一套邏輯並不適用於AI圈,在AI領域,基礎研究和應用研究之間的界限被模糊掉了。
也就是說,產業中使用的應用模型和基礎研究之間有所重疊,就拿Google大腦在2017年開發出的Transformer模型來說,它不僅歸屬於基礎研究,也可以進一步直接用在產業中。
除此之外,產業界對人工智慧投入的增加可能會實現技術的商業化,這樣一來,不僅可以為社會提供實質性的利益,對於產業本身來說,也有所回報。
而學術界呢,資金來源的大頭要靠相關機構撥款。
對留校的AI人才來說,雖說發論文可以拿獎金升職,但科研也不是唯一的工作,他們還有授課任務。
並且一般來說學術性研究室都是非盈利性的,比如說Rowan Zellers在加入OpenAI之前,曾在艾倫人工智慧研究所工作:時間倒是花了不少,錢呢......
這麼看來,這一局AI競賽,學術界是徹底輸了。
One More Thing
當然AI競賽,也不能說學術界徹底輸了,在Zeta Alpha統計的論文引用排行榜前100中,學術界和產業界之間還是平衡得很好的。
Despite the seeming dominance of big tech, Academia and Industry are well balanced in the top-100 AI papers by citation. pic.twitter.com/wSc0oPcfxf
— Zeta Alpha (@ZetaVector) March 3, 2023
話說回來對於學術界和產業界的AI競賽,你有什麼看法?
資料來源:
- The growing influence of industry in AI research
- Why I chose OpenAI over academia: reflections on the CS academic and industry job markets (part 2)