經(jīng)濟(jì)導(dǎo)報(bào)記者 劉勇
在5月28日舉辦的中關(guān)村論壇人工智能大模型發(fā)展分論壇上,由中國(guó)科學(xué)技術(shù)信息研究所、科技部新一代人工智能發(fā)展研究中心聯(lián)合相關(guān)研究機(jī)構(gòu)編寫的《中國(guó)人工智能大模型地圖研究報(bào)告》(下稱《報(bào)告》)正式發(fā)布。
《報(bào)告》顯示,對(duì)全球大模型技術(shù)發(fā)展脈絡(luò)進(jìn)行梳理發(fā)現(xiàn),自谷歌2017年發(fā)布的Transformer網(wǎng)絡(luò)結(jié)構(gòu)以來,僅用五年多時(shí)間全球已迅速成長(zhǎng)出龐大的大模型技術(shù)群,衍生出涵蓋各種技術(shù)架構(gòu)、各種模態(tài)、各種場(chǎng)景的大模型家族。
《報(bào)告》分析發(fā)現(xiàn),美國(guó)谷歌、OpenAI等機(jī)構(gòu)不斷引領(lǐng)大模型技術(shù)前沿。歐洲、俄羅斯、以色列、韓國(guó)等國(guó)地越來越多的研發(fā)團(tuán)隊(duì)也在投入大模型的研發(fā)。從全球已發(fā)布的大模型分布來看,中國(guó)和美國(guó)大幅領(lǐng)先,超過全球總數(shù)的80%,美國(guó)在大模型數(shù)量方面始終居全球最高。
中國(guó)自2020年進(jìn)入大模型快速發(fā)展期,目前與美國(guó)保持同步增長(zhǎng)態(tài)勢(shì)。在自然語言處理、機(jī)器視覺和多模態(tài)等各技術(shù)分支上均在同步跟進(jìn)、迅速發(fā)展,涌現(xiàn)出盤古、悟道、文心一言、通義千問、星火認(rèn)知等一批具有行業(yè)影響力的預(yù)訓(xùn)練大模型,形成了緊跟世界前沿的大模型技術(shù)群。
報(bào)告基于公開信息梳理分析了中國(guó)已發(fā)布的79個(gè)大模型,分析結(jié)果顯示,目前中國(guó)在14個(gè)省市/地區(qū)均有團(tuán)隊(duì)在開展大模型研發(fā),北京、廣東兩地最多,地域集中度相對(duì)較高。從領(lǐng)域分布來看,自然語言處理仍是目前大模型研發(fā)最為活躍的重點(diǎn)領(lǐng)域,其次是多模態(tài)領(lǐng)域,在計(jì)算機(jī)視覺和智能語音等領(lǐng)域的大模型還較少。國(guó)內(nèi)大學(xué)、科研機(jī)構(gòu)、企業(yè)等不同創(chuàng)新主體都在積極參與大模型研發(fā),學(xué)術(shù)界與產(chǎn)業(yè)界之間的聯(lián)合開發(fā)相對(duì)較少。
報(bào)告通過調(diào)研全國(guó)范圍內(nèi)的算力基礎(chǔ)設(shè)施分布情況發(fā)現(xiàn),北京、廣東、浙江、上海等地的大模型數(shù)量最多,同時(shí)這4個(gè)地方也是近三年人工智能服務(wù)器采購數(shù)量最高的地區(qū),表現(xiàn)出非常明顯的強(qiáng)相關(guān)性,為大模型研發(fā)應(yīng)用提供了重要支撐。同時(shí),各地也在通過提供公共算力方式補(bǔ)充快速增長(zhǎng)的人工智能算力需求,為大模型研發(fā)提供更多算力支撐。
從模型影響力方面看,清華大學(xué)與阿里和百度聯(lián)合開發(fā)的CogView模型論文引用數(shù)最高,華為的FILIP、百度的ERNIE3.0以及阿里的M6-OFA引用數(shù)也位居國(guó)內(nèi)前列,在大模型領(lǐng)域形成了較好的學(xué)術(shù)影響力,但與國(guó)外領(lǐng)先大模型的學(xué)術(shù)影響力相比差距仍然較大。