清華團(tuán)隊(duì)新發(fā)現(xiàn)：AI大模型看“塊頭”更要看“密度”

來源：新華網(wǎng) 2025-11-22 10:40

分享到微信

新華社北京11月21日電（記者魏夢佳）近年來，AI的發(fā)展遵循著一個簡單直接的規(guī)則——模型越大、能力越強(qiáng)。這個被稱為“規(guī)模法則”的路徑，催生了今天我們看到的各種強(qiáng)大的AI大模型。但同時，隨著模型參數(shù)量的增大，模型訓(xùn)練的成本、使用的成本也隨之飆升，一定程度上制約了大模型的產(chǎn)業(yè)應(yīng)用進(jìn)程。

清華大學(xué)的一項(xiàng)最新研究成果——大模型“密度法則”20日在國際期刊《自然·機(jī)器智能》上作為封面文章發(fā)表，為AI發(fā)展指出了一個新方向：AI大模型變強(qiáng)，不應(yīng)只靠“體型”，更要靠“密度”。

圖為刊載清華成果的《自然·機(jī)器智能》封面圖。新華社發(fā)

“過去，我們往往關(guān)心一個AI模型的‘塊頭’有多大，即參數(shù)量有多大，其實(shí)我們更應(yīng)該關(guān)心模型的‘能力密度’，即每個單位的參數(shù)能展現(xiàn)出的智能水平?！闭撐牡谝蛔髡?、清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系助理研究員肖朝軍說，“這就好比評價一個武林高手，不是看他塊頭有多大，而是看他一招一式里蘊(yùn)含了多少功力?！?/p>

研究人員表示，實(shí)現(xiàn)這樣的“能力密度”，不能靠“模型壓縮”。研究發(fā)現(xiàn)，強(qiáng)行壓縮一個大模型，就像是把一本厚厚的字典強(qiáng)行塞進(jìn)小本子里，很多內(nèi)容會丟失，導(dǎo)致“智力”下降，因此需要采用更先進(jìn)的“數(shù)據(jù)+算力+算法”體系，才能培養(yǎng)出“高密度”的精干小模型。

通過研究過去幾年發(fā)布的51個開源大模型，研究人員發(fā)現(xiàn)：AI大模型的“能力密度”正以指數(shù)級速度增長，大約每3.5個月就翻一倍。

這意味著什么？打個比方，如果今天我們需要一個體育館大小的“大腦”才能完成某項(xiàng)復(fù)雜任務(wù)，那么約3個半月后，我們只需要一個客廳大小的“大腦”就夠了；再過3個半月，這個“大腦”可能只需要一個背包大小。

圖為清華大學(xué)與面壁智能開發(fā)的“高密度”端側(cè)模型應(yīng)用于機(jī)器人。新華社發(fā)

據(jù)了解，目前，清華大學(xué)已與AI企業(yè)面壁智能的團(tuán)隊(duì)合作推出了系列“高密度”模型，已應(yīng)用于手機(jī)、汽車、智能家居等生活領(lǐng)域。

“AI模型不是越大越好，‘精煉’‘高效’是其未來發(fā)展的方向。”肖朝軍說，強(qiáng)大的AI大模型在未來將會更廣泛地在手機(jī)、電腦、汽車等終端上運(yùn)行。當(dāng)芯片的計(jì)算能力和AI的智能密度這兩條快車道交匯時，“端側(cè)智能”的時代或?qū)砼R。屆時，個人設(shè)備有望擁有前所未有的智能，不僅反應(yīng)更快，還能更好地保護(hù)個人隱私。

【責(zé)任編輯：王旭泉】

專題

推薦閱讀

關(guān)于我們 | 聯(lián)系我們

首頁
時評
資訊
財(cái)經(jīng)
生活
視頻
專欄
漫畫
獨(dú)家
招聘

違法和不良信息舉報(bào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120170006
信息網(wǎng)絡(luò)傳播視聽節(jié)目許可證0108263號
京公網(wǎng)安備11010502032503號
京網(wǎng)文[2011]0283-097號
京ICP備13028878號-6

中國日報(bào)網(wǎng)版權(quán)說明：凡注明來源為“中國日報(bào)網(wǎng)：XXX（署名）”，除與中國日報(bào)網(wǎng)簽署內(nèi)容授權(quán)協(xié)議的網(wǎng)站外，其他任何網(wǎng)站或單位未經(jīng)允許禁止轉(zhuǎn)載、使用，違者必究。如需使用，請與010-84883777聯(lián)系；凡本網(wǎng)注明“來源：XXX（非中國日報(bào)網(wǎng)）”的作品，均轉(zhuǎn)載自其它媒體，目的在于傳播更多信息，其他媒體如需轉(zhuǎn)載，請與稿件來源方聯(lián)系，如產(chǎn)生任何問題與本網(wǎng)無關(guān)。

版權(quán)保護(hù)：本網(wǎng)登載的內(nèi)容（包括文字、圖片、多媒體資訊等）版權(quán)屬中國日報(bào)網(wǎng)（中報(bào)國際文化傳媒（北京）有限公司）獨(dú)家所有使用。未經(jīng)中國日報(bào)網(wǎng)事先協(xié)議授權(quán)，禁止轉(zhuǎn)載使用。給中國日報(bào)網(wǎng)提意見：rx@chinadaily.com.cn

清華團(tuán)隊(duì)新發(fā)現(xiàn)：AI大模型看“塊頭”更要看“密度”

清華團(tuán)隊(duì)新發(fā)現(xiàn)：AI大模型看“塊頭”更要看“密度”

中國有約

全運(yùn)會

2025世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會

全球戰(zhàn)略對話（2025）