中國日報10月15日電(記者 樊菲菲) 百度搜索今日宣布全面升級文心助手AIGC創(chuàng)作能力,支持AI圖片、AI視頻、AI音樂、AI播客等8種模態(tài)創(chuàng)作,且能夠一鍵調(diào)用多工具解決多場景問題。截至目前,百度搜索用戶日均生成AIGC內(nèi)容已破千萬。此外,百度搜索還發(fā)布行業(yè)首個開放式實(shí)時互動的數(shù)字人智能體,具備高逼真度、低延時、開放式實(shí)時互動與情感識別能力,為用戶提供更專業(yè)的內(nèi)容和服務(wù)。
同日,視頻生成模型百度蒸汽機(jī)(文心專精)再次升級。該模型突破傳統(tǒng)AI視頻生成10秒左右的時長限制,行業(yè)首次實(shí)現(xiàn)AI長視頻實(shí)時交互生成,生成速度超越國內(nèi)主流視頻生成模型。
據(jù)悉,綜合全球知名市場調(diào)研機(jī)構(gòu)Omdia《2025年中國AI搜索市場報告》及QuestMobile《2025年8月AI應(yīng)用行業(yè)月度報告》,百度搜索已在AI用戶規(guī)模、綜合技術(shù)能力等多個核心指標(biāo)位列AI搜索行業(yè)第一。
文心助手上線8種模態(tài)創(chuàng)作能力,用戶日均生成AIGC內(nèi)容已破千萬
據(jù)百度搜索相關(guān)負(fù)責(zé)人介紹,百度搜索文心助手在任務(wù)解決、創(chuàng)作生成能力等方面進(jìn)一步升級。在任務(wù)解決方面,升級后的文心助手支持一鍵調(diào)用多工具解決生活、健康、教育、工作等多場景問題。在內(nèi)容創(chuàng)作領(lǐng)域,文心助手已經(jīng)支持AI圖片、AI視頻、AI音樂、AI播客等8種模態(tài)創(chuàng)作能力。截至目前,每天都有千萬量級的AIGC內(nèi)容由用戶通過文心助手創(chuàng)作產(chǎn)生。
此外,百度搜索發(fā)布了行業(yè)首個開放式實(shí)時互動的數(shù)字人智能體,通過AIGC技術(shù)開啟搜索新形態(tài)。該功能基于百度數(shù)字人技術(shù)、多模態(tài)模型、多智能體協(xié)作等,具備高逼真度、低延時、開放式實(shí)時互動與情感識別能力,支持用戶與持證真人專家的數(shù)字分身進(jìn)行1v1對話,并將在法律、情感、旅游等場景中獲得專業(yè)陪伴與咨詢服務(wù)。
蒸汽機(jī)模型業(yè)內(nèi)首次實(shí)現(xiàn)AI長視頻實(shí)時交互,生成速度領(lǐng)先行業(yè)
值得一提的是,視頻生成模型百度蒸汽機(jī)再次升級,行業(yè)首次實(shí)現(xiàn)AI長視頻實(shí)時交互生成。該功能升級依托流式視頻技術(shù)實(shí)現(xiàn)“無限時長”生成,突破傳統(tǒng)AI視頻生成10秒左右的時長限制,生成速度超越國內(nèi)主流視頻生成模型。
據(jù)悉,用戶只需上傳單張圖片與一段提示詞即可啟動視頻生成流程,并能實(shí)時預(yù)覽模型推理全部內(nèi)容。在生成過程中,用戶可隨時暫停、或在任意節(jié)點(diǎn)修改提示詞,實(shí)現(xiàn)對視頻劇情、畫面、轉(zhuǎn)場的實(shí)時控制,全程干預(yù)。這意味著,AI視頻從“單向生成”邁向“雙向共創(chuàng)”,真正實(shí)現(xiàn)“無限畫布”式的連續(xù)創(chuàng)作體驗(yàn)。
此外,此次升級同步推出了可交互數(shù)字人與開放世界動態(tài)構(gòu)建兩大功能。數(shù)字人支持沉浸式雙向互動,可應(yīng)用于AI導(dǎo)購、教育、陪伴等場景;開放世界則允許用戶通過自行操控,在AI生成的游戲地圖、旅游景點(diǎn)、宇宙空間等環(huán)境中自由探索。