中國日報3月26日電(記者 馬思)在博鰲亞洲論壇2026年年會期間,商湯聯合創始人、執行董事、大曉機器人董事長王曉剛在接受《中國日報》采訪時表示,人形機器人的“ChatGPT時刻”或在兩年后到來,其核心驅動力源于技術路徑的確定性與數據規模的指數級跨越。
在王曉剛看來,大家對具身智能機器人的期待更多來自大模型,而大模型的發展很大程度上受限于數據,隨著數據采集方式的變化,數據量級將有較大突破。
王曉剛表示,當前的人形機器人,普遍停留在"看似能用,實則不夠聰明"的階段,其中泛化能力不足是核心挑戰。主要原因有兩個:一個是數據,一個是模型。
“之前是由人來操控真機,靠真機采集數據。這種采集數據的方式不對,”王曉剛說,這樣的數據不僅不是在人類真實生產生活當中采集的,而且效率低。“過去幾年總共積累10萬小時的數據,和我們要達到千萬小時的目標,差距非常大。”
王曉剛分析,目前行業數據儲備約在10萬小時量級,2025年大曉機器人提出環境式數采,也就是利用第一視角的眼鏡、穿戴式設備,以及第三視角的傳感器,在人真實的生產生活環境中去記錄人的行為。
王曉剛表示,這樣一來,“像保潔阿姨等工人就可以在工作過程當中自然地把這些數據采集下來,從而快速實現數據積累。如果有1000人攜帶這樣的采集設備,一天就有1萬小時的數據積累。”
他透露目標是在未來兩年,也就是2027年實現1000萬小時量級的突破,并結合開悟世界模型向億小時級別進發,從而真正觸達行業爆發的臨界點。
談及機器人的落地應用,王曉剛將之類比為自動駕駛,機器人進入家庭場景必須具備L4級的安全邏輯,C端交互對安全性及緊急應對技術提出了更高要求。