• <nav id="ggggg"><code id="ggggg"></code></nav>
    <sup id="ggggg"><code id="ggggg"></code></sup>
    <sup id="ggggg"></sup><noscript id="ggggg"></noscript><tfoot id="ggggg"><dd id="ggggg"></dd></tfoot>
  • 精品熟女视频专区,欧美三级片在线观看,亚洲图片在线,亚洲男人天堂网,亚洲精品午夜精品,日韩乱码一区,国产熟女在线看,精品国产乱子伦一区二区三区,精品一

    基于數萬次真機評測,機器人大模型年度評測報告發布

    當大語言模型在數字世界不斷刷新人類認知邊界,一場關于 AI 如何“扎根”現實物理世界的革命正悄然進行。

    基于數萬次真機評測,機器人大模型年度評測報告發布

    來源:中國日報網 2026-02-04 15:09
    • weixin
    • weibo
    • qqzone
    分享到微信

    中國日報2月4日電(記者 馬思)當大語言模型在數字世界不斷刷新人類認知邊界,一場關于 AI 如何“扎根”現實物理世界的革命正悄然進行。全球首個具身智能大規模真機評測平臺—— RoboChallenge 近日正式發布首份年度報告。報告基于過去數月內(2025 Q4~2026 Q1)平臺完成的數萬次嚴苛遠程真機測試,以大規模、標準化、可復現的數據,客觀揭示了當前視覺-語言-動作模型在真實物理環境中的能力邊界與共性挑戰。

    近年來,大語言模型與視覺語言模型取得了爆發式突破,人工智能在感知、認知與推理層面展現出驚人潛力。然而,將這種能力可靠地賦予機器人,使其在復雜多變的物理世界中理解、決策并執行任務,仍是橫亙在研究者面前的巨大挑戰。真機測試長期面臨難以復現、缺乏統一標準、成本高昂等核心痛點,導致模型評估往往停留在仿真環境或有限場景,其“現實世界智能”成色幾何,始終難以量化評判。RoboChallenge正是為破解這一行業共性難題而生。

    據悉,作為由原力靈機與 Hugging Face 聯合發起的全球首個具身智能大規模真機評測平臺,RoboChallenge致力于構建一個開放、公正、可大規模復現的“真實考場”。自 2025 年 10 月 15 日正式上線以來,平臺已成功部署了包含 UR5、Franka Panda、ARX5、ALOHA 等四大主流機型在內的 20 臺真機集群,構筑起一個穩定、多元的遠程物理測試網絡。

    為推動真機評測走向規范化、標準化,2025 年 11 月 20 日,原力靈機與 Hugging Face 深度集結智源研究院、智元機器人、Qwen、星海圖、自變量、清華大學、西安交通大學及 GOSIM,共同成立了 RoboChallenge 組委會。

    基于對海量真機測試數據的深度分析,RoboChallenge 年度報告揭示了以下核心發現與亮點觀察:基礎任務趨近成熟,“疊碗”和“物體移入盒子”兩項任務因其相對較高的成功率,成為多數模型首選的驗證性任務,類似具身智能的入門“考題”。復雜任務依然“屹立不倒”:涉及多步驟序列決策、長期規劃及精細靈巧操作的任務,如“整理紙杯”、“制作三明治”等,

    此外,報告指出,對當前所有參測模型而言仍極具挑戰,成功率長期處于低位,部分甚至接近零。當前在 Table30 評測集上表現最佳的模型,其整體成功率也僅在 50% 左右。這既體現了現有模型的進步,也充分說明了 Table30 任務集設計的挑戰性與現實價值,表明具身智能在通用能力上仍有巨大提升空間。

    同時,實測數據顯示,參測模型雖具備較強的指令語義理解能力(呈現移動趨勢),但在精細操作任務中成功率不足 15%。這種現象在 RoboChallenge 平臺上沉淀了大量真機失敗數據,這份公開的“錯題集”可作為模型迭代優化的關鍵參考。

    RoboChallenge 標為,未來將持續迭代,引入更多機器人本體類型,拓展至更多元化、更貼近真實工業與家庭需求的場景評測集,并設計更具挑戰性的任務。平臺還將探索分布式真機評測機制,進一步擴大測試規模與效率。

    【責任編輯:何思】
    中國日報網版權說明:凡注明來源為“中國日報網:XXX(署名)”,除與中國日報網簽署內容授權協議的網站外,其他任何網站或單位未經允許禁止轉載、使用,違者必究。如需使用,請與010-84883777聯系;凡本網注明“來源:XXX(非中國日報網)”的作品,均轉載自其它媒體,目的在于傳播更多信息,其他媒體如需轉載,請與稿件來源方聯系,如產生任何問題與本網無關。
    版權保護:本網登載的內容(包括文字、圖片、多媒體資訊等)版權屬中國日報網(中報國際文化傳媒(北京)有限公司)獨家所有使用。 未經中國日報網事先協議授權,禁止轉載使用。給中國日報網提意見:rx@chinadaily.com.cn
    C財經客戶端 掃碼下載
    Chinadaily-cn 中文網微信
    ×