点击右上角
微信好友
朋友圈

请使用浏览器分享功能进行分享


AI论道
人形机器人伸出手,将墙壁挂钩上的黑色垃圾袋扯下一个,双手撑开,套在地面的垃圾桶里,并“整理”好——在近日举行的第八届北京智源大会上,人形机器人的“聪明”程度已经有了明显提升。
餐桌前,桌上是吃剩的小龙虾壳、外卖盒等,人形机器人先将虾壳放到外卖盒里,再将盒子放进外卖袋,最后用抹布擦干净桌子,行为逻辑和人类做家务时一模一样——国内科研机构已经打造了多款清洁机器人,有望未来在酒店中应用。
机器人自主规划、判断容器空间、决定杂物摆放和去向,是依靠世界模型对物理状态的推演能力。能在环境里预判后果、作出决策的世界模型,是目前最被看好的方向之一,它有望让AI具备“推演未来”的能力。近年来,全球多个顶级科研团队在尝试打造名为“世界模型”的人工智能(AI)大模型,研究者认为世界模型才能通向真正的“智能”。
1 世界模型:让AI理解“物理世界”
世界模型是什么?它和我们常见的能聊天的DeepSeek、ChatGPT有什么不同?
“DeepSeek这类大模型本质上是‘语言模型’,它们是通过海量文字训练出来的,核心能力是预测‘下一个词该是什么’。”新加坡南洋理工大学校长讲席教授、人工智能交叉研究院院长安波表示,世界模型是“预测下一个状态”,它要让AI在“大脑”里建立一个关于世界如何运转的内部模拟器,“就像我们人类,看到一个杯子被推到桌子边缘,不用算物理公式,也能预判它会掉下去摔碎。”
为何要研发世界模型?“世界模型是面向物理世界的基座模型。”北京智源人工智能研究院院长王仲远说。无论是机器人作业、自动驾驶还是科学发现,都需要具备对物理规律的深刻理解与因果推理能力,这恰恰是当前大模型和视频生成模型的短板。王仲远打了个比喻:“视频模型能生成天上飞的猪,这在数字世界是趣味,在物理世界却是灾难。”他认为,要让AI真正进入物理世界,解决制造业、医疗、物流、养老等领域的痛点,世界模型须具备几项核心能力——物理正确、动作因果可溯、长程一致和通用泛化。
世界模型的另一大应用领域是自动驾驶。安波表示,当AI真正拥有了推演的能力,它就成了一个能帮人推演世界、规划行动的伙伴,“现在的自动驾驶有时显得‘愣’,是因为它主要对当下情况作出反应。而有了强大的世界模型,车能像老司机一样‘预判’。”
不过,目前各方对于世界模型的定义尚未达成共识。王仲远表示,现在大家是用不同的方法、从不同的角度来看世界模型,但相信最终会殊途同归。“我们教会了AI理解和生成信息,接下来的十年,很可能是教会它预测、规划和行动。”安波说,世界模型恰恰是这个转向里最关键的一块拼图。
2 产业前瞻:打开具身智能万亿蓝海
此次智源大会公布了正在研发中的世界模型——悟界·Physis,和以预测下一个物理状态为核心来构建具身大脑——悟界·RoboBrain Orca。其中悟界·Physis-v0.1预计将在训练完成后开源开放。
作为全球首款通用世界基座模型,悟界·Physis-v0.1能有效弥补主流人工智能模型不懂真实物理规则等核心短板,提升AI物理推理的真实性与可靠性;悟界·RoboBrain Orca则可以推动AI从理解文本走向感知、预测物理世界并与之交互。
有了世界基座模型和具身大脑的支撑,AI便拥有了跨越“数字虚拟”与“物理现实”之间鸿沟的核心能力。未来,机器人不仅能自主识别“杯子在桌子边缘”,更能预判“杯子掉下去会摔碎”。
“世界模型试图对环境形成理解以及预测,具身智能强调在与环境互动中产生智能。”对于世界模型与具身智能之间的关系,深圳市人工智能与机器人研究院具身智能中心主任刘少山大胆预测,世界模型可能是具身智能的下一个突破口。
近几个月,谷歌、英伟达等科技巨头纷纷重兵押注,一场围绕世界模型的万亿级市场竞赛已然打响。据摩根士丹利预测,到2035年世界模型所赋能的产业规模将达10万亿美元;国元证券也提出,2030年全球搭载世界模型的机器人市场将突破3万亿元,成为AI下一轮增长的核心引擎。
王仲远认为,全球围绕世界模型的技术路线仍处于探索阶段。在这一全新赛道上,中国不仅仅是跟随者,而正与世界处于同一起跑线,“世界模型特别是世界基座模型,有望在未来5—10年成为人工智能领域的重大技术颠覆和研究范式。”
当前,国内许多科研机构和企业都转向世界模型的开发。过去几年,AI的关键词是“会说话”,也就是理解和生成语言,而现在,更多的科学家正在让AI从“会说”走向“会想”和“会做”。王仲远表示,未来3—5年都会是世界模型持续演进和迭代的阶段。
3 广西实践:打造“懂战术会实操”的智能专家
世界模型拉开了AI走进物理世界的序幕,“预判后果”让机器人真正具备类人环境认知能力。这场技术变革趋势,对广西有何启发?
近年来,广西聚焦国家所需、广西所能、东盟所盼,构建“北上广研发+广西集成+东盟应用”的差异化发展路径,推动人工智能与制造业双向赋能。《广西深入实施“人工智能+”三年行动方案(2026—2028年)》提出,到2028年,广西将全面建成中国—东盟国家人工智能应用合作中心,智能经济核心产业产值突破1000亿元。
目前,广西一些领域正在探索落地行业推演类大模型,未来可依托现有产业和实用场景,接入通用世界基座模型,进一步实现物理智能升级——
例如,2026年3月底,广西首个钢铁行业大模型——“玄铁”大模型成功发布。在智能配矿与原料优化环节中,系统将传统需要72小时的配矿决策周期缩短至16分钟;依托5G技术,实现铁水运输全流程智能化;设备预测性维护平台能够提前72小时预警设备故障;复杂场景机器视觉集已沉淀60余个可快速复用的视觉智能体,在100多个生产场景规模化落地,识别准确率超过99%。
又如,汛期的广西,降雨量大且时空分布不均,江河洪水、台风风暴潮、山洪泥石流灾害多发,直接威胁人民群众生命财产安全。目前正在调试运行的广西防洪大模型数字孪生智能推演决策平台——防洪“超级大脑”,也为广西防洪防汛模式做了有益探索。这个“超级大脑”以科技破局,以智能操盘,推动防洪防汛工作转向主动预控,筑牢江河安澜的智慧防线。它既是数据“翻译官”,也是极速“演算师”,更是智能“参谋长”和立体“透视仪”。
从“人盯数据”到“系统智算”,从“被动抢险”到“主动预控”,广西能做的不止于此。目前,广西已打造形成有色金属、钢铁、石化化工、机械、汽车、电子信息等10个千亿级产业,规上工业企业突破万家,装载机、成品糖、内燃机、不锈钢、新能源汽车等产品产量位居全国前列,柳工、柳钢、玉柴等企业驰名中外。依托本土产业筑牢底座,广西坚实的产业基础为“人工智能+制造”提供丰富场景。
为让AI技术加速落地转化,广西持续完善资金扶持与产业培育体系。截至目前,特种机器人、AI眼镜等258个智能产品在广西实现首产首用,已基本形成覆盖元器件及零部件、智能终端、人工智能软件等领域的人工智能产业布局。铝行业数据联合体入选国家首批先行先试名单。
AI一直在变,但扶持力度不会改变。目前,广西已设立总规模100亿元的人工智能产业基金、50亿元的兴桂新型工业化创业投资基金和10亿元的机器人产业并购基金,未来三年将安排450亿元专项资金支持以AI为引领的新质生产力发展。
当前,世界模型技术竞速已经开展。广西有望依托独有的区位优势和集成优势,探索将世界模型适配制造业十大现代化支柱产业、跨境产业链供应链需求,推动产业全域升级。
(广西云-广西日报记者 陶昌顺/整理)
