银河通用机器人店员上岗

2025-06-12 15:45 来源: 北京号

关注

银河通用/供图

近日，在2025北京智源大会上，北京银河通用机器人有限公司发布了两项具身智能领域核心成果：全球首个面向零售场景的端到端VLA大模型GroceryVLA，以及全开源人形机器人全身遥操作系统OpenWBT。两项成果的发布将进一步推动具身智能机器人在零售场景和人形机器人遥操作领域的应用落地。据了解，银河通用机器人目前已在北京的7处无人药店上岗，今年还将在多地开100家这种无人药店。

全球首发GroceryVLA大模型

让机器人真正懂“零售”

什么是端到端技术？端到端指的是在任务中，从输入端到输出端中间不经过任何其他处理环节，由一个模型完整实现输入到输出的全过程。而VLA则是视觉语言行动模型的简称。

据介绍，银河通用此次发布的视觉语言行动大模型GroceryVLA通过端到端的架构设计，将视觉感知、语言理解和动作执行整合在一个统一的模型中，实现了从环境感知到任务执行的完整闭环。

“Galbot，我又热又饿，帮我拿点吃的。”在智源大会现场，公司创始人及CTO王鹤向大家进行了成果展示。在现场搭建的1：1还原真实商超场景中，机器人Galbot在收到指令后，自主、精确的移动到准确位置，在琳琅满目的货架中为顾客选择了饼干和饮料，然后有条不紊地拿取并送到顾客手中，全程无遥操、自主推理、并且无事先采集场景数据。

“现场展示的绝非预先编排的程式化展示，而是对真实商业场景下机器人自主能力的完整呈现。从环境感知到动作执行，从自然语言指令理解到精准操作完成，整个流程完全由大模型自主决策实现。”王鹤表示。

据悉，GroceryVLA大模型具备强适用性、高通用性、强抗干扰性和跨场景泛化能力以及自主决策能力五大核心能力。其中，大模型采用端到端架构实现在紧密排列的货架中无需预设路径即可精准抓取；强大的跨品类适应能力使其能处理从软包装到硬质容器、透明物体等各类形态商品；通过多场景训练获得卓越的零样本泛化能力，让系统在新环境中即插即用。

更令人瞩目的是，该模型具备类人智能决策能力，不仅能自主选择最优抓取方案，完成多步骤任务，还能实时应对各种突发干扰。实际演示中，面对高强度灯光和人流干扰等复杂场景，系统始终保持稳定运行，充分展现了商业化落地的技术成熟度，能够为机器人稳定适配商超零售场景的复杂环境、实现高度通用的自主操作。

据王鹤在智源大会上透露，银河通用机器人正与零售业态合作伙伴广泛合作，今年将在北京、上海、深圳开100家无人药店，以Galbot为例，它的同伴目前已经在北京的7处无人药店上岗。

OpenWBT系统开源降低人形机器人遥操作门槛

在人形机器人领域，遥操作系统长期面临部署复杂、兼容性差等挑战，严重制约了技术发展和商业应用。传统系统不仅操作繁琐，且功能多局限于上半身，难以满足实际工作场景需求。为此，银河通用联合清华大学弋力助理教授团队推出的全球首个全开源、多机型、跨虚实的人形机器人全身遥操作系统OpenWBT，有效解决了这些行业痛点。

OpenWBT系统设计注重易用性与灵活性，创新实现了小时级快速部署。用户仅需一副VR眼镜与一台普通电脑，便可从零完成系统搭建与调试，显著降低技术门槛。系统支持室内外多样化环境适配，并兼容真实物理与虚拟仿真环境的遥操作，为大规模数据采集和模型泛化训练提供了高效平台。

在动作控制方面，OpenWBT通过模块化设计将机器人运动拆分为“走路、蹲下、弯腰、触达”等基础动作单元，每项动作均在真实环境中经过严格训练与验证。借助先进的技能融合算法，系统能自动组合基础动作，形成连贯复杂的任务序列，实现机器人“碰天触地”的全身协调能力。

该系统还具备出色的硬件兼容性，目前已支持多款不同自由度与身高规格的机器人部署，满足多样化硬件需求，实现对完整人类工作空间的高效覆盖。这种标准化、模块化的设计理念，为科研机构与产业界提供了稳定高效的训练与测试平台。

“OpenWBT的全面开源是构建开放共享具身智能生态的重要里程碑。”王鹤表示，该项目已在GitHub、Gitee等平台上线，通过促进研究机构与企业协同参与，加速了具身智能技术的积累与迭代；银河通用期待与更多合作伙伴携手，共同推动人形机器人从实验室探索走向实际应用，实现产业创新与共赢发展。

“展望未来，银河通用将继续立足海淀这片创新沃土，秉持技术创新与开放合作的发展理念，深化具身大模型技术与产业场景的融合，引领人形机器人实现‘真正工作起来’的目标。”王鹤说。（记者王萌）

作者：

北京海淀官方发布

打开APP阅读全文

特别声明：本文为北京日报新媒体平台“北京号”作者上传并发布，仅代表作者观点，北京日报仅提供信息发布平台。未经许可，不得转载。