2026-05-12 14:06
能理解一种姿态、一个手势,甚至一个眼神背后的含义,会思考、能行动,还“懂”人的机器人,离我们的生活越来越近。当前,作为人工智能领域的前沿热点,具身智能正逐步从理论走向实践。位于北京工业大学的具身交互智能北京市重点实验室,就致力于攻克具身智能领域的前沿核心技术难题。在这间实验室里,科技正打破人与机器的边界,让机器拥有读懂人心的智慧和温度。
“您有点疲惫,前方3公里有服务区,要不要开启导航?”具身交互智能北京市重点实验室里,智能座舱“察觉”试驾人的疲劳状态,给出导航建议,随即播放起一首节奏明快的歌曲。
“这是智能交互系统在自主学习后给出的主动响应,并非基于预设规则的程序化应答。我们将智能座舱打造成能主动感知驾乘者意图、理解情感状态、发起自然交互的具身智能体。”实验室主任、北京工业大学人工智能学院院长马楠点明核心技术突破。
从被动执行到主动关怀,看似微小的变化背后,是人机交互的新突破。
传统智驾依赖预设指令库,面对用户个性化表达时常“卡壳”。比如,炎炎烈日,当驾驶者念叨“好热”“今天穿多了”,智驾系统往往“听”不懂,只有驾驶者清晰地说出“打开空调”等关键词时,系统才会执行命令。
能否让驾乘体验更人性?对此,马楠带领团队创新提出“常规行为字典+开放式行为增量学习”的技术方案,依托大语言模型实现用户行为字典的动态更新。通过对驾乘过程中语音、手势等多模态感知数据的持续融合学习,系统能自主捕捉用户无意识的细微肢体动作,识别类似“天气好热”“我有点困”等生活化的表达。
更智能的是,该系统还能“反思”,理解言外之意。例如,当驾驶者说“导航去公司”,系统会根据语速急促程度判断是否赶时间,优先推荐最快路径;驾驶者手动调整路线后,系统会观察偏好,在后续相似场景中自动切换路线。“这套系统打破了固定指令的束缚,构建起一体化的人机交互与驾驶控制协同框架。”团队成员、北工大助理教授杨雅钰评价道。
在具身交互智能北京市重点实验室里,类似“很懂人”的智能机器人还有很多:仿人机器人能在楼宇、园区等复杂环境中自主导航,每隔0.05秒就能实时更新“导航地图”;多台智能交互轮式机器人可以组队作业,编队功能指令发送成功率、接收编队信息显示准确率以及协同控制准确率均达到100%;还有采摘机器人,哪串番茄熟了可以采摘?怎么摘不会伤藤蔓?它会像农民一样判断和思考。
“具身智能”被视为人工智能领域的下一波浪潮,核心是让AI系统拥有对物理世界的感知、理解和交互能力,进化成能在真实环境中自主行动的智能体。2025年获批的具身交互智能北京市重点实验室,正是锚定这一方向设立的。“我们琢磨如何让机器人更好地理解人的意图。换句话说,就是要教智能机器察言观色,更精准地理解与识别人的姿态、手势,甚至是一个眼神背后的意图。”在马楠眼中,智能交互研究就是要让机器有智商、有情商、更贴心、更懂“人情世故”。
依托团队在智能交互领域的长期探索,已有一些科研成果得以走出实验室、走向生产线。比如,能“反思”的智驾系统已经在理想汽车新一代车型中开展试点应用验证。“我们要让AI跳出虚拟世界,在工厂、医院、家庭里真正用起来,让智能科技照进现实。”马楠说。