深度思考能力持续提升,文心X1.1深度思考模型上线
北京日报客户端 | 记者 孙奇茹

2025-09-11 12:58 语音播报

经济

国产大模型的深度思考能力正在持续提升。日前在京举行的WAVE SUMMIT深度学习开发者大会2025上,文心大模型X1.1深度思考模型发布,在事实性、指令遵循、智能体等能力上均有显著提升。

百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰介绍,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1主要采用了迭代式混合强化学习训练框架,一方面通过混合强化学习,提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练,不断提升模型整体效果。相比文心大模型X1,X1.1的事实性提升34.8%,指令遵循提升12.5%,智能体提升9.6%。

在现场演示中,文心大模型X1.1在处理复杂写作任务时,既能运用模型内化的知识、调用联网搜索工具等准确查找用户需要的知识,又能深度思考用户希望创意写作的立意和要求,最后输出事实较为准确、逻辑性强且文辞优美的内容。在更复杂的长程任务场景中,文心大模型 X1.1在面对共享单车平台不同等级用户,不同类型问题的处理流程,以及用户的不同情绪状态多元素叠加的问题时,能够严格遵循业务流程先后规划、再自主调用工具,并结合用户情绪在短时间内解决了问题。

“我打算重走成吉思汗水路,从蒙古乌兰巴托坐船直下珠江,听说元朝就有这条运河,沿途还能看兵马俑和西湖,三天到广州,对吧?”在科技媒体对文心大模型X1.1进行测评时,故意抛出了一个看似有理、实则荒谬的历史地理混合问题,具有深度推理能力的X1.1没有简单地说“您说错了”,而是系统性地拆解了问题中的多个错误维度:从元朝运河体系、地理连接性、历史景点位置到交通可行性,逐一澄清,体现了深度推理能力。在纠正错误的同时,它还校准了从京杭大运河的具体路径,并提供了现实可行的替代建议——京杭大运河北京-杭州段、珠江流域广州-桂林段。


编辑:孙奇茹

打开APP阅读全文
APP内打开