2025-11-07 20:03
11月6日晚,2025年世界互联网大会乌镇峰会上,大会最高奖项“领先科技成果”揭晓。总部位于北京的智谱公司、清华大学的“GLM大模型关键技术及规模化应用”项目从全球400余项前沿科技成果中脱颖而出,摘得奖项。“只有从底层开始自主研发,才有机会‘摸高’与引领,获得更广阔的创新空间和更高的天花板。”智谱董事长刘德兵接受北京日报记者专访时说道。
自主创新架构实现技术引领
刘德兵介绍,GLM系列大模型研发之初,大模型还未在大众领域引爆关注。当时已在认知智能领域有多年积累的研发团队提出了基于自回归填空的通用预训练架构GLM。
这个决策并不简单。在当时,人工智能领域已有GPT为代表的国际同行所开拓的技术架构。跟随已有路线,前期研发成本更低、风险也更加可控。面对跟随主流路线的诱惑,团队基于清华的创新基因和团队对技术前景的判断,毅然选择了一条更难走的路——“在根本的技术路线上,我们选择了自主创新,而不是跟随。”
这一自研框架通过引入掩码注意力机制,显著提升了模型的鲁棒性,降低模型“幻觉”产生率,模型理解复杂场景的能力和训练效率得到显著提高,并能更好地适配国产芯片架构。“通俗而言,GPT系列是根据前文预测后续内容,而GLM则是同时根据上下文来填上中间的空缺。”刘德兵说。
2022年8月,智谱发布首款千亿级开源模型,并很快在斯坦福大学的评测中取得模型鲁棒性等关键指标排名第一的佳绩,成为亚洲唯一入选的模型。目前,智谱已推出的50余款模型中40余款开源,全球累计下载量突破5000万次,其开源模型曾在GitHub和Hugging Face等国际开发平台上多次登顶热门榜单,在某些指标上超越了同期国际知名模型。
“中国大模型已具备全球竞争力”
技术与性能“摸高”的同时,自研路线也为GLM带来了落地应用优势。随着模型不断迭代,智谱搭建起了高效、低成本的大模型应用。如今,智谱大模型关键技术已服务互联网、金融、政务、教育等20多个行业,日均API调用量超过万亿次。
随着技术实力的提升,中国的大模型正逐步走向世界。近日,美国AI编程工具“第一梯队”Cursor和Windsurf宣布更新基座模型。随后,全球多地用户发现,在Cursor输出的代码中会频繁出现中文。当用户直接询问Windsurf,Windsurf回答时明确表示其模型由中国“智谱AI”提供。记者从智谱获悉,Windsurf采用的新基座模型正是“京产”大模型GLM系列。此外,美国知名云平台Vercel、全球最大的AI推理芯片公司Cerebras……越来越多的海外科技公司开始采用GLM系列模型。在国际“大模型超市”OpenRouter平台上,智谱大模型的调用量、收入均位居前列。
“全球开发者正在选择他们认为最具有性价比和技术实力的工具,中国的大模型已经具备全球竞争力。”刘德兵说,国内庞大的应用市场为模型迭代提供了最佳试验场,而坚定不移的开源战略有助于构建强大的生态护城河,包括智谱GLM在内的中国大模型在全球市场都展现出独特的竞争优势。
北京科创沃土培育AI领军者
回顾发展历程,作为从清华大学孵化走出的大模型领军企业,刘德兵特别提到北京优越的科技创新环境对智谱的滋养。
“北京在人工智能领域的发展全国领先,智谱的快速成长正是得益于北京在人才、科研资源与政策支持等方面的综合优势。”刘德兵表示,清华大学等顶尖科研院校,为企业提供了坚实的人才与技术基础,并形成了活跃的学术与产业交流氛围。与此同时,在政策层面,北京市持续加大对人工智能创新的支持力度,从算力资源、数据政策、应用落地鼓励机制等方面,为从事基础模型研发的企业提供了重要助力。
刘德兵进一步分析道,人工智能产业发展可分为基础模型研发和应用层创新两条主线。“应用层创新投入相对较低,但是门槛和护城河也相对较低;而基础模型的研发早期投入巨大,门槛较高,尤其需要政府在政策与资源上给予更长期、更稳定的支持。一旦在基础技术原始创新层面取得突破,将对现有的产业格局产生显著的引领作用。”他认为,北京正是在这一点上具备了显著协同优势,为智谱等坚持基础研发的企业持续提升智能上限提供了关键支撑。
针对大模型赋能生产力的“最后一公里”挑战,刘德兵认为,大模型在可靠性、行业适配和成本控制等方面仍需突破。特别是在金融、医疗、智能制造等领域,需要绝对的可信度,这要求模型厂商不仅要懂技术,还要懂行业。
展望蓬勃发展的人工智能新纪元,刘德兵表示,希望通过坚持大模型创新,实现“让机器像人一样思考”的愿景,用可信赖的AI让人类社会更美好。