智谱GLM-4.6上线，国产“模芯”协同进入新阶段

北京日报客户端 | 记者孙奇茹

2025-09-30 17:22

经济

9月30日，国产大模型企业智谱发布并开源新一代大模型GLM-4.6，在智能体编程等核心能力上实现大幅提升。这也是继DeepSeek-V3.2-Exp 与Claude Sonnet 4.5之后，国庆节前夕大模型业界的又一重大技术发布。

作为GLM系列模型的最新版本，GLM-4.6在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面能力有所提升。在公开基准测试和真实编程任务中，GLM-4.6 的代码生成能力已全面对齐国际同行Anthropic推出的Claude Sonnet 4，成为目前国内最强的 Coding 模型。“作为开源模型，GLM-4.6 目前是全球开源生态中性能最强的通用大模型之一，进一步提升了国产大模型在全球竞争格局中的地位。”智谱相关负责人说。

模型的能力需与硬件基础结合才能充分释放与落地，基于此，国产芯片与国产大模型的深度适配正加速推进。智谱方面透露，GLM-4.6已在寒武纪的国产AI芯片上实现FP8+Int4混合量化推理部署，这也是首次在国产芯片上投产的FP8+Int4 模型-芯片一体化解决方案（FP8是8位浮点数即Floating-Point 8数据类型，动态范围广、精度损失小；Int4是4位整数即Integer 4数据类型，压缩比极高，内存占用最少，适配低算力硬件但精度损失相对明显）。在保持模型精度不变的前提下，该方案大幅降低了推理成本，为国产芯片本地化运行大模型提供了可行路径和示范意义。与此同时，摩尔线程也完成了对GLM-4.6 的适配，其新一代GPU可在原生FP8精度下稳定运行模型。

业界分析认为，寒武纪与摩尔线程完成对GLM-4.6的适配，标志着国产GPU已具备与前沿大模型协同迭代的能力，加速构建自主可控的AI技术生态。未来，国产原创的GLM 系列大模型与国产芯片的深度协同，将在模型训练和推理环节持续推动性能与效率的双重优化，构建更加开放、可控、高效的人工智能基础设施。

编辑：孙奇茹

打开APP阅读全文