智谱GLM-4.6上线,国产“模芯”协同进入新阶段
北京日报客户端 | 记者 孙奇茹

2025-09-30 17:22 语音播报

经济

9月30日,国产大模型企业智谱发布并开源新一代大模型GLM-4.6,在智能体编程等核心能力上实现大幅提升。这也是继DeepSeek-V3.2-Exp 与Claude Sonnet 4.5之后,国庆节前夕大模型业界的又一重大技术发布。

作为GLM系列模型的最新版本,GLM-4.6在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面能力有所提升。在公开基准测试和真实编程任务中,GLM-4.6 的代码生成能力已全面对齐国际同行Anthropic推出的Claude Sonnet 4,成为目前国内最强的 Coding 模型。“作为开源模型,GLM-4.6 目前是全球开源生态中性能最强的通用大模型之一,进一步提升了国产大模型在全球竞争格局中的地位。”智谱相关负责人说。

模型的能力需与硬件基础结合才能充分释放与落地,基于此,国产芯片与国产大模型的深度适配正加速推进。智谱方面透露,GLM-4.6已在寒武纪的国产AI芯片上实现FP8+Int4混合量化推理部署,这也是首次在国产芯片上投产的FP8+Int4 模型-芯片一体化解决方案(FP8是8位浮点数即Floating-Point 8数据类型,动态范围广、精度损失小;Int4是4位整数即Integer 4数据类型,压缩比极高,内存占用最少,适配低算力硬件但精度损失相对明显)。在保持模型精度不变的前提下,该方案大幅降低了推理成本,为国产芯片本地化运行大模型提供了可行路径和示范意义。与此同时,摩尔线程也完成了对GLM-4.6 的适配,其新一代GPU可在原生FP8精度下稳定运行模型。

业界分析认为,寒武纪与摩尔线程完成对GLM-4.6的适配,标志着国产GPU已具备与前沿大模型协同迭代的能力,加速构建自主可控的AI技术生态。未来,国产原创的GLM 系列大模型与国产芯片的深度协同,将在模型训练和推理环节持续推动性能与效率的双重优化,构建更加开放、可控、高效的人工智能基础设施。


编辑:孙奇茹

打开APP阅读全文
APP内打开