国产代码模型新突破!GLM-4.6发布,实测超越Claude

2025-10-04
创新创业中关村微信公众号

9月30日,国内AI圈迎来一个新消息——智谱正式推出新一代大模型GLM-4.6,其代码能力不仅刷新国产纪录,更在真实编程任务中超越国际产品Claude Sonnet4,成为国内开发者的新晋“编程利器”。

01 多项第一:

代码能力突破

GLM-4.6此次发布创造了多项“第一”纪录,展现出可观的技术进步。

这是国内首个代码能力对齐Claude Sonnet4的大模型。在八大权威基准测试中,GLM-4.6成为首个在部分榜单表现对齐Claude Sonnet 4/Claude Sonnet4.5的国产模型,稳居国产模型首位。



效率方面,GLM-4.6比前代产品GLM-4.5在平均token消耗上节省30%以上,成为同类模型中token消耗最低的选手。



在74个真实场景编程任务测试中,GLM-4.6实测成绩超过Claude Sonnet 4,这一成就使它在国产模型中独树一帜。



02 芯片适配突破:

全链条自主化

GLM-4.6在国产芯片适配方面取得重大突破,首次在国产芯片上实现了FP8+Int4模型-芯片一体化解决方案。这一突破意味着大模型在国产硬件上的部署运行不再受制于国外技术,构建了从算法到硬件的全自主AI生态。

具体来说,GLM-4.6已在寒武纪国产芯片上实现FP8+Int4混合量化部署,在保持精度不变的前提下,大幅降低推理成本。

与此同时,基于vLLM推理框架部署,摩尔线程新一代GPU可基于原生FP8精度稳定运行GLM-4.6,证明了国产GPU的生态兼容能力。这一技术突破为大模型在国产芯片上的大规模应用铺平了道路,推动大模型在国产芯片上的落地从技术可行走向产业可行。

03 性能突破:

全方位提升

除了代码能力的大幅提升,GLM-4.6在多个关键性能指标上都有显著进步。

上下文长度:上下文窗口由128K→200K,适应更长的代码和智能体任务。

推理能力:推理能力提升,并支持在推理过程中调用工具。

搜索能力:增强模型的工具调用和搜索智能体,在智能体框架中表现更好。

写作能力:在文风、可读性与角色扮演场景中更符合人类偏好。

04 产业影响:

更新AI生态格局

GLM-4.6的发布不仅仅是一个技术产品的升级,更是人工智能产业领域的重要更新。

国产大模型与国产芯片的深度协同,标志着我国在构建自主可控AI技术生态方面取得了实质性进展。

GLM-4.6已上线智谱MaaS平台,并遵循MIT协议开源,这一举措将大幅加速国产大模型在全球范围内的应用和迭代。

GLM-4.6的发布,证明国产大模型不仅在追赶国际先进水平,更在部分领域实现了从并跑到领跑。从技术突破到产业落地,从单点创新到生态建设,GLM-4.6正展现着AI产业的实力和未来潜力!