GLM-5.2:智谱 AI 的 1M 上下文开源模型来了

2026年6月13日,智谱 AI 发布了 GLM-5.2。这是 GLM-5 系列的第三次迭代——2月的 GLM-5 打头阵,5月的 GLM-5.1 强化了 Agent 能力,现在 5.2 把重点放在了两件事上:100 万 token 的上下文窗口,以及 MIT 协议开源。

1M 上下文,这次是"能用"的那种

"支持 1M 上下文"这句话很多模型都说过。智谱这次的卖点是"可实用"——不是技术演示,是真能塞进去一整个代码仓库跑起来。

对开发者来说,这意味着不用再搞什么分片策略、检索增强,直接把整个项目扔进去让模型做跨文件重构、Bug 定位、测试生成。长文档分析、学术论文理解这些场景也能一次搞定。

MIT 协议:想怎么用就怎么用

MIT 是最宽松的开源协议之一。商用、修改、二次分发,都不用问智谱要授权。下周模型权重正式放出后,企业可以本地部署,金融、医疗这些对数据敏感的行业也能用。

这步棋走得挺激进。直接对标 Meta 的 Llama 系列,智谱想在开源大模型赛道上抢位置。

编程能力:对标 Claude Opus

GLM-5.2 的定位是 Agentic Coding——不只是写代码,是能独立完成复杂软件工程任务。支持多步工具调用、长链路执行,官方说能跑 8 小时的编程工作流。

前代 GLM-5.1 在 SWE-Bench Pro 上拿了 58.4%,5.2 的具体数字还没公布,但内部测试据说"和 Opus 4.5 差不多,速度也还行"。

国产算力:全程无 NVIDIA

GLM-5.2 在华为昇腾芯片上用 MindSpore 框架训练,从头到尾没碰 NVIDIA 的卡。智谱今年 1 月在港股 IPO 了 43.5 亿港币,钱直接砸进了 GLM-5 的研发。

这意味着不受美国出口管制影响,算力供应链完全自主可控。

双模式推理:复杂任务深度想,简单任务快速答

GLM-5.2 支持两种推理模式:

用户可以根据任务复杂度自己选。

竞品对比

对比维度GLM-5.2Claude Opus 4.8Kimi K2.7 Code
上下文1M1M256K
开源MIT(下周放权重)不开源开源
推理模式双模式自适应仅思考模式
训练算力华为昇腾未知未知

怎么用

现在 GLM Coding Plan 的用户已经能用了,覆盖 Lite、Pro、Max、Team 四个版本。API 和网页聊天下周上线。

想本地部署的话,等下周权重放出,用 SGLang、vLLM、xLLM 这些框架都能跑。16G 显存就能跑满性能,量化后低配设备也能用。

说点实在的

GLM-5.2 的发布节奏很快——5 月 5.1,6 月 5.2,中间只隔了一个月。智谱的打法是快速迭代、快速开源,先把开发者生态占住。

1M 上下文 + MIT 开源,这个组合在国内模型里是头一份。能不能真正用起来,还得看下周开源后的社区反馈和实际部署体验。但至少从纸面参数看,智谱这次是认真的。