如果你最近在关注开源大模型,你不可能没注意到 Qwen。

阿里 Qwen 团队最近的迭代节奏快得离谱:前脚 Qwen 3.5 刚站稳,后脚 3.6 就带着 27B 的旗舰编码能力冲上来了,然后话还没说完,Qwen 3.7 Preview 又发了。

Reddit 和 Hacker News 上的讨论热度说明了一切。

Qwen 3.6-27B:27B 参数的旗舰级编码

这篇文章在 HN 上拿了 993 个赞和 458 条评论——这是最近开源模型里讨论度最高的一篇之一。

标题很直接:《Qwen3.6-27B: Flagship-Level Coding in a 27B Dense Model》。核心观点:在 27B 这个参数量级上,Qwen 3.6 的编码能力已经可以和比它大几倍的模型竞争。

这对本地部署来说意义重大。27B 是消费级显卡(24GB VRAM)能跑得动的上限附近的密度模型。Qwen 3.6 在这个尺寸上做到了旗舰级的编码水平,意味着你可以在一张 4090 或者 3090 上跑一个编码能力不输给大模型的本地助手。

Qwen 3.6-Max-Preview:更大的野心

同一天发布的还有 Qwen 3.6-Max-Preview(705 个赞)。这个版本的定位更激进——直接对标 GPT 级别的闭源模型。虽然只是 preview 版本,但社区的初步测试反馈很好,尤其是在推理能力和多轮对话上。

Qwen 3.7 Preview:刚出不久

到了 Qwen 3.7 Preview,节奏已经明显加快了。从 3.5 到 3.7 中间间隔的时间越来越短,说明阿里的训练 pipeline 已经跑得很顺了。每次小版本更新都能带来可感知的提升,不是挤牙膏式的升级。

Orthrus:7.8 倍吞吐提升

还有一个值得关注的项目——Orthrus-Qwen3。它在 HN 上拿了 243 个赞。这个项目做的事情很有意思:通过对 Qwen 3 的推理过程进行优化,实现了最高 7.8 倍的 token/forward 吞吐提升,而且输出分布和原始模型完全一致。

这意味着 Qwen 3 的生态不只有官方模型本身,社区的配套优化工具也在快速跟上。

一些争议

当然也不是没有争议。有一篇文章(60 个赞)分析 Qwen 3.5 内部的政治审查机制,通过分析模型权重来揭示它会在哪些话题上做出受限制的回答。这对于开源模型来说是个值得关注的问题——模型虽然开源了,但训练数据的偏向性依然存在。

我的看法

Qwen 现在的迭代节奏让我想起 2023-2024 年 Llama 系列的快速迭代期。但 Qwen 有一点不一样:它的训练似乎更有方向感,每次更新都瞄准了特定方向提升——编码能力、推理能力、MTP 支持。不是那种"多加了些数据再训一遍"的更新,而是架构层面也在同步进化。

如果这个节奏保持下去,Qwen 成为开源 LLM 的事实标准之一,我不会感到意外。