Claude Sonnet 5 发布,Anthropic 同时推出 AI 科学工作台 | 2026-07-01

Anthropic 昨天发了两个东西:Claude Sonnet 5 和 Claude Science。Sonnet 5 是 Sonnet 系列里智能体能力最强的版本——它能自己制定计划、用浏览器和终端执行任务、自主跑完整套流程。Anthropic 说几个月前这种级别的自主能力还得靠更大更贵的模型。

Sonnet 系列在开发者圈子里口碑不错。Claude Sonnet 3.5、3.6、3.7 是最早在编程和工具调用上让人眼前一亮的模型。后来智能体能力的进步主要集中到了 Opus 系列。Sonnet 5 把差距缩小了很多——性能跟 Opus 4.8 已经很接近,但价格更低。

跟上一代 Sonnet 4.6 比,Sonnet 5 在推理、工具调用、编程和知识工作这几个方面都有提升。Anthropic 自己的安全评估显示,Sonnet 5 在智能体场景下的不当行为率比 Sonnet 4.6 更低,网络安全攻击能力也远低于现在的 Opus 模型。

定价

Sonnet 5 的价格策略挺有意思。到 2026 年 8 月 31 日是优惠期:每百万 tokens 输入 $2(约 ¥14),输出 $10(约 ¥68)。之后回到常规价 $3/$15(¥20/¥102)。参考一下,Opus 4.8 是 $5/$25(¥34/¥170)。

在 BrowseComp(智能体搜索评测)和 OSWorld-Verified(计算机使用评测)上,调节 effort 参数后,Sonnet 5 在中等程度下性价比已经不错,高 effort 时某些任务上能追上 Opus 4.8。

可用性

Sonnet 5 已经向所有用户开放。Free 和 Pro 计划把它设为了默认模型,Max、Team、Enterprise 用户也能用。它同时上线了 Claude Code 和 Claude API,API 名称是 claude-sonnet-5

早期测试者的反馈挺一致:Sonnet 5 做复杂任务时更"执着"。之前 Sonnet 模型做到一半经常卡住,但 Sonnet 5 会自己检查输出、不需要额外指示。早期合作方包括来自 Glean、Lovable、Mercari、Writer 等公司的工程师。


Claude Science:给科学家的工作台

同一天发布的 Claude Science 是个面向科研人员的 AI 工作台。它把科学家日常要面对的十几个分散工具——PubMed、Jupyter、R、集群终端等等——整合到一个环境里。

科研工作很多时候相当繁琐。几十个数据库各有各的 schema,文件格式五花八门,每种都要专门的数据管线,还得在不同工具之间来回切。Claude Science 把这些收拢到一起,可以在一个环境里做文献分析、执行多步研究、生成可发表的图表和论文。

每个产出都带完整溯源:用了什么代码、什么环境、改了哪些东西,都能查到。结果可以验证和复现。

一些技术细节:

Claude Science 即日起以 Beta 形式向 Pro、Max、Team、Enterprise 用户开放。

社区反响

HN 上 Sonnet 5 拿到了 870 points,Claude Science 362 points,开发者社区对这一波发布关注度不低。价格策略也是讨论热点——有人调侃 Anthropic 终于学会打价格战了。

这两款产品放在一起,Anthropic 的路线图比较清楚了:Opus 做通用前沿能力,Sonnet 做高性价比智能体应用,再通过 Claude Science、Claude Code 这类垂直产品在具体领域建壁垒。