Anthropic 完成 AI 模型升级，推出 Claude Opus 4.5，并大幅降价

2025-11-26 02:09:47 csgo

大家都在使用↓↓↓

CS:GO免费开箱网站（免费取回）：>>点击开箱<<

报道：

Anthropic 于 2017 年发行了 Claude Opus 4.5。周一至此，该公司已推出三款机型，这也是该公司在短短两个月内第三次重大产品发布。这款全新旗舰机型在编码基准测试中名列前茅，同时价格也大幅下调。

此次发布标志着Anthropic Games快速迭代计划的圆满结束，该计划始于9月下旬的Claude Sonnet 4.5，并于10月推出了Claude Haiku 4.5。如今，随着Opus的加入，Anthropic Games为其兄弟产品提供了一套完整的工具包：Opus用于复杂的生产工作，Sonnet用于日常任务，而Haiku则用于处理逻辑简单、与速度和效率相关的任务。

Claude Opus 4.5 得分 80.9%SWE-bench 已验证这是一项测试真实世界软件工程任务的基准测试。Opus 的表现略胜 OpenAI 的 GPT-5.1-Codex-Max（77.9%）和 Google 的 Gemini 3 Pro（76.2%）。Anthropic 表示，Opus 在其内部性能工程测试中表现优于所有人类候选人——这项为期两小时的评估旨在考察应试者在压力下的判断力。

人工智能巨头们展开了一场争夺年终榜首的竞赛。谷歌于11月18日发布了Gemini 3 Pro，并将其定位为多模态推理领域的突破性成果。OpenAI第二天就推出了GPT-5.1-Codex-Max予以回应。

几天后，Anthropic 推出了 Opus 作为回应，但它却有一个诱饵：每百万个输入代币定价 5 美元，每百万个输出代币定价 25 美元，这比之前的 Opus 模型降低了 67%。

阿里巴巴的Qwen模型为这场竞争增添了新的维度。该公司于1月下旬发布了Qwen2.5-Max，拥有超过20万亿个训练样本，并声称其在关键基准测试中优于DeepSeek-V3。9月发布的Qwen3-Max拥有超过1万亿个参数，在LMArena全球排名第三，并在各种任务中表现出色。深入研究例如，多模态推理或东方语言的工作流。虽然Qwen模型在西方市场仍然相对冷门，但它们代表了在美国芯片出口限制下，中国推动人工智能自主发展的决心。

这个定价介于 OpenAI 最新的 GPT-5.1（1.25 美元/10 美元）和 Anthropic 较早的 Opus 4.1（15 美元/75 美元）之间，但仍然比 Gemini 3 Pro 的 2 美元/12 美元要贵。此次降价表明市场压力，领先的人工智能实验室不仅在能力上展开竞争，而且在如何使前沿智能在经济上可行，从而实现大规模部署方面也展开了竞争。

克劳德的最新产品虽然比许多亚洲竞争对手的价格更高，但功能也更强大一些。因此，用户现在可以在性价比和纯粹的技术能力之间进行选择。

十四行诗 4.5发布日期：9月30日Haiku 4.5 以适中的成本带来了最先进的编码和代理功能，并且在特定任务上已经优于 Opus 4.1。更简洁的 Haiku 4.5 于 10 月 15 日发布。Opus 4.5 目前处于领先地位，能够处理最复杂的推理和耗时最长的任务。

与 Sonnet 和 GPT-5 类似，Claude Opus 4.5 采用了 Anthropic 所称的“混合推理”架构——一个同时训练用于直接推理和链式推理的单一模型。它支持 20 万个词元的上下文窗口，最多可输出 6.4 万个词元。该模型的知识截止时间为 2025 年 3 月，略早于 Sonnet 的 1 月截止时间。

开发者西蒙·威利森测试了 Opus 4.5整个周末，他都大量使用这个模型重构了自己的一个项目。该模型处理了 39 个文件中的 20 次提交，新增了 2022 行代码，删除了 1173 行代码。“这显然是一个非常棒的新模型，”Willison 写道。不过他也提到，之后回退到 Sonnet 4.5 并没有显著降低他的工作效率。

“我并不是说新模型没有比 Sonnet 4.5 有所改进——但我不能自信地说，我提出的挑战能够识别出两者在功能上的实质性差异，”他写道。

开发者、YouTube博主兼人工智能平台T3 Chat的首席执行官西奥·布朗称Claude Opus 4.5“疯狂”，并补充道：视频评测它“绝对是有史以来最好的编码模型”。

竞争格局日趋拥挤。谷歌的Gemini 3 Pro上周成为新闻焦点，在LMArena上获得了1501分的高分，并赢得了Salesforce首席执行官马克·贝尼奥夫的赞扬。贝尼奥夫表示，他将放弃ChatGPT，转而采用谷歌的模式。这一消息推动Alphabet的股价上涨超过6%。据说OpenAI 首席执行官 Sam Altman 对此感到不安，他告诉同事，Gemini 项目将造成“暂时的经济逆风”。

微软和英伟达宣布上周，Anthropic 获得了数十亿美元的投资，使其估值飙升至约 3500 亿美元。这些交易包括扩大 Azure 集成以及采用英伟达技术的基础设施，用于训练和部署 Claude 模型。

Opus 4.5 现已可通过以下方式获取：人类行为学的APIAWS Bedrock、Google Vertex AI 以及 Claude 网络和桌面应用程序。