Anthropic 完成 AI 模型升级,推出 Claude Opus 4.5,并大幅降价
大家都在使用↓↓↓
CS:GO免费开箱网站(免费取回):>>点击开箱<<
Anthropic 于 2017 年发行了 Claude Opus 4.5。周一至此,该公司已推出三款机型,这也是该公司在短短两个月内第三次重大产品发布。这款全新旗舰机型在编码基准测试中名列前茅,同时价格也大幅下调。
此次发布标志着Anthropic Games快速迭代计划的圆满结束,该计划始于9月下旬的Claude Sonnet 4.5,并于10月推出了Claude Haiku 4.5。如今,随着Opus的加入,Anthropic Games为其兄弟产品提供了一套完整的工具包:Opus用于复杂的生产工作,Sonnet用于日常任务,而Haiku则用于处理逻辑简单、与速度和效率相关的任务。
Claude Opus 4.5 得分 80.9%SWE-bench 已验证这是一项测试真实世界软件工程任务的基准测试。Opus 的表现略胜 OpenAI 的 GPT-5.1-Codex-Max(77.9%)和 Google 的 Gemini 3 Pro(76.2%)。Anthropic 表示,Opus 在其内部性能工程测试中表现优于所有人类候选人——这项为期两小时的评估旨在考察应试者在压力下的判断力。
人工智能巨头们展开了一场争夺年终榜首的竞赛。谷歌于11月18日发布了Gemini 3 Pro,并将其定位为多模态推理领域的突破性成果。OpenAI第二天就推出了GPT-5.1-Codex-Max予以回应。
几天后,Anthropic 推出了 Opus 作为回应,但它却有一个诱饵:每百万个输入代币定价 5 美元,每百万个输出代币定价 25 美元,这比之前的 Opus 模型降低了 67%。
阿里巴巴的Qwen模型为这场竞争增添了新的维度。该公司于1月下旬发布了Qwen2.5-Max,拥有超过20万亿个训练样本,并声称其在关键基准测试中优于DeepSeek-V3。9月发布的Qwen3-Max拥有超过1万亿个参数,在LMArena全球排名第三,并在各种任务中表现出色。深入研究例如,多模态推理或东方语言的工作流。虽然Qwen模型在西方市场仍然相对冷门,但它们代表了在美国芯片出口限制下,中国推动人工智能自主发展的决心。
这个定价介于 OpenAI 最新的 GPT-5.1(1.25 美元/10 美元)和 Anthropic 较早的 Opus 4.1(15 美元/75 美元)之间,但仍然比 Gemini 3 Pro 的 2 美元/12 美元要贵。此次降价表明市场压力,领先的人工智能实验室不仅在能力上展开竞争,而且在如何使前沿智能在经济上可行,从而实现大规模部署方面也展开了竞争。
克劳德的最新产品虽然比许多亚洲竞争对手的价格更高,但功能也更强大一些。因此,用户现在可以在性价比和纯粹的技术能力之间进行选择。
十四行诗 4.5发布日期:9月30日Haiku 4.5 以适中的成本带来了最先进的编码和代理功能,并且在特定任务上已经优于 Opus 4.1。更简洁的 Haiku 4.5 于 10 月 15 日发布。Opus 4.5 目前处于领先地位,能够处理最复杂的推理和耗时最长的任务。
与 Sonnet 和 GPT-5 类似,Claude Opus 4.5 采用了 Anthropic 所称的“混合推理”架构——一个同时训练用于直接推理和链式推理的单一模型。它支持 20 万个词元的上下文窗口,最多可输出 6.4 万个词元。该模型的知识截止时间为 2025 年 3 月,略早于 Sonnet 的 1 月截止时间。
开发者西蒙·威利森测试了 Opus 4.5整个周末,他都大量使用这个模型重构了自己的一个项目。该模型处理了 39 个文件中的 20 次提交,新增了 2022 行代码,删除了 1173 行代码。“这显然是一个非常棒的新模型,”Willison 写道。不过他也提到,之后回退到 Sonnet 4.5 并没有显著降低他的工作效率。
“我并不是说新模型没有比 Sonnet 4.5 有所改进——但我不能自信地说,我提出的挑战能够识别出两者在功能上的实质性差异,”他写道。
开发者、YouTube博主兼人工智能平台T3 Chat的首席执行官西奥·布朗称Claude Opus 4.5“疯狂”,并补充道:视频评测它“绝对是有史以来最好的编码模型”。
竞争格局日趋拥挤。谷歌的Gemini 3 Pro上周成为新闻焦点,在LMArena上获得了1501分的高分,并赢得了Salesforce首席执行官马克·贝尼奥夫的赞扬。贝尼奥夫表示,他将放弃ChatGPT,转而采用谷歌的模式。这一消息推动Alphabet的股价上涨超过6%。据说OpenAI 首席执行官 Sam Altman 对此感到不安,他告诉同事,Gemini 项目将造成“暂时的经济逆风”。
微软和英伟达宣布上周,Anthropic 获得了数十亿美元的投资,使其估值飙升至约 3500 亿美元。这些交易包括扩大 Azure 集成以及采用英伟达技术的基础设施,用于训练和部署 Claude 模型。
Opus 4.5 现已可通过以下方式获取:人类行为学的APIAWS Bedrock、Google Vertex AI 以及 Claude 网络和桌面应用程序。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。




