OpenAI上周宣布了其最先进的人工智能模型GPT-5.2,并表示这是迄今为止最适合日常专业使用的产品。




OpenAI表示,该模型在创建电子表格、构建演示文稿、感知图像、编写代码和理解长上下文方面优于之前的模型。它将于周四开始在OpenAI的ChatGPT聊天机器人及其应用程序编程接口(API)中提供。



就在几周前,OpenAI发布了GPT-5.1模型。竞争对手Anthropic和谷歌上个月也推出了新模型,促使OpenAI宣布“红色警报”努力改进ChatGPT,并搁置其他项目。



随着消费者和企业越来越多地将人工智能融入日常生活和工作流程,领先的科技公司之间正在进行一场高风险的战斗,以创造最广泛使用的模型。OpenAI正指望其GPT系列模型来定义未来,因为该公司试图证明其5000亿美元的估值和超过1.4万亿美元的计划支出是合理的。



OpenAI应用程序首席执行官斐济·西莫(Fidji Simo)在周四的新闻发布会上告诉记者:“我们宣布这一红色警报是为了向公司发出一个信号,即我们想要在一个特定领域部署资源,这是一种真正定义优先级和定义可以被取消优先级的事情的方式。”


“总的来说,我们在ChatGPT上投入的资源有所增加,我想说这有助于这个模型的发布,但这并不是它本周特别推出的原因。”



OpenAI首席执行官萨姆·奥特曼(Sam Altman)上周四告诉CNBC, 谷歌发布Gemini 3模型对公司指标的影响没有最初担心的那么大。他说,他预计OpenAI将在明年1月退出红色警报状态。



“我相信,当竞争威胁发生时,你会想要专注于它,迅速应对它。”奥特曼说。



OpenAI表示,GPT-5.2将提供即时版、思考版和专业版。OpenAI表示,即时版在写作和信息搜索方面速度更快,思考版在编码和规划等结构化工作方面表现更好,专业版将为难题提供最准确的答案。



该模型在多项行业基准测试中表现顶尖:在评估智能编码能力的 SWE-Bench Pro、研究生级科学推理测试 GPQA Diamond 中均排名前列;在 OpenAI 今年推出的 GDPval 测试中(涵盖 44 种职业的知识型任务评估),GPT-5.2 在 70.9% 的明确任务中表现优于或持平顶尖行业专业人士。



西莫说:“这已经准备了好几个月了。虽然我们为能够快速发布模型而感到自豪,但这种特殊的整合已经进行了一段时间。”



Anthropic的最新模型Opus 4.5在评估人工智能系统软件编码能力的测试集 SWE-Bench Verified上的得分高于GPT-5.2。OpenAI告诉记者,与 SWE-Bench Pro相比,该基准测试的“抗污染性、挑战性、多样性和工业相关性”较差。



OpenAI 于 10 年前以研究实验室身份成立,2022 年 ChatGPT 推出后,迅速成长为全球增长最快的商业实体之一。目前,其聊天机器人的周活跃用户已超 8 亿。