OpenAI推出全新可对话ChatGPT语音机器人
大家都在使用↓↓↓
CS:GO免费开箱网站(免费取回):>>点击开箱<<
来源:量子号
OpenAI 近日正式发布了一款全新的先进人工智能聊天机器人,该机器人支持语音交互功能。尽管目前仅向部分用户开放,但其标志着 OpenAI 在新一代人工智能语音助手领域迈出了重要一步。
这款新的 ChatGPT 语音机器人被设计为类似于 Siri 和 Alexa 的语音助手,但具备更强的功能和更自然的对话体验。它可以识别不同语调传达的信息、对中断做出即时反应,并实时回答用户的提问。此外,该机器人经过训练以生成更自然的声音,能够通过语音表达多种情绪。
新语音模式由 OpenAI 最新的 GPT-4o 模型驱动,该模型融合了语音、文本和视觉能力。为了收集用户反馈,OpenAI 首先向“一小部分”ChatGPT Plus 的付费用户推出了这一功能。公司表示,将在今年秋季向所有 ChatGPT Plus 订阅用户开放。ChatGPT Plus 的订阅费用为每月 20 美元(约合 144 元人民币)。OpenAI 将通过 ChatGPT 应用程序通知首批用户,并提供使用新模型的详细说明。
这项语音功能最初于 5 月份宣布,但由于需要更多时间完善安全功能(例如模型检测和拒绝不良内容的能力),因此比原计划晚了一个月推出。OpenAI 还表示,他们正在优化基础设施,以便为数百万用户提供流畅的实时响应。
在正式推出之前,OpenAI 已与 100 多名外部红队成员合作测试该模型的语音功能。这些测试人员来自 29 个国家,共掌握 45 种语言,任务是探测模型可能存在的缺陷。
OpenAI 强调已实施多项安全机制以保护用户权益。例如,为防止该模型被用于制作音频深度伪造,公司与配音演员合作创建了四种预设声音,且明确表示 GPT-4o 不会模仿或生成他人的声音。
然而,在首次推出 GPT-4o 时,OpenAI 因使用名为“Sky”的语音而引发争议,该声音被认为与女演员斯嘉丽·约翰逊的声音极为相似。约翰逊发表声明称,OpenAI 曾联系她希望获得授权将她的声音用于模型中,但她拒绝了。她表示,在听到模型演示中的声音后感到震惊。对此,OpenAI 否认该声音与约翰逊相关,但仍暂停使用 Sky。
此外,OpenAI 还面临多起涉嫌侵犯版权的诉讼。公司表示,已采用过滤器来识别并阻止生成音乐或其他受版权保护的音频请求。同时,OpenAI 将其在基于文本的模型中使用的安全机制应用于 GPT-4o,以防止其生成违法或有害内容。
展望未来,OpenAI 计划为该助手加入更多高级功能,例如视频和屏幕共享,这将进一步提升其实用性。在 5 月份的一次演示中,员工通过手机摄像头拍摄一张纸上的数学方程式,并要求人工智能帮助解决;他们还共享电脑屏幕,请求模型协助解决编程问题。不过,这些功能目前尚未推出,预计将在未来的某个未指定日期上线。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。