OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o:语音对话更流畅,免费提供
OpenAI
宣告
推出最新旗舰生成式 AI 模型 GPT-4o,该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。最让人惊喜的是,GPT-4o 将免费供给给一切用户运用。OpenAI 首席技能官穆里·穆拉蒂(Muri Murati)表明,GPT-4o 将供给与 GPT-4 平等水平的智能,但在文本、图画以及语音处理方面均取得了进一步提高。
“GPT-4o 能够综合利用语音、文本和视觉信息进行推理,”穆拉蒂在 OpenAI 公司总部举办的主题讲演中表明。GPT-4 是 OpenAI 此前的旗舰模型,能够处理由图画和文本混合而成的信息,并能完结诸如从图画中提取文字或描绘图画内容等使命,GPT-4o 则在此基础上新增了语音处理才能。
GPT-4o 的运转速度将大大提高,最大亮点在于其语音交互形式采用了新技能。OpenAI 一向致力于让用户经过语音与 ChatGPT 进行沟通,似乎与真人对话一般。但是,之前的版别因为推迟问题,严重影响了对话的沉溺感。GPT-4o 则采用了全新的技能,让谈天机器人对话的响应速度大幅提高。
发布会上 OpenAI 展现了运用 GPT-4o 进行语音对话的演示。演示者发问完毕后,GPT-4o 简直能够即时回应,并经过文本转语音功用进行朗诵,让对话感觉愈加天然传神。
另一个演示展现了 GPT-4o 依据要求调整说话时口气,GPT-4o 能够依据指令改动声响,从夸大戏曲到严寒机械,展现了超卓的可塑性。最终,演示还展现了 GPT-4o 的歌唱功用。
以往,OpenAI 发布新版 ChatGPT 模型时,通常会将其置于付费墙之内。不过这次 GPT-4o 将免费供给给一切用户,付费用户则能够享用五倍的调用额度。
此外,OpenAI 还发布了桌面版的 ChatGPT 和新的用户界面。“咱们认识到这些模型正变得越来越杂乱,” 穆拉蒂说道,“但咱们期望用户与人工智能模型的交互体会能够愈加天然、轻松,让用户能够将注意力彻底会集在与模型的协作上,而无需介意界面自身。”