OpenAI近日宣布,向所有免费用户推出了基于GPT-4o mini的高级语音模式。这一新功能旨在提供更自然、更流畅的对话体验,使用户能够通过语音与ChatGPT进行实时互动。根据报道,这一高级语音模式采用了GPT-4o mini模型,支持多种语言,并具备多模态能力,能够处理文本、图像和音频输入。
具体来说,GPT-4o mini是GPT-4o的衍生版本,具有更快的速度和更低的成本。它在数学、编码、视觉等推理能力上表现出色,是目前最强大的多模态小模型之一。GPT-4o mini不仅支持文本和图像输入,还计划在未来整合视频和音频功能。 对于免费用户,OpenAI提供了每日配额限制,当达到配额后,对话将自动结束。如果用户需要更长时间的对话,可以考虑订阅ChatGPT Plus服务,每月费用为20美元。此外,高级语音模式还支持自定义提示、记忆、调整速度和声音等功能,为用户提供动态互动的对话界面。 值得注意的是,GPT-4o mini的高级语音模式在2024年8月1日首次向部分ChatGPT Plus用户开放测试,并计划在秋季逐步推广至所有订阅用户。这一模式不仅提升了用户体验,还通过多种防护措施确保了对话的安全性和隐私性。 OpenAI通过推出基于GPT-4o mini的高级语音模式,进一步丰富了其产品线,为用户提供了更加智能化和人性化的交互体验。这一举措不仅展示了OpenAI在AI领域的领先地位,也为未来多模态AI的发展奠定了基础。 |