OpenAI 的最新升级本质上是让用户可以使用ChatGPT进行直播

Cointelegraph5月14日报道:ChatGPT 的重大升级被称为 GPT Omni,它允许聊天机器人实时解释视频和音频,并像人类一样更令人信服地说话。



ChatGPT 的创建者 OpenAI 宣布了其最新的人工智能模型 GPT-4o,这是一个更健谈、更人性化的人工智能聊天机器人,它可以解释用户的音频和视频并实时响应。


该公司发布的一系列演示显示,GPT-4 Omni 可以帮助潜在用户做好面试准备等工作(确保他们在面试中表现得体面),以及致电客户服务代理获取更换的 iPhone。


其他演示显示,它可以分享爸爸的笑话,实时翻译双语对话,担任两个用户之间石头剪刀布比赛的裁判,并在被问到时以讽刺的方式回应。 一个演示甚至展示了 ChatGPT 在第一次被介绍给用户的小狗时的反应。


“你好,库巴!你不是最可爱的小东西吗?” 聊天机器人惊呼道。


“感觉就像电影中的人工智能; 该公司首席执行官萨姆·奥尔特曼 (Sam Altman) 在 5 月 13 日的博客文章中说道:


“事实证明,达到人类水平的响应时间和表达能力是一个巨大的变化。”


OpenAI 在最近的 X 帖子中表示,纯文本和图像输入版本已于 5 月 13 日推出,完整版本将在未来几周内推出。


GPT-4o 将可供付费和免费 ChatGPT 用户使用,并可通过 ChatGPT 的 API 进行访问。


OpenAI 表示,GPT-4o 中的“o”代表“omni”,旨在标志着迈向更自然的人机交互的一步。


与 OpenAI 早期的人工智能工具(例如 ChatGPT-4)相比,GPT-4o 同时处理任何文本、音频和图像输入的能力是一个相当大的进步,后者在被迫执行多任务时经常“丢失大量信息” 。


OpenAI 表示,“与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色”,其中甚至包括捕捉用户的情绪和呼吸模式。


在 OpenAI 的 API 中,它也比 GPT-4 Turbo“快得多”和“便宜 50%”。


OpenAI 声称,新的人工智能工具可以在短短 2.3 秒内响应音频输入,平均时间为 3.2 秒,这与人类在普通对话中的响应时间相似。


新闻来源:Cointelegraph   作者:Brayden Lindrea

编辑:Marine Don


(声明:请读者严格遵守所在地法律法规,本文不代表任何投资建议)

本文来源:元宇宙头条 文章作者:元宇宙头条
收藏
举报
元宇宙头条
累计发布内容523篇 累计总热度10万+
523篇 10万+
FTX 后院起火,Binance 釜底抽薪
FTX 后院起火,Binance 釜底抽薪
FTX 后院起火,Binance 釜底抽薪

元宇宙头条现已开放专栏入驻,详情请见入驻指南: #

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表元宇宙头条观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

评论 共0条
默认
|
点赞
说点什么吧
相关文章
您需要登录后才可以回帖 立即登录