一文解读:OpenAI GPT-4o模型以及如何获取使用

号优优网uiuihao
预计阅读时长 18 分钟
位置: 首页 AI文本模型 正文

image.png

5 月 14 日凌晨,OpenAI 在首次「春季新品发布会」上搬出了新一代旗舰生成模型 GPT-4o、桌面 App,并展示了一系列新能力。这一次,技术颠覆了产品形态,OpenAI 发布 GPT-4o全能模型 实时语音和视觉能力 再次刷新ai科技业界。

什么是 GPT-4o?

1.GPT-4o 是 OpenAI 的新旗舰模型,可以实时跨音频、视觉和文本进行推理。


2.GPT-4o 最初将在 ChatGPT 和 API 中作为文本和视觉模型提供(ChatGPT 将继续通过预先存在的语音模式功能支持语音)。具体来说,GPT-4o 将在 ChatGPT Free、Plus 和 Team(即将推出 Enterprise)以及 Chat Completions API、Assistants API 和 Batch API 中提供。


3.GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。它可以在短至 232 毫秒的时间内响应音频输入,平均为 320 毫秒,与人类的响应时间相似(在新窗口中打开)在一次谈话中。它在英语文本和代码上的性能与 GPT-4 Turbo 的性能相匹配,在非英语文本上的性能显着提高,同时 API 的速度也更快,成本降低了 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。

在 OpenAI API 中访问 GPT-4、GPT-4 Turbo 和 GPT-4o

GPT-4 Turbo 与 GPT-4o

GPT-4o 具有相同的高智能性,但比 GPT-4 Turbo 更快、更便宜,并且具有更高的速率限制。具体来说:

1.定价:GPT-4o 比 GPT-4 Turbo 便宜 50%,输入代币为 5 美元/M,输出代币为 15 美元/M。

2.速率限制:GPT-4o 的速率限制比 GPT-4 Turbo 高 5 倍——每分钟最多 1000 万个代币。

3.速度:GPT-4o 的速度是 GPT-4 Turbo 的 2 倍。

4.视觉:在与视觉能力相关的评估中,GPT-4o 的视觉能力表现优于 GPT-4 Turbo。

5.多语言:GPT-4o 比 GPT-4 Turbo 改进了对非英语语言的支持。

6.GPT-4o 目前的上下文窗口为 128k,知识截止日期为 2023 年 10 月。

GPT-4o更灵活的语音交互功能提升,以下视频中文翻译来自 X.@宝玉博主

1.OpenAI 邀请了可汗学院的可汗和他儿子一起使用了 GPT-4o 辅导孩子在可汗学院上做数学题,一步步启发纠正,各种鼓励,比普通家长辅导效果可能真的要好不少!

2.跟着 GPT-4o 学西班牙语

3.GPT-4o 实时翻译

4.GPT-4o 充当语音客服

5.GPT-4o,充当你的“第三只眼睛”,帮助盲人描述当前环境,打车

6.GPT-4o 教你说中文,绝对会把老外带偏的

7.以后不用担心一个人过生日太孤单,让 GPT-4o 给你唱首生日歌!🎂

8.初为人父不会讲故事?GPT-4o 教你讲故事!

9.跟 GPT-4o 分享自家狗狗的喜悦!

10.以后睡不着了让 GPT-4o 给你唱首自编的轻柔摇篮曲

11.嫌 GPT-4o 语音速度太快?可以让它语速慢下来。太慢?可以说快一点!快慢随心。

12.让 GPT-4o 加入视频会议,充当会议小秘书,记录发言,总结既要。

13.朋友聚会三缺一?没人当裁判?让 GPT-4o 加入你们 BTW:能认出来谁是谁很厉害

14.需要有人夸你几句或者讥讽你几句?找 GPT-4o 就对了!

15.让 GPT-4o 根据你所处环境猜猜你在干嘛,或者朋友让你猜,你以后可以让它帮忙了

16.要准备去参加重要面试,或者要去相亲,不知道穿着怎么样,让 GPT-4o 帮你瞧瞧,礼貌而不刻薄的指出问题

17.让 GPT-4o 分饰两角,来一首男女二重唱

18.两只老虎两只老虎跑的快,一只没有眼睛一只没有尾巴真奇怪! 哦,不对,是两只 GPT-4o,一只看不见,另一只帮它描述发生了什么,甚至于1分钟之前出现的意外小插曲也能完整记录,最后两只 AI 把整个过程编成了一首歌唱起来


在 GPT-4o 之前,您可以使用语音模式与 ChatGPT 对话,平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒 (GPT-4)。为了实现这一目标,语音模式是由三个独立模型组成的管道:一个简单模型将音频转录为文本,GPT-3.5 或 GPT-4 接收文本并输出文本,第三个简单模型将该文本转换回音频。这个过程意味着主要智能来源GPT-4丢失了大量信息——它无法直接观察音调、多个说话者或背景噪音,也无法输出笑声、歌唱或表达情感。

借助 GPT-4o,我们跨文本、视觉和音频端到端地训练了一个新模型,这意味着所有输入和输出都由同一神经网络处理。由于 GPT-4o 是我们第一个结合了所有这些模式的模型,因此我们仍然只是浅尝辄止地探索该模型的功能及其局限性。

图像视觉能力

此外,GPT-4o 在理解和生成图像方面的能力比任何现有模型都要好得多,此前很多不可能的任务都变得「易如反掌」。

1.比如,你可以让它帮忙把 OpenAI 的 logo 印到杯垫上:

scrnli_2024_5_14 15-40-33.png

经过这段时间的技术攻关,OpenAI 应该已经完美解决了 ChatGPT 生成字体的问题。

2.同时,GPT-4o 还拥有 3D 视觉内容生成的能力,能够从 6 个生成的图像进行 3D 重建:

3.这是一首诗,GPT-4o 可以将其排版为手写样式:

image.png

4.更复杂的排版样式也能搞定:

image.png

5.与 GPT-4o 合作,你只需要输入几段文字,就能得到一组连续的漫画分镜:

image.png

6.而下面这些玩法,应该会让很多设计师有点惊讶:

image.png

7.这是一张由两张生活照演变而来的风格化海报:

image.png

8.多线渲染 - 机器人发短信视角:

image.png


模型评估

根据传统基准测试,GPT-4o 在文本、推理和编码智能方面实现了 GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉功能上设置了新的高水位线

image.png


image.png

image.png

image.png

image.png

API 中的可用性

GPT-4o 可供拥有 OpenAI API 帐户的任何人使用,您可以在Chat Completions API、 Assistants APIBatch API中使用此模型。该模型还支持函数调用和JSON模式。您还可以通过Playground开始。

成功支付 5 美元或更多(使用级别 1)后,您将能够通过 OpenAI API访问GPT-4、GPT-4 Turbo 和 GPT-4o模型。


API 中当前的 GPT-4o 定价可在我们的API 定价页面上找到。


API 请求限制

请注意,ChatGPT 速率限制独立于 API 速率限制。您可以在此处了解有关 API 速率限制的更多信息。

您可以在API 平台的限制部分查看您的 API 速率限制。

但请耐心等待——我们预计会有大量需求,并将在未来几个月内扩大和优化我们的系统。

我们如何处理发送到 OpenAI API 的数据

与我们平台的其他部分一样,传递到 OpenAI API 的数据和文件绝不会用于训练我们的模型,除非您明确选择参加训练。您可以在此处详细了解我们的数据保留和合规性标准。

使用 ChatGPT 访问 GPT-4o

ChatGPT 免费套餐

免费套餐的用户将默认使用 GPT-4o,并且使用 GPT-4o 可以发送的消息数量受到限制,这将根据当前的使用情况和需求而有所不同。当不可用时,免费层用户将切换回 GPT-3.5。

免费用户还可以使用高级工具对消息进行有限的访问,例如:

  • 数据分析

  • 文件上传

  • 浏览
  • 发现和使用 GPT

  • 想象

GPT-4o 具有先进的视觉功能,可提高理解您共享的图像的准确性。


GPT-4o这么强,全都免费开放了,这是劝大家不续订ChatGPT Plus了的意思吗?

那肯定不是啊~免费套餐的用户将默认使用 GPT-4o,并且使用 GPT-4o 可以发送的消息数量受到限制;

获取试用:实测把梯子切换到日本IP就可以用gpt-4o,切换回美国IP就消失了。根据IP给的GPT-4o,还有其他部分地区应该也会给

普号GPT-4o和付费有以下比较大的区别:

1.普号GPT-4o不可以画图,传文件(有的可以传)。付费可以

2.普号的GPT-4o限制10条/3小时

3.ChatGPT Plus限制GPT-4o消息80条/3小时,GPT-4仍然是40条,GPT-4用完后可以用GPT-4o,但是GPT-4o的80条用完后不能用GPT-4。

4.team限制100条/3小时,和4共享额度

5.普号的GPT-4o是8k,付费的是32k

6.能力测试不及gpt-4 turbo系列

总结:GPT-4o新模型免费体验有限制,Plus 用户将能够在 GPT-4o 上每 3 小时最多发送 80 条消息,在 GPT-4 上每 3 小时最多发送 40 条消息,team限制100条/3小时,和4共享额度

号优优网温馨提醒;订阅ChatGPT Plus包月,如果你是在国内办理的卡都是无法支付的,自己没有条件可以借助 uiuihao.com 这类平台代付订阅Plus。

4o14160720.png


免费套餐用户可以随时点击 ChatGPT 升级到 Plus:



ChatGPT Plus 和团队

ChatGPT Plus 和 Team 订阅者可以在chatgpt.com上访问 GPT-4 和 GPT-4o ,并具有更大的使用上限。

ChatGPT Plus 和 Team 用户将能够从页面顶部的下拉菜单中选择 GPT-4o:

截至 2024 年 5 月 13 日,Plus 用户将能够在 GPT-4o 上每 3 小时最多发送 80 条消息,在 GPT-4 上每 3 小时最多发送 40 条消息。我们可能会减少高峰时段的限制,以使 GPT-4 和 GPT-4o 可供最广泛的人使用。

ChatGPT Team 工作区中用户的 GPT-4 和 GPT-4o 消息上限高于 ChatGPT Plus。

请注意,未使用的消息不会累积(即,如果您等待 6 小时,则在接下来的 3 小时内 GPT-4 上将没有 80 条消息可供使用)。

聊天GPT企业

ChatGPT Enterprise 客户很快就能访问 GPT-4o。

ChatGPT Enterprise 计划专为满足大型企业的需求而设计,可无限制、高速访问 GPT-4o 和 GPT-4。

ChatGPT Enterprise 帐户上的新对话将默认为 GPT-4o。 ChatGPT Enterprise 用户将能够从页面顶部的下拉菜单中选择其他型号:

ChatGPT Enterprise 还提供企业级安全和隐私、用于处理较长输入的较长上下文窗口、对数据分析、自定义选项等高级工具的无限制高速访问。

新的桌面 app 简化用户工作流程

对于免费和付费用户,OpenAI 还推出了适用于 macOS 的新 ChatGPT 桌面应用程序。通过简单的键盘快捷键(Option + Space),用户可以立即向 ChatGPT 提问,此外,用户还可以直接在应用程序中截取屏幕截图并进行讨论。

现在,用户还可以直接从计算机与 ChatGPT 进行语音对话,GPT-4o 的音频和视频功能将在未来推出,通过点击桌面应用程序右下角的耳机图标来开始语音对话。

从今天开始,OpenAI 将向 Plus 用户推出 macOS 应用程序,并将在未来几周内更广泛地提供该应用程序。此外今年晚些时候 OpenAI 会推出 Windows 版本。

声明:本文内容及配图来自互利网收集整理撰写或者入驻合作网站授权转载。文章及其配图仅供学习之用,如有内容图片侵权或者其他问题,请联系本站侵删。
-- 展开阅读全文 --
头像
小红书账号被封禁无法注销,注册手机号解绑释放教程~
« 上一篇 05-07
GPT-4o 8 个疯狂的例子展示了它的能力
下一篇 » 05-21

相关文章

取消
微信二维码
微信二维码
支付宝二维码

发表评论

暂无评论,1014人围观

作者信息

似水流年

今日已经过去小时
这周已经过去
本月已经过去
今年已经过去个月

热门文章

系统获取,无需修改

标签列表

目录[+]