Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >全面解读:OpenAI GPT-4o模型及其获取与使用方法

全面解读:OpenAI GPT-4o模型及其获取与使用方法

作者头像
攻坚克难的那份表
修改于 2024-07-01 09:42:03
修改于 2024-07-01 09:42:03
9070
举报
文章被收录于专栏:AI资讯AI资讯

OpenAI 在「春季新品发布会」上搬出了新一代旗舰生成模型 GPT-4o、桌面 App,并展示了一系列新能力。这一次,技术颠覆了产品形态,OpenAI 发布 GPT-4o全能模型 实时语音和视觉能力 再次刷新ai科技业界。

什么是 GPT-4o?

1.GPT-4o 是 OpenAI 的新旗舰模型,可以实时跨音频、视觉和文本进行推理。

2.GPT-4o 最初将在 ChatGPTAPI 中作为文本和视觉模型提供(ChatGPT 将继续通过预先存在的语音模式功能支持语音)。具体来说,GPT-4o 将在 ChatGPT Free、Plus 和 Team(即将推出 Enterprise)以及 Chat Completions API、Assistants API 和 Batch API 中提供。

3.GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。它可以在短至 232 毫秒的时间内响应音频输入,平均为 320 毫秒,与人类的响应时间相似(在新窗口中打开)在一次谈话中。它在英语文本和代码上的性能与 GPT-4 Turbo 的性能相匹配,在非英语文本上的性能显着提高,同时 API 的速度也更快,成本降低了 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。

在 OpenAI API 中访问 GPT-4、GPT-4 Turbo 和 GPT-4o

GPT-4 Turbo 与 GPT-4o

GPT-4o 具有相同的高智能性,但比 GPT-4 Turbo 更快、更便宜,并且具有更高的速率限制。具体来说:

1.定价:GPT-4o 比 GPT-4 Turbo 便宜 50%,输入代币为 5 美元/M,输出代币为 15 美元/M。

2.速率限制:GPT-4o 的速率限制比 GPT-4 Turbo 高 5 倍——每分钟最多 1000 万个代币。

3.速度:GPT-4o 的速度是 GPT-4 Turbo 的 2 倍。

4.视觉:在与视觉能力相关的评估中,GPT-4o 的视觉能力表现优于 GPT-4 Turbo。

5.多语言:GPT-4o 比 GPT-4 Turbo 改进了对非英语语言的支持。

6.GPT-4o 目前的上下文窗口为 128k,知识截止日期为 2023 年 10 月。

GPT-4o更灵活的语音交互功能提升

在 GPT-4o 之前,您可以使用语音模式与 ChatGPT 对话,平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒 (GPT-4)。为了实现这一目标,语音模式是由三个独立模型组成的管道:一个简单模型将音频转录为文本,GPT-3.5 或 GPT-4 接收文本并输出文本,第三个简单模型将该文本转换回音频。这个过程意味着主要智能来源GPT-4丢失了大量信息——它无法直接观察音调、多个说话者或背景噪音,也无法输出笑声、歌唱或表达情感。

借助 GPT-4o,我们跨文本、视觉和音频端到端地训练了一个新模型,这意味着所有输入和输出都由同一神经网络处理。由于 GPT-4o 是我们第一个结合了所有这些模式的模型,因此我们仍然只是浅尝辄止地探索该模型的功能及其局限性。

图像视觉能力

此外,GPT-4o 在理解和生成图像方面的能力比任何现有模型都要好得多,此前很多不可能的任务都变得「易如反掌」。

1.比如,你可以让它帮忙把 OpenAI 的 logo 印到杯垫上:

scrnli_2024_5_14 15-40-33.png
scrnli_2024_5_14 15-40-33.png

经过这段时间的技术攻关,OpenAI 应该已经完美解决了 ChatGPT 生成字体的问题。

2.同时,GPT-4o 还拥有 3D 视觉内容生成的能力,能够从 6 个生成的图像进行 3D 重建:

3.这是一首诗,GPT-4o 可以将其排版为手写样式:

image.png
image.png

4.更复杂的排版样式也能搞定:

image.png
image.png

5.与 GPT-4o 合作,你只需要输入几段文字,就能得到一组连续的漫画分镜:

image.png
image.png

6.而下面这些玩法,应该会让很多设计师有点惊讶:

image.png
image.png

7.这是一张由两张生活照演变而来的风格化海报:

image.png
image.png

8.多线渲染 - 机器人发短信视角:

image.png
image.png

模型评估

根据传统基准测试,GPT-4o 在文本、推理和编码智能方面实现了 GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉功能上设置了新的高水位线

image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png

API 中的可用性

GPT-4o 可供拥有 OpenAI API 帐户的任何人使用,您可以在Chat Completions API、 Assistants APIBatch API中使用此模型。该模型还支持函数调用和JSON模式。您还可以通过Playground开始。

成功支付 5 美元或更多(使用级别 1)后,您将能够通过 OpenAI API访问GPT-4、GPT-4 Turbo 和 GPT-4o模型。

了解有关为您的 OpenAI 帐户添加积分的更多信息。

API 中当前的 GPT-4o 定价可在我们的API 定价页面上找到。

获取 API Key

要使用 ChatGPT-4o API,需要先注册一个 OpenAI 账号并获取 API Key。以下是具体步骤:

访问 OpenAI 官网 并注册账号。

登录后,在账户设置中找到 API Keys 部分。

创建新的 API Key 并保存好,切勿泄露。

预充值,在“Anthropic”中选择“API keys”输入预充值金额,最低为5美元。

API 请求限制

请注意,ChatGPT 速率限制独立于 API 速率限制。您可以在此处了解有关 API 速率限制的更多信息。

您可以在API 平台的限制部分查看您的 API 速率限制。

但请耐心等待——我们预计会有大量需求,并将在未来几个月内扩大和优化我们的系统。

我们如何处理发送到 OpenAI API 的数据

与我们平台的其他部分一样,传递到 OpenAI API 的数据和文件绝不会用于训练我们的模型,除非您明确选择参加训练。您可以在此处详细了解我们的数据保留和合规性标准。

使用 ChatGPT 访问 GPT-4o

ChatGPT 免费套餐

免费套餐的用户将默认使用 GPT-4o,并且使用 GPT-4o 可以发送的消息数量受到限制,这将根据当前的使用情况和需求而有所不同。当不可用时,免费层用户将切换回 GPT-3.5。

免费用户还可以使用高级工具对消息进行有限的访问,例如:

GPT-4o 具有先进的视觉功能,可提高理解您共享的图像的准确性。

GPT-4o这么强,全都免费开放了,这是劝大家不续订ChatGPT Plus了的意思吗?

那肯定不是啊~免费套餐的用户将默认使用 GPT-4o,并且使用 GPT-4o 可以发送的消息数量受到限制;

获取试用:实测把梯子切换到日本IP就可以用gpt-4o,切换回美国IP就消失了。根据IP给的GPT-4o,还有其他部分地区应该也会给

普号GPT-4o和付费有以下比较大的区别:

1.普号GPT-4o不可以画图,传文件(有的可以传)。付费可以

2.普号的GPT-4o限制10条/3小时

3.ChatGPT Plus限制GPT-4o消息80条/3小时,GPT-4仍然是40条,GPT-4用完后可以用GPT-4o,但是GPT-4o的80条用完后不能用GPT-4。

4.team限制100条/3小时,和4共享额度

5.普号的GPT-4o是8k,付费的是32k

6.能力测试不及gpt-4 turbo系列

总结:GPT-4o新模型免费体验有限制,Plus 用户将能够在 GPT-4o 上每 3 小时最多发送 80 条消息,在 GPT-4 上每 3 小时最多发送 40 条消息,team限制100条/3小时,和4共享额度。

4o14160720.png
4o14160720.png

免费套餐用户可以随时点击 ChatGPT 升级到 Plus:

ChatGPT Plus 和团队

ChatGPT Plus 和 Team 订阅者可以在chatgpt.com上访问 GPT-4 和 GPT-4o ,并具有更大的使用上限。

ChatGPT Plus 和 Team 用户将能够从页面顶部的下拉菜单中选择 GPT-4o:

截至 2024 年 5 月 13 日,Plus 用户将能够在 GPT-4o 上每 3 小时最多发送 80 条消息,在 GPT-4 上每 3 小时最多发送 40 条消息。我们可能会减少高峰时段的限制,以使 GPT-4 和 GPT-4o 可供最广泛的人使用。

ChatGPT Team 工作区中用户的 GPT-4 和 GPT-4o 消息上限高于 ChatGPT Plus。

请注意,未使用的消息不会累积(即,如果您等待 6 小时,则在接下来的 3 小时内 GPT-4 上将没有 80 条消息可供使用)。

聊天GPT企业

ChatGPT Enterprise 客户很快就能访问 GPT-4o。

ChatGPT Enterprise 计划专为满足大型企业的需求而设计,可无限制、高速访问 GPT-4o 和 GPT-4。

ChatGPT Enterprise 帐户上的新对话将默认为 GPT-4o。 ChatGPT Enterprise 用户将能够从页面顶部的下拉菜单中选择其他型号:

ChatGPT Enterprise 还提供企业级安全和隐私、用于处理较长输入的较长上下文窗口、对数据分析、自定义选项等高级工具的无限制高速访问。

新的桌面 app 简化用户工作流程

对于免费和付费用户,OpenAI 还推出了适用于 macOS 的新 ChatGPT 桌面应用程序。通过简单的键盘快捷键(Option + Space),用户可以立即向 ChatGPT 提问,此外,用户还可以直接在应用程序中截取屏幕截图并进行讨论。

现在,用户还可以直接从计算机与 ChatGPT 进行语音对话,GPT-4o 的音频和视频功能将在未来推出,通过点击桌面应用程序右下角的耳机图标来开始语音对话。

从今天开始,OpenAI 将向 Plus 用户推出 macOS 应用程序,并将在未来几周内更广泛地提供该应用程序。此外今年晚些时候 OpenAI 会推出 Windows 版本。

文章由-uiuihao博客网整理发布

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
作者已关闭评论
暂无评论
推荐阅读
编辑精选文章
换一批
OpenAI 2024 Spring推出 GPT-4o,这是OpenAI的新旗舰模型,可以实时对音频、视觉和文本进行推理
OpenAI 2024 Spring推出 GPT-4o,这是OpenAI的新旗舰模型,可以实时对音频、视觉和文本进行推理。
小小纽扣
2024/05/14
2400
GPT-4o 发布了,山姆宣布 GPT-4o 将对所有用户开放,包括免费计划用户
首先,我们使命的一个关键部分是将非常强大的人工智能工具免费(或以优惠的价格)提供给人们。我非常自豪我们在 ChatGPT 中免费提供了世界上最好的模型,没有广告或类似的东西。
LIYI
2024/05/21
4530
GPT-4o 发布了,山姆宣布 GPT-4o 将对所有用户开放,包括免费计划用户
GPT-4o:深夜炸场,她 来了!
在我们的深夜、太平洋时间的上午 10 点,OpenAI 召开春季发布会,推出了一款名为GPT-4o的“旗舰级”生成式人工智能模型,并将在未来几周内在公司面向开发者和消费者的产品中迭代推出。该模型将向免费客户开放,这意味着任何人都可以通过 ChatGPT 访问 OpenAI 最先进的技术。
NewBeeNLP
2024/05/14
3890
GPT-4o:深夜炸场,她 来了!
OpenAI推出最新大模型“GPT-4o”,你的快乐悲伤它都能读懂
如果说黄仁勋(Jensen Huang)是科技届的泰勒·斯威夫特,以亲和力和号召力获得了一众拥趸,那萨姆·奥尔特曼(Sam Altman)就有些像AI届的金·卡戴珊,永远擅长制造话题和抢风头。
数据猿
2024/05/17
2810
OpenAI推出最新大模型“GPT-4o”,你的快乐悲伤它都能读懂
现在,所有人都能免费用GPT-4o了!
「所有ChatGPT免费用户现在都可以使用浏览、视觉、数据分析、文件上传和GPTs。」
新智元
2024/06/05
7850
现在,所有人都能免费用GPT-4o了!
OpenAI颠覆世界:GPT-4o完全免费,实时语音视频交互震撼全场,直接进入科幻时代
当各家科技公司还在追赶大模型多模态能力,把总结文本、P 图等功能放进手机里的时候,遥遥领先的 OpenAI 直接开了大招,发布的产品连自家 CEO 奥特曼都惊叹:就像电影里一样。
机器之心
2024/05/14
3240
OpenAI颠覆世界:GPT-4o完全免费,实时语音视频交互震撼全场,直接进入科幻时代
OpenAI一夜改写历史,GPT-4o干翻所有语音助手!丝滑如真人引爆全网科幻成真
看完发布会的观众们,久久未从巨大的震惊中走出——科幻电影中的「Her」,在此刻成真了!
新智元
2024/05/14
2470
OpenAI一夜改写历史,GPT-4o干翻所有语音助手!丝滑如真人引爆全网科幻成真
如何评价GPT-4o?
简介:最近,GPT-4o横空出世。对GPT-4o这一人工智能技术进行评价,包括版本间的对比分析、GPT-4o的技术能力以及个人感受等。
正在走向自律
2024/12/18
1810
如何评价GPT-4o?
GPT-4o mini发布,OpenAI正式加入小模型竞争领域
而且原版的GPT-3.5已经不见了,官方称是为了能够让AI普及到更多普通人,所以推出了新的小模型GPT-4o mini。
算法一只狗
2024/07/20
2390
GPT-4o mini发布,OpenAI正式加入小模型竞争领域
GPT-4o 屠龙式震撼!多模态、实时交互、全员免费可用,丝滑语音交互的 ChatGPT 这把赢麻了
OpenAI 发布 GPT-4o,ChatGPT 基于GPT-4o 实现了语音交互,并在文本与视觉能力上有显著提升。
HyperAI超神经
2024/05/14
7020
GPT-4o 屠龙式震撼!多模态、实时交互、全员免费可用,丝滑语音交互的 ChatGPT 这把赢麻了
[AI OpenAI] 您好,GPT-4o
GPT-4o(“o”代表“omni”)是朝着更加自然的人机交互迈出的一步——它可以接受任何组合的文本、音频和图像作为输入,并生成任何组合的文本、音频和图像输出。它可以在短至232毫秒内响应音频输入,平均响应时间为320毫秒,这与人类在对话中的响应时间相似。它在英文文本和代码处理方面与GPT-4 Turbo的性能相当,在非英语语言的文本处理上有显著提升,同时API的速度更快且成本降低50%。与现有模型相比,GPT-4o在视觉和音频理解方面特别出色。
从零开始学AI
2024/05/14
1710
[AI OpenAI] 您好,GPT-4o
关于实时语音对话模型GPT-4o,你想说?
今天看了一篇文章,内容是关于利用Snowflake算法生成分布式唯一ID的文章,整个文章标题【分布式唯一ID生成:深入理解Snowflake算法在Go中的实现】,文章链接:https://cloud.tencent.com/developer/article/2466155 整篇文章详细介绍了Snowflake 算法以及雪花算法的 Go 语言实现,内容详尽,可以帮助大家快速理解Snowflake 算法。
六月的雨在Tencent
2024/11/17
2900
[AI OpenAI] 引入 GPT-4o 及更多工具至免费版 ChatGPT 用户
与我们的使命一致,我们专注于推进人工智能技术,并确保它对所有人都可访问且有益。今天,我们推出了最新的模型 GPT-4o,并将向 ChatGPT 免费用户提供更多智能和高级工具。
从零开始学AI
2024/05/15
3130
[AI OpenAI] 引入 GPT-4o 及更多工具至免费版 ChatGPT 用户
OpenAI发布GPT-4o Mini,好用且性价比高
Spring Update | openAI上新GPT-4o,虚拟的那个Her来了
AIGC新知
2024/10/08
2160
OpenAI发布GPT-4o Mini,好用且性价比高
OpenAI 官宣旗舰模型 GPT-4o,完全免费、无障碍与人交谈!奥特曼:这是我们最好的模型
上周,关于 OpenAI 即将发布重大更新的报道层出不穷。有报道称,ChatGPT 制造商 OpenAI 计划通过推出 Google 搜索的竞争对手来增强聊天机器人的功能并开拓新市场。报道还称,这款新搜索产品可能会在 5 月 13 日 Google I/O 大会前一天发布。不过 Altman 否认了此类传言。
深度学习与Python
2024/05/15
2190
OpenAI 官宣旗舰模型 GPT-4o,完全免费、无障碍与人交谈!奥特曼:这是我们最好的模型
长文梳理!近年来GPT系列模型的发展历史:从GPT-1到GPT-4o(前世、今生)
随着ChatGPT的发布,大语言模型的关注度和数量都在不断上升,它引领了人类进入了大模型时代,并且随着一轮一轮的迭代,最新模型已经进化到了GPT-4o。在众多大语言模型中,GPT系列因其代表性而备受关注,其发展历程和技术革新值得深入探讨。那么今天带大家回顾一下近年来GPT系列模型的发展。【参考中国人民大学《大语言模型》】
ShuYini
2024/06/19
3.4K0
长文梳理!近年来GPT系列模型的发展历史:从GPT-1到GPT-4o(前世、今生)
OpenAI“杀疯了”,GPT–4o模型保姆级使用教程!一遍就会!
5月14日凌晨1点,OpenAI发布了名为GPT-4o 最新的大语言模型,再次引领了人工智能领域的又一创新浪潮,让整个行业都为之震动。
测试开发技术
2024/05/28
4K0
OpenAI“杀疯了”,GPT–4o模型保姆级使用教程!一遍就会!
免费GPT-4o来袭,音频视觉文本实现「大一统」
今天凌晨,即北京时间5月14日1点整,OpenAI 召开了首场春季发布会,CTO Mira Murati 在台上和团队用短短不到30分钟的时间,揭开了最新旗舰模型 GPT-4o 的神秘面纱,以及基于 GPT-4o 的 ChatGPT,均为免费使用。
AI科技评论
2024/05/14
2520
免费GPT-4o来袭,音频视觉文本实现「大一统」
GPT-4o简介
GPT-4o是OpenAI为聊天机器人ChatGPT发布的语言模型,其名称中的“o”代表Omni,即全能的意思,凸显了其多功能的特性。以下是对GPT-4o的详细介绍:
jack.yang
2025/04/05
3360
Open AI发布GPT-4o,开启新的人机交互革命
—、Open AI此次一系列的应用能力展示、API降价、GPT免费,足以说明了Open AI希望推动AI全民应用的决心 来源 / ToB行业头条 (ID:wwwqifu) 作者 / 樊航
ToB行业头条
2024/11/30
2780
Open AI发布GPT-4o,开启新的人机交互革命
推荐阅读
相关推荐
OpenAI 2024 Spring推出 GPT-4o,这是OpenAI的新旗舰模型,可以实时对音频、视觉和文本进行推理
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档