OpenAI面向开发者推出GPT-4 Turbo模型新增视觉理解能力

文章来源：企鹅号 - 铋读

近日，OpenAI对外宣布推出了具有视觉能力的最新GPT-4 Turbo模型，命名为GPT-4 Turbo with Vision，并通过OpenAI API向开发人员普遍提供。这一新模型延续了GPT-4 Turbo系列128,000个token的窗口大小，并在知识库截止至2023年12月的基础上，新增了视觉理解能力。

据了解，GPT-4 Turbo with Vision的最大革新之处在于其能够同时处理文本和图像信息，将两者合二为一，极大地简化了开发流程，并拓展了应用前景。过去，开发者需要调用不同的模型来处理这两种类型的信息，而现在他们可以通过一个模型完成这一任务。

OpenAI还分享了一些开发者正在使用GPT-4 Turbo with Vision的有趣案例。例如，AI软件工程助手Devin利用该模型辅助编程；健康健身应用程序Healthify利用图像识别功能扫描用户饮食照片，并提供营养分析；创意平台Make Real则利用该模型将用户的草图转化为可运行的网站。

目前，尽管GPT-4 Turbo with Vision尚未应用于ChatGPT或开放给大众使用，但OpenAI暗示该功能即将登陆ChatGPT，为用户提供更加丰富多样的交互体验。据铋读了解，GPT-4 Turbo with Vision的推出标志着OpenAI在人工智能领域的持续创新和进步，为开发者和用户带来了更加强大、智能的AI技术。

发表于: 2024-04-102024-04-10 09:47:17
原文链接：https://page.om.qq.com/page/OOUSPBiRUJ_2KqxTNxv6UBTw0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

OpenAI面向开发者推出GPT-4 Turbo模型新增视觉理解能力

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

OpenAI面向开发者推出GPT-4 Turbo模型 新增视觉理解能力

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

OpenAI面向开发者推出GPT-4 Turbo模型新增视觉理解能力