前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Claude 3.5 Sonnet模型部分功能超越GPT-4o模型

Claude 3.5 Sonnet模型部分功能超越GPT-4o模型

作者头像
攻坚克难的那份表
修改2024-06-24 18:58:31
1020
修改2024-06-24 18:58:31
举报
文章被收录于专栏:AI资讯AI资讯

Anthropic 发布Claude 3.5 Sonnet最新模型 新模型在推理、知识和编码能力评估方面超越了以前的版本和竞争对手GPT 4o模型,同时其运行速度是Claude 3 Opus的两倍。

该模型可在Claude.ai和Claude iOS应用上免费使用。 Claude 3.5 Sonnet的定价为每百万输入tokens 3美元和每百万输出tokens 15美元,具有200K tokens的上下文窗口。其性价比高,适合中高端应用场景。

克劳德头像
克劳德头像

Claude 3.5 Sonnet这是即将推出的 Claude 3.5 型号系列中的第一款产品。Claude 3.5 Sonnet 提高了行业智能标准,在各种评估中均优于竞争对手的型号和 Claude 3 Opus,同时速度和成本与我们的中端型号 Claude 3 Sonnet 相当。

Claude 3.5 Sonnet 现已在 Claude.ai 和 Claude iOS 应用上免费提供,而 Claude Pro 和 Team 计划订阅者可以以更高的速率限制访问它。它也可以通过 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 获得。该模型每百万输入令牌收费 3 美元,每百万输出令牌收费 15 美元,具有 200K 令牌上下文窗口。

克劳德模特家族
克劳德模特家族

以 2 倍速度获取前沿情报

Claude 3.5 Sonnet 为研究生水平推理 (GPQA)、本科生水平知识 (MMLU) 和编码能力 (HumanEval) 设定了新的行业基准。它在掌握细微差别、幽默和复杂指令方面表现出显著的进步,并且擅长以自然、亲切的语气撰写高质量的内容。

Claude 3.5 Sonnet 的运行速度是 Claude 3 Opus 的两倍。这种性能提升加上经济实惠的价格,使 Claude 3.5 Sonnet 成为复杂任务的理想选择,例如上下文相关的客户支持和协调多步骤工作流程。

在内部代理编码评估中,Claude 3.5 Sonnet 解决了 64% 的问题,优于 Claude 3 Opus(解决了 38%)。我们的评估测试了模型修复错误或向开源代码库添加功能的能力,前提是给出了所需改进的自然语言描述。在得到指导和相关工具后,Claude 3.5 Sonnet 可以独立编写、编辑和执行代码,并具有复杂的推理和故障排除功能。它可以轻松处理代码转换,使其特别适合更新旧版应用程序和迁移代码库。

Claude 3.5 Sonnet 基准
Claude 3.5 Sonnet 基准

最先进的视觉

Claude 3.5 Sonnet 是我们迄今为止最强大的视觉模型,在标准视觉基准上超越了 Claude 3 Opus。这些重大改进对于需要视觉推理的任务最为明显,例如解释图表和图形。Claude 3.5 Sonnet 还可以准确地从不完美的图像中转录文本 - 这是零售、物流和金融服务的核心功能,在这些服务中,AI 可以从图像、图形或插图中获得比仅从文本中更多的见解。

Claude 3.5 Sonnet 视觉评估
Claude 3.5 Sonnet 视觉评估

Artifacts——使用 Claude 的新方

今天,我们还将在 Claude.ai 上推出 Artifacts,这是一项新功能,可扩展用户与 Claude 的互动方式。当用户要求 Claude 生成代码片段、文本文档或网站设计等内容时,这些 Artifacts 会与对话一起显示在专用窗口中。这创建了一个动态工作区,用户可以在其中实时查看、编辑和构建 Claude 的创作,将 AI 生成的内容无缝集成到他们的项目和工作流程中。

此预览功能标志着 Claude 从对话式 AI 进化为协作式工作环境。这只是 Claude.ai 更广阔愿景的开始,该愿景很快将扩展以支持团队协作。在不久的将来,团队(最终是整个组织)将能够安全地将他们的知识、文档和正在进行的工作集中在一个共享空间中,而 Claude 将成为随时可用的队友。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
作者已关闭评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
Prowork 团队协同
ProWork 团队协同(以下简称 ProWork )是便捷高效的协同平台,为团队中的不同角色提供支持。团队成员可以通过日历、清单来规划每⽇的工作,同时管理者也可以通过统计报表随时掌握团队状况。ProWork 摒弃了僵化的流程,通过灵活轻量的任务管理体系,满足不同团队的实际情况,目前 ProWork 所有功能均可免费使用。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档