首页
学习
活动
专区
圈层
工具
发布
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    大模型榜单周报(20251220)

    排名变化gemini-3-flash 新晋榜单第 5 名gemini-3-flash 的 thinking-minimal 版本排名榜单第 12编程能力榜单(LiveCodeBench GSO Leaderboard...)排名变化GPT-5.2 新晋榜单第 1 位GPT-5.1 排名第 6 位图像编辑能力榜单(Image Edit Arena)排名变化chatgpt-image-latest (20251216)新晋榜单第...1 名gpt-image-1.5 新晋榜单第 3 位,超过 gemini-3-pro-image-preview-2k (nano-banana-pro)reve-v1.1 新晋榜单第 8 名文生图榜单...(Text-to-Image Arena)排名变化gpt-image-1.5 超过 nano banana pro,新晋榜单首位flux-2-max 排名仅次于二者,新晋榜单第 3 名图像编辑能力榜单...Pro,新晋榜单首位FLUX-2-max 排名仅次于二者,新晋榜单第 3 名理科能力榜单(LLM Stats GPQA)排名变化Gemini 3 Flash 新晋榜单第 4 名,得分 90.4%前沿数学能力榜单

    47910

    大模型榜单周报(2026117)

    榜单变化OpenRouter模型调用量排名:整体调用量方面,Claude Opus 4.5超越上周榜首Claude Sonnet 4.5,位列第1;MiMo-V2-Flash(free)上升两名,排名第...,替代了上周MiniMax的位置编程调用量方面,Claude Opus 4.5保持第1;Claude Sonnet 4.5排名上升2名,排名第3;DeepSeek V3.2重回前十,排名第8大语言模型榜单...-5.0-0110新上榜,排名第8,超过GPT-5.1(high),相比ERNIE-5.0-preview-1203版本上升了6名,该模型基于预发布测试,评分可能随着公开发布后的反馈而变化图像编辑能力榜单...:flux-2-max和flux-2-pro新上榜,分别排名第8、第9文生图能力榜单:FLUX.2 devTurbo新上榜,排名第10GAIA榜单:JoinAI V2.2登顶榜首,得分达90.7%4.

    31810

    大模型榜单周报(20251227)

    榜单变化OpenRouter模型调用量:Grok Code Fast 1、Claude Sonnet 4.5、Gemini 2.5 Flash位列前三;小米MiMo-V2-Flash (free)新晋第...Arena):gemini-3-flash刷新成绩,超过Grok 4.1 thinking位列第2;ernie-5.0-preview-1203新晋第13名,超过gpt-5.2(评分基于预发布测试)编程能力榜单...(WebDev Arena):glm-4.7新晋第6名,紧跟gemini-3-flash之后(评分基于预发布测试)编程能力榜单(LiveCodeBench GSO Leaderboard):Gemini...8名,排名在O4-mini之后图像编辑能力(Artificial Analysis Image Editing Leaderboard):Reve V1新晋第8名,排名在Flux 2 Pro之后文生图榜单...Imagen 4 Preview位列第10名前沿数学能力(EPOCH AI FrontierMath):DeepSeek-V3.2以22.1%得分超过Kimi K2 Thinking位列第14名GAIA榜单

    88920

    生成式AI的榜单分析(top100)文章里面有榜单的地址

    标题: 作者: 阑梦清川封面: 摘要: 封面裁剪: 原文地址: 打开评论: true仅粉丝可评论:大家好,我是阑梦清川前段时间,第 5 版《生成式 AI 消费者应用 Top100 榜单》出来了,汇总了两年半以来日常...AI 应用的发展数据,清晰呈现出 AI 工具的使用情况;榜单地址:https://a16z.com/100-gen-ai-apps-5/下面的这个是网页端的这个前50名的AI应用的使用情况,看看有没有你喜欢的这个应用上榜...里面的这个labs以及这个10里面的ai studio,其中这个labs我自己之前是没有使用过的,但是其他的都是自己尝试过的;下面的这个是移动端的统计的结果:豆包,deepseek等国产同样是排在了这个榜单的...展现出来了新生代大模型的卓越的性能下面的这个是统计的国内用户使用国外产品的情况,其实都不是0,这个懂得都懂,科学上网嘛:下面的这个是全明星的阵容,连续五次的迭代过程中,下面的这个产品始终保持在TOP50,非常不错:榜单制作者来自的这个国家的分布的情况...:通过这份榜单,我们看到了生成式AI的基本情况,以上仅仅是一个ai爱好者的非专业的分析,更加详细的内容可以移步到这个文章最开始的榜单链接进行查看,希望这个榜单可以帮助大家,我们需要知道,什么样的AI工具是最受欢迎的

    31210

    OWASP Top 10 2021 榜单出炉!

    近日,OWASP从贡献者提供的数据中选择了8个类别,从高水平的行业调查中选择了2个类别,完成了最新的OWASP Top 10 2021 榜单。...总体来说,2021年新鲜出炉的OWASP Top 10榜单出现了三个新的类别,还有四个类别的名称和范围发生了变化,甚至还对一些类别进行了合并。...2021 OWASP Top 10榜单及变化 A01:访问控制失效(Broken Access Control)从第五位上升到了第一位。94%的应用程序都经过了某种形式的访问控制失效测试。...虽然该类别仍然位列Top 10榜单,但标准化框架的可用性增加似乎有助于解决这一问题。...OWASP Top 10榜单的目的是推动安全行业了解数据贡献公司所面临的漏洞和漏洞利用趋势,以更好地迎接和应对挑战。

    3.3K10

    大模型榜单周报(20251208—20251212)

    前二名不变:Grok Code Fast 1、Claude Sonnet 4.5GPT-OSS-120B 从第9跃升至第3MiniMax M2 降至第5Devstral 2 2512 新晋第9各类能力榜单更新榜单表现亮点大语言模型...GPQA)GPT-5.2 Pro(93.2%)第1,GPT-5.2(92.4%)第2前沿数学(EPOCH AI FrontierMath)GPT-5.2 以40.3%正确率登顶(首次突破40%)GAIA 榜单...周各榜单排名情况OpenRouter 相关排名调用量前三:Grok Code Fast 1、Claude Sonnet 4.5、Gemini 2.5 Flash公司市占率前三:Google、xAI、Anthropic...编程调用量前三:Grok Code Fast 1、Claude Sonnet 4.5、GPT-OSS-120B按公司划分的多维榜单表现榜单领先公司/机构Text Arena(大语言模型)Google、xAI...阿里FrontierMath(前沿数学)OpenAI、Google、月之暗面、Anthropic、xAIHumanity's Last ExamGoogle、OpenAI、AnthropicGAIA 榜单代表性智能体系统

    1.2K10

    TIOBE 10 月榜单发布:Java危?

    10 月 TIOBE 编程语言榜单已最新出炉,一起来看看本月有什么值得关注的新变化吧! # 被 C# 超越,Java 即将跌至第 5 名?...去年 12 月,Java 历史首次被 C++ 超越、跌出榜单前三的事实,令许多程序员深感意外,由此发出不少 “Java 英雄迟暮?”、“Java 真的已死?”的疑惑。...自此以后,这 10 个月来 Java 在 TIOBE 编程语言榜单的排名再也没上过前三,与 C++ 之间的差距也日益扩大。...Java 逐年衰落的其他原因,例如 Java 语言的定义在过去几年里没有太大变化,相比之下“其完全兼容的直接竞争对手 Kotlin 更容易使用,而且免费”——似乎是印证了这个说法,在本月的 Top 20 榜单中...详细榜单信息可参考 TIOBE 官网:https://www.tiobe.com/tiobe-index 整理 | 郑丽媛

    49320
    领券