前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >用AI把一段视频变成可视化网页,Google的新模型又卷飞了。

用AI把一段视频变成可视化网页,Google的新模型又卷飞了。

作者头像
数字生命卡兹克
发布于 2025-05-08 08:48:52
发布于 2025-05-08 08:48:52
800
举报

Google也不知道受了什么刺激,最近在AI场上,好像越来越有站起来的意思了。

之前我就写过Gemini 2.5 pro,是在聊天记录可视化的文章里。

全世界,只有Gemini 2.5 pro,能吃下一个每天999+微信群聊天记录的上下文,同时还能给你干出,一个还挺好看的可视化网页。

在Qwen3的跑分中,也印证了,Gemini 2.5 Pro的能力也是真的强。

而我自己在是日常使用中,也几乎是把Gemini 2.5 Pro,变成了我的默认编程模型。

但是昨晚,Google好死不死的,又把模型更新了一版,把版本号变成了,Genmini 2.5 Pro(I/O版)。

而在后台的模型调用里,命名是Gemini 2.5 Pro Preview 05-06。

现在在Gemini自己的产品官网上,虽然看着还是原来的2.5 Pro (experimental),但其实背后的模型已经变成Gemini 2.5 Pro Preview 05-06了。

有一说一,Google你的命名到底能不能统一一下。

真的好乱。。。

而且,Google是真的感觉等不及了,其实距离他们一年一度的I/O大会,也就不到两周时间了,但是还是选择了把新模型直接放出来。

这种行为,一般要么是真牛逼,要么是来吹牛逼。

但是Google,这回是前者,是真的有点牛逼。

他们自己也说了:

We were going to release this update at Google I/O in a couple weeks, but based on the overwhelming enthusiasm for this model, we wanted to get it in your hands sooner so people can start building.

不是我来营销,是真的人民群众需要啊,我只是顺势而为。

这次Gemini 2.5 Pro 05-06版本(后面就简称05-06版了),跟今年三月DeepSeek V3 03-24的更新很像。都是完全为了代码服务的,把代码能力,往上提升了一个巨大的优先级。

而这次的05-06版,我觉得有两个亮点:

1. 模型代码能力在盲测竞技场登顶,力压Claude 3.7 Sonnet。

2. 得益于2.5 Pro强大的多模态能力,这次不仅可以给参考图生成代码,还可以,给参考视频生成代码。

特别是第二点,目前应该是全球唯一。

先看看代码能力的跑分。

这次最核心的榜单,就是,WebDev Arena。

https://web.lmarena.ai/leaderboard

0506版直接脚踩Claude 3.7 Sonnet,勇得第一。

可能很多人不知道WebDev Arena是啥,我稍微解释一下,这玩意,还是挺有含金量的。

LMArena,最著名的大模型盲测竞技场,我相信一直关注AI的,大多数人都或多或少的听过。

跟一些传统的测试集不一样,这玩意就是纯粹的盲测,用户提出一个Prompt,然后LMArena直接给你两个你也不知道是什么模型生成的回答,让你选你觉得哪个好。

所以,在这上面,你几乎就做不了弊,全靠普通用户,一票一票投出来的,就跟拆盲盒一样。

而WebDev Arena,其实就是一个子榜,还是由LMArena他们开发的,专为评测网页前端开发任务(比如HTML、CSS 和 JavaScript)而设立的。

玩法跟LMArena一样,也是用户盲测二选一。

唯一不同的是,WebDev Arena会生成代码的预览给你看,而不只是文字了。

比如我让他生成一个Web的像素猫小游戏。

在等了一分钟两边全部生成完之后,你就能非常明确的看出来,两边哪个是垃圾。。。

傻子都能看出来,右边爆杀左边,这个时候,你就为右边,投出神圣的一票就行。

然后呢,他们用Bradley-Terry(BT)模型,成对对决中的胜负数据,来估算模型的强度,为每个模型计算一个分数,这个分数反映此模型相对于其他模型的获胜概率。

这个排名系统非常类似于国际象棋和LOL、王者荣耀里中常用的Elo分。

只不过在WebDev Arena里,这个分数,叫做Arena Score。

现在,我们再回过头去看,你就能看到,05-06版,是结结实实提高了147分。。。

研究过王者荣耀或者LOL的影藏分也就是ELO分机制的朋友,就知道,这玩意提升100多分有多难。。。

这一次,Google的Gemini,登顶了。

第二个亮点,也是我觉得很牛逼的,05-06版本,也提升了视频的理解能力,在在VideoMME基准测试中得分为84.8%。

这就带来一个很有趣的化学反应。

过去我们经常给一个PDF、给一个图片,让它生成一段可视化网页,但是现在,你可以,给一个视频,来变成可视化网页了。。。

不过现在有点BUG,Gemini官网本身不支持视频的上传,只能在AI Studio里传视频,但而上传的时候,又经常会报错。

Reddit里很多网友也遇到了这个问题。。。

Emmmmm,不过,目前使用YouTube的在线链接生成,目前是可以的。

我们直接打开AI studio的官网:

https://aistudio.google.com/

模型调整至05-06版。

在加号那,选YouTube。

我直接扔了一段OpenAI发在YouTube上的Sora教程上去,然后继续用藏师傅的可视化Prompt。

很快啊,代码就跑出来了。

我们复制一下,运行看看。

完整版网页在此:https://2uwv6grszo.app.yourware.so/

虽然这事,看着很NTR,但是,他真的很酷啊。

这玩意用于学习,你就可以想想,他有多棒。

比如我有时候,回去YouTube上看Blender教程。

现在,我就可以把这个视频和Prompt扔给他。

等输出完代码以后,我们看看效果。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-05-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数字生命卡兹克 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
一文看懂2025 Google I/O开发者大会 - 250刀Ultra会员、Veo3、Imagen4等等全线开花。
说个小插曲,本来我现在,人应该是在硅谷Google总部现场的,因为受到小红书和Google的邀请,喊我去现场看。。。
数字生命卡兹克
2025/05/21
2010
一文看懂2025 Google I/O开发者大会 - 250刀Ultra会员、Veo3、Imagen4等等全线开花。
Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7
昨晚,谷歌放出全新升级的Gemini 2.5 Pro Preview(I/O版),一举拿下三连冠,登顶LMeana。
新智元
2025/05/08
1560
Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7
Gemini 2.5 Pro 再升级!竞技场分数创新高+思考预算,更强 Kingfall 在路上?
官方说,这次是 Gemini 2.5 Pro 的升级预览版,是他们目前最聪明的模型。在五月份发布和 I/O 大会上展示的版本基础上又优化了。几周后,这个版本就会成为正式的稳定版,可以用于企业级应用了。
AI进修生
2025/06/08
1050
Gemini 2.5 Pro 再升级!竞技场分数创新高+思考预算,更强 Kingfall 在路上?
当Claude3.5 遇上 Gemini 2,这个免费的AI编程竞技场炸了。
有人用Gemini 2.0 Flash担任WebDev领域的裁判,在LMSys的竞技场里评判各大模型的编程能力。
AI进修生
2024/12/19
5180
当Claude3.5 遇上 Gemini 2,这个免费的AI编程竞技场炸了。
千亿模型 Yi-Large 杠上万亿 GPT-4 Turbo,多项能力不输 OpenAI
上周,一个名为“im-also-a-good-gpt2-chatbot”的神秘模型突然现身大模型竞技场Chatbot Arena,排名直接超过GPT-4-Turbo、Gemini 1 .5 Pro、Claude 3 0pus、Llama-3-70b等各家国际大厂的当家基座模型。
AI科技评论
2024/05/22
2080
千亿模型 Yi-Large 杠上万亿 GPT-4 Turbo,多项能力不输 OpenAI
【AGI-Eval 行业动态 NO.8】Gemini 2.5 Pro “屠榜”?一手实测“看看实力”
Google 官方在北京时间 26 日晚在 X 上发布了 Gemini 2.5 Pro 发布的公告:
AGI-Eval评测社区
2025/04/02
3400
【AGI-Eval 行业动态 NO.8】Gemini 2.5 Pro “屠榜”?一手实测“看看实力”
用AI把微信聊天记录变成可视化报告,酷到封神。
真的,爬楼爬不动了,信息太多也是一种负担。。。(不是打广告,群已经满了,找我加也进不去。。。)
数字生命卡兹克
2025/04/14
3290
用AI把微信聊天记录变成可视化报告,酷到封神。
黑马!大模型竞技场榜单更新,国产玩家首次进入全球总榜前10
国内大模型公司零一万物旗下的Yi-Large千亿参数闭源大模型,跃升总榜第七,也成为榜上国产大模型第一。
量子位
2024/05/22
2680
黑马!大模型竞技场榜单更新,国产玩家首次进入全球总榜前10
Llama 4 先后被 DeepSeek、英伟达暴击,Meta 不再是大模型开源“霸主”了
当地时间 4 月 8 日,英伟达宣布推出其最新大语言模型 Llama3.1 Nemotron Ultra 253B。该模型基于 Meta 的 Llama-3.1-405B-Instruct 构建,并利用创新的神经架构搜索(NAS)技术进行了深度优化。其性能超越了最近发布的 Llama4,如 Behemoth、Maverick,并在 Hugging Face 平台上开源,引起 AI 社区广泛关注的同时,也再次“暴击”了 Meta。
深度学习与Python
2025/04/13
810
Llama 4 先后被 DeepSeek、英伟达暴击,Meta 不再是大模型开源“霸主”了
AI 看片写 App!Gemini 2.5 首创音视频+代码原生融合+视频理解 SOTA,构建案例来了~
Google 最近更新了两款 Gemini 新模型:Gemini 2.5 Pro (05-06) 和 Gemini 2.5 Flash(04-07)。这俩货在视频理解上来了个大飞跃。
AI进修生
2025/05/10
980
AI 看片写 App!Gemini 2.5 首创音视频+代码原生融合+视频理解 SOTA,构建案例来了~
李开复:不参与“价格战”、模型盲测国内第一欢迎 PK
“我们的模型表现超过了其他模型,欢迎不认同的友商来 LMSYS 打擂台,证明我是错的。但在那发生之前,我们会继续说我们是最好的模型。”李开复在 5 月 21 日的分享会上说道。
深度学习与Python
2024/05/23
920
李开复:不参与“价格战”、模型盲测国内第一欢迎 PK
深夜屠榜,谷歌重回第一
在保持 o3 四分之一以下的低价格的同时,在编码(Aider Polyglot)、推理能力(HLE)、科学(GPQA)等各项基准测试中超越 o3,实现更优性能!
Ai学习的老章
2025/06/08
390
深夜屠榜,谷歌重回第一
Google 推出 Gemini 2.5 Pro:提升推理与编程能力
Google 近日发布了 Gemini 2.5 Pro,这款升级版 AI 模型在推理能力、代码生成和多模态处理方面表现更强。该模型在 LMArena(衡量 AI 回答质量的人类偏好基准)中排名第一,并在数学、科学和逻辑推理等任务上取得了优异成绩。此外,Gemini 2.5 Pro 具备 100 万 token 的上下文窗口,并计划扩展至 200 万 token。
JavaEdge
2025/03/29
3150
一文实测Gemini 2.5 Pro:视频驱动的代码生成,打造交互式开发应用新范式
5月6号,五一假期之后的第一天,Google发布了最新的模型Gemini 2.5 PRO预览版。
AIGC新知
2025/05/08
910
一文实测Gemini 2.5 Pro:视频驱动的代码生成,打造交互式开发应用新范式
谷歌终于登顶一次了!最强推理模型Gemini 2.5 Pro实测体验,真的有点东西
深夜悄悄搞事情的不只 OpenAI,抢在 OpenAI 开直播之前,谷歌上线了最强大的推理模型 Gemini 2.5 Pro。
机器之心
2025/03/27
3130
谷歌终于登顶一次了!最强推理模型Gemini 2.5 Pro实测体验,真的有点东西
Google全新发布AI视频Veo2、AI绘图Imagen3 - 何以凌越。
我几乎从来不使用炸裂这个词,但是AI视频Veo 2的效果,真的让我有点想欢呼,甚至,有点像2月16号那个宿命的一夜,看Sora的感觉。
数字生命卡兹克
2025/04/14
1000
Google全新发布AI视频Veo2、AI绘图Imagen3 - 何以凌越。
断层第一!谷歌推出最强“六边形战士”Gemini 2.5 Pro模型
3月26日深夜,谷歌正式发布了全新思考模型——Gemini 2.5 Pro。此前业界广泛流传的代号"Nebula"神秘模型(现已确认就是Gemini 2.5 Pro)终于揭开面纱。该模型一经面世,便登顶LMSYS Arena榜单,稳居断层第一的位置。
用户11203141
2025/03/29
1190
断层第一!谷歌推出最强“六边形战士”Gemini 2.5 Pro模型
聊聊Gemini 2.0最近3个超级酷的新功能,Google有点被低估了。
昨天晚上11点多,他们又发了一个关于Gemini的更新(其实功能礼拜天就上了,我也不知道他们为啥今天才发推文)。
数字生命卡兹克
2025/04/14
670
聊聊Gemini 2.0最近3个超级酷的新功能,Google有点被低估了。
闭源赶超GPT-4 Turbo、开源击败Llama-3-70B,歪果仁:这中国大模型真香
国内的开发者们或许没有想到,有朝一日,他们开发的 AI 大模型会像出海的网文、短剧一样,让世界各地的网友坐等更新。甚至,来自韩国的网友已经开始反思:为什么我们就没有这样的模型?
机器之心
2024/05/14
2830
闭源赶超GPT-4 Turbo、开源击败Llama-3-70B,歪果仁:这中国大模型真香
[AI Google] I/O 2024大会上我们宣布的100件事情
I/O 2024 发生了很多事情!无论你对最新的 Gemini 应用更新感兴趣,对开发者即将推出的内容感到特别兴奋,还是迫不及待想尝试最新的生成式 AI 工具,这里几乎为每个人都提供了一些内容。不信?以下是我们在过去两天宣布的 100 件事情。
从零开始学AI
2024/05/28
4990
推荐阅读
一文看懂2025 Google I/O开发者大会 - 250刀Ultra会员、Veo3、Imagen4等等全线开花。
2010
Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7
1560
Gemini 2.5 Pro 再升级!竞技场分数创新高+思考预算,更强 Kingfall 在路上?
1050
当Claude3.5 遇上 Gemini 2,这个免费的AI编程竞技场炸了。
5180
千亿模型 Yi-Large 杠上万亿 GPT-4 Turbo,多项能力不输 OpenAI
2080
【AGI-Eval 行业动态 NO.8】Gemini 2.5 Pro “屠榜”?一手实测“看看实力”
3400
用AI把微信聊天记录变成可视化报告,酷到封神。
3290
黑马!大模型竞技场榜单更新,国产玩家首次进入全球总榜前10
2680
Llama 4 先后被 DeepSeek、英伟达暴击,Meta 不再是大模型开源“霸主”了
810
AI 看片写 App!Gemini 2.5 首创音视频+代码原生融合+视频理解 SOTA,构建案例来了~
980
李开复:不参与“价格战”、模型盲测国内第一欢迎 PK
920
深夜屠榜,谷歌重回第一
390
Google 推出 Gemini 2.5 Pro:提升推理与编程能力
3150
一文实测Gemini 2.5 Pro:视频驱动的代码生成,打造交互式开发应用新范式
910
谷歌终于登顶一次了!最强推理模型Gemini 2.5 Pro实测体验,真的有点东西
3130
Google全新发布AI视频Veo2、AI绘图Imagen3 - 何以凌越。
1000
断层第一!谷歌推出最强“六边形战士”Gemini 2.5 Pro模型
1190
聊聊Gemini 2.0最近3个超级酷的新功能,Google有点被低估了。
670
闭源赶超GPT-4 Turbo、开源击败Llama-3-70B,歪果仁:这中国大模型真香
2830
[AI Google] I/O 2024大会上我们宣布的100件事情
4990
相关推荐
一文看懂2025 Google I/O开发者大会 - 250刀Ultra会员、Veo3、Imagen4等等全线开花。
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档