前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >生成视频好看还不够,还要能自由探索!昆仑万维开源Matrix-Game,单图打造游戏世界

生成视频好看还不够,还要能自由探索!昆仑万维开源Matrix-Game,单图打造游戏世界

作者头像
机器之心
发布于 2025-05-14 02:18:07
发布于 2025-05-14 02:18:07
1030
举报
文章被收录于专栏:机器之心机器之心

机器之心报道

作者:张倩、泽南

世界模型的进度条,最近坐上了火箭。

去年 11 月,两家创业公司打造的 Oasis,首次在开源世界模型中实现了实时、可玩、可交互。生成的虚拟环境不仅包含画面,也体现出了对物理和游戏规则的理解。

Oasis 世界模型的演示动画。

今年 4 月,微软开源的交互式世界模型 MineWorld,再次提升了视觉效果,大幅提升了动作生成的一致性。

MineWorld 模型的生成效果。

上个星期,又有国外创业公司开源了 「多元宇宙」,能让不同玩家在一个世界模型里进行游戏。

眼看三维世界的 AI 研究越来越多,英伟达人工智能总监、杰出科学家 Jim Fan 提出了「物理图灵测试」,要给具身智能设立一个像图灵测试一样的标准:如果你分辨不出一个现实世界场景是不是由 AI 布置出来的,那完成任务的 AI 就可以认为通过了测试。

从前沿技术、应用再到测试基准,我们正在见证技术的全面兴起,众多科技公司蜂拥而入,仿佛大模型的爆发又要重演一遍。或许过不了多久,计算平台处理的单位就不再是 token,而是物理世界中的原子了。

今天又有更大的新闻曝出:5 月 13 日,昆仑万维宣布开源交互式世界基础模型 Matrix-Game,这不仅是世界模型技术向前迈进的一大步,更是空间智能领域交互式世界生成的重要里程碑。

  • Github:https://github.com/SkyworkAI/Matrix-Game
  • HuggingFace:https://huggingface.co/Skywork/Matrix-Game
  • 技术报告:https://github.com/SkyworkAI/Matrix-Game/blob/main/assets/report.pdf
  • 项目主页:https://matrix-game-homepage.github.io

作为一款世界基础模型,Matrix-Game 能够生成完整可交互的游戏世界,能够对人类输入的操作指令进行正确响应,保留了游戏世界的空间结构与物理特性,画面也更加精致,超越了以往所有类似开源世界模型

当然,它应用的应用范围不仅限于游戏,对于具身智能体训练与数据生成、影视与元宇宙内容生产也有重要意义。

昆仑万维表示,Matrix-Game 让世界不再只是被观看,而是被探索、被操控、被创造。这种主动式的探索或许正是空间智能发展的关键所在。

超越微软开源的交互式世界模型

Matrix-Game 强在哪儿?

Matrix-Game(17B+)是昆仑万维 Matrix 系列模型在交互式世界生成方向的首次落地,也是世界模型领域工业界首个开源的 10B + 大模型。

早在今年 2 月, 昆仑万维正式推出 Matrix-Zero 世界模型,迈出了其探索空间智能的关键一步。

昆仑万维表示,Matrix-Zero 其实包含两个子模型 —— 一个用于 3D 场景生成,另一个用于可交互的视频生成。

当时就有人问:这个可交互的视频生成模型可以用来做游戏吗?

几个月后,昆仑万维给出了答案。这次发布的 Matrix-Game 就是可交互视频生成模型在游戏方向的落地,它能够根据用户输入(键盘指令、鼠标移动等)生成连贯、可控的游戏互动视频。

和行业内的其他模型相比,它有以下几个特点:

1. 可以实现细粒度的用户交互控制。

在游戏里,你可以通过按「W、S、A、D、Space、Attack」以及这些键的组合实现自由移动和攻击。在 Matrix-Game 创造的「我的世界(Minecraft)」游戏世界里,你可以得到相同的体验,无论控制信号是连续的(如视角转换)还是离散的(如前进、跳跃),而且每次移动都伴随着景物的变化。

比如在下面这个「前进 + 攻击」的场景中,游戏人物穿过一片树林来到池塘前,代表树木的方块在受到攻击后被破坏,这是模型生成的环境反馈信号。而且,虽然池塘和后面的山体大部分被树木遮挡,但模型依然生成了合理的结果,使得整个过程的景物变化非常丝滑。

在一个「前进 - 向左 - 前进」的长镜头组合移动场景中,模型不仅严格遵守了用户的控制指令,还生成了丰富的景物变化,比如没入水中的逼真过程。

2. 生成效果具有高保真视觉与物理一致性。

在视频生成领域,能否保持视觉一致性、遵循物理规律是判断视频质量的试金石。但从业界的各种翻车视频来看,这些很难做好,更别说在交互视频这种需要推理交互效果的视频生成形式中。

但 Matrix Game 的表现令人眼前一亮,在交互中能生成物理上合理、视觉上一致的结果。

比如,在下面这个左右移动的场景中,草丛中的花有时会被树干遮挡,但随着脚步的进一步移动又会重现,这说明模型具有保持视觉一致性的能力。

再比如,在一个跳跃的操作中,我们能够看到河里的景物随着视角的变化而变化(跳起来之后,视角变高,能看到更全面的水底画面)。这都是模型根据所掌握的物理规律进行「脑补」的结果。

3. 拥有多场景泛化能力

在前面的例子中,我们已经看到,Matrix Game 能够生成非常丰富的 Minecraft 游戏场景,比如森林、沙滩、河流、平原等,这些环境涵盖不同地形、天气和生物群系。

其实,除此之外,它还能向非 Minecraft 游戏环境泛化,生成城市、古建等开放式场景的互动视频。

4. 具有系统化的评估体系

对于交互式视频生成这种相对较新的模型,应该从哪些维度评估生成质量?如果不想清楚这个问题,模型就很难有明确的优化方向。为了解决这一问题,昆仑万维提出了一套专为 Minecraft 世界建模设计的统一评测框架 —— GameWorld Score

具体来说,GameWorld Score 从视觉质量、时间一致性、交互可控性、物理规则理解这四个维度来评价模型。视觉质量是指每一帧图像的清晰度、结构一致性与真实感,这也是人类感知视频质量的几个重要维度。时间一致性、交互可控性和物理规则理解上文已经提及。这几个维度合在一起,首次实现了对可交互视频感知质量 + 控制能力 + 物理合理性的全方位衡量,补齐了现有基准的短板。

在这个基准上,Matrix Game 与知名创业公司 Decart 的开源方案 Oasis 和微软的开源模型 MineWorld 进行了 PK,在四大维度上均取得领先成绩。

图源:Matrix-Game 技术报告

在双盲评测中,Matrix-Game 生成的视频评分也是大幅度领先:

图源:Matrix-Game 技术报告

在控制性上,Matrix-Game 在「运动」、「攻击」等动作上实现了超过 90% 的准确率,细粒度视角控制下依然可以保持高精度响应。

图源:Matrix-Game 技术报告

接下来是场景泛化能力,在 8 大典型 Minecraft 场景中,Matrix-Game 保持了全面领先,展现出卓越的环境适应性,这意味着它可以广泛应用于较复杂、动态的虚拟世界交互任务。

图源:Matrix-Game 技术报告

可见,不论是从数据、模型还是实测角度来看,Matrix-Game 都树立了当前交互式世界模型的新标杆。

Matrix-Game 是怎样练成的?

在昆仑万维发布的技术报告中我们可以发现,Matrix-Game 取得的优异成绩主要得益于研究团队在数据、模型架构等方面做出的技术创新。

精挑细选的 Matrix-Game-MC 数据集

目前,业界已有越来越多的研究尝试让世界模型生成游戏场景,但它们往往难以有效捕捉物理规则,泛化能力有限。

Matrix-Game 改变了这一现状。它是一个参数规模达 17B 的世界基座模型,专注于交互式图像到世界的生成,通过两阶段训练策略(无标签数据预训练 + 标注数据可控训练)训练而来,其中用到了昆仑万维自主构建的大规模数据集 ——Matrix-Game-MC。

Matrix-Game-MC 数据集涵盖从无标签预训练数据到精细标注的可控视频全流程。其中,无标签预训练数据来自 MineDojo 数据集中的视频资源,研究团队利用 MineDojo 工具系统性地采集了约 6000 小时的原始 Minecraft 游戏视频,并设计了三阶段过滤机制,依次对画质美学、动态合理性与视角稳定性等方面进行筛选,最终获得了超过 2700 小时的中质量数据和 870 小时的高质量数据,用于支持基模型的无监督预训练。

有标签部分则是采用探索代理(Exploration Agent)、程序化模拟(Unreal Procedural Simulation)两种策略混合生成的可控监督数据,包括高质量的《我的世界》游戏内容和在虚幻引擎(Unreal Engine)中手动构建的模拟交互场景,不仅包含精确的键盘与鼠标控制信号,也提供位置信息、动作标签及环境反馈信号,体量约 1000 小时。

另外得益于 Unreal 数据的融入,Matrix-Game 在更通用游戏场景的泛化上展现出了明显的优势。

图像到世界建模的模型架构

Matrix-Game 的目标是能够内化真实的物理交互、语义结构并支持交互式的视频生成。

从模型架构上看,Matrix-Game 的整体架构围绕图像到世界建模(Image-to-World Modeling)的方式设计。正如 2 月份 Matrix-Zero 所展示的,该系列模型受空间智能启发,纯粹从原始图像中学习,可参考单张图像生成能交互的视频内容。它通过构建一个一致的场景来学习理解世界,不依赖语言提示,仅基于视觉信号对空间几何、物体的运动及物理交互进行建模。

其中,视觉编码器或多模态主干网络处理的参考图像作为主条件输入,在高斯噪声及用户动作条件下,由 DiT 生成潜在表示,然后通过 3D VAE 解码器将其解码为连贯的视频序列。

MatrixGame 能够直接通过视觉内容感知、解读和建模世界,可以实现一致且结构化的理解。结合用户的动作输入,世界模型可以像 AI 图像生成工具一样直接生成「3D 游戏画面」。为了避免此前很多世界模型生成长时序内容不停变化的出戏情况,Matrix-Game 每次生成会以之前的 5 帧运动作为上下文逐段递进生成,保证了输出内容在时间上的连贯性。

在交互可控的问题上,人们输入的键盘动作(如跳跃和攻击)以离散的 token 表达,视角的移动则以连续的 token 表达。作者使用 GameFactory 的控制模块,同时融入了多模态 Diffusion Transformer 架构,还使用 CFG 技术提升了控制信号响应的鲁棒性。

简单总结一下,Matrix-Game 经过了数千小时高质量数据的训练,通过创新的模型架构既实现了对人类交互动作的准确反应,又能保持生成内容的一致连贯,进而实现了从图像到世界生成的突破。

技术发展到这种程度,世界模型在快速生成游戏、动态视频生成等应用上已经让人看到了希望。

昆仑万维的空间智能愿景

远不止游戏

走向多模态、3D 世界,是生成式 AI 的下一个发展大方向。

在去年的一个演讲中,斯坦福大学教授李飞飞曾指出,过去几十年,尤其是深度学习变革的十多年里,我们在视觉智能方面取得了巨大进步,但目前的视觉智能仍存在局限,主要集中在二维图像的识别和理解。而现实世界是三维的,要真正解决视觉问题,并将其与行动联系起来,就必须发展空间智能。

空间智能是朝着全面智能迈出的一个基本且关键的步骤。只有让机器具备空间智能,才能使其更好地理解三维世界,从而实现更复杂、更高级的智能。

昆仑万维的 Matrix-Game 是空间智能领域交互式世界生成的重要里程碑,将为多个领域的发展带来重要影响。

首先,从内容生产的角度来看,Matrix-Game 可以支持更低成本、更高自由度的丰富、可控的游戏地图与任务环境生成,助力游戏开发

此外,它还可以与昆仑万维的其他 AI 产品联动,比如天工大模型能为 Matrix-Game 生成的游戏世界提供更智能的 NPC 交互逻辑;Mureka 能为这些动态生成的场景和视频提供匹配的背景音乐和音效;SkyReels 可以为生成的游戏提供更多画面和剧情。这些产品就像一块一块的拼图,一旦整合到一起,能助力的不止是游戏生产,还有影视、广告、XR 等内容的生产。

其次,从科研角度来看,Matrix-Game 所代表的空间智能是一个极具潜力的方向,因为它和具身智能等方向的发展息息相关,谷歌、微软等大玩家都在此方向发力。Matrix-Game 作为中国首批具备可交互视频生成能力的世界模型,对于推动国内空间智能领域发展有重要意义 。

「实现通用人工智能,让每个人更好地塑造和表达自我」,这是昆仑万维的使命。 这个使命在空间智能时代有了更深远的意义。当人类能在三维世界中自由创造和交互,当想象力不再受制于技术门槛,我们才真正开启了表达自我的新维度。

过去半年多时间,昆仑万维在奖励模型、多模态、推理、视频生成等方向开源了一系列 SOTA 级别模型,如今又在空间智能方向再下一城。可以说,从二维到三维,从语言大模型到多模态生成再到如今的交互式世界模型,昆仑万维的技术布局越来越清晰:构建一个完整的 AI 创作生态。在这个生态中,每个人都能找到自己的创新空间,每个创意都有机会快速变成产品。一个想象力真正成为生产力的时代正在加速到来。

© THE END

转载请联系本公众号获得授权

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-05-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
一句指令,无限宇宙!Matrix-Game硬核上线,秒杀SOTA
继之前刷屏的单张图片生成虚拟世界Matrix Zero之后,昆仑万维又来搞事情了!
新智元
2025/05/14
890
一句指令,无限宇宙!Matrix-Game硬核上线,秒杀SOTA
通用世界模型问世:不学习就能生成新领域视频,可实时控制
随着 OpenAI 今年 2 月发布 Sora,世界模型(World Model)再次成为了 AI 领域的热门。
机器之心
2024/06/04
2050
通用世界模型问世:不学习就能生成新领域视频,可实时控制
一图一3D世界,视频还可交互,昆仑万维「空间智能」开年首秀来了
这个春节,动画电影《哪吒 2》爆火,不仅登上中国影史票房榜首,还不断地刷新全球票房榜单。3D 版本中的山河社稷图、石矶娘娘变身的石头山、最后的仙魔大战…… 这些场景让我们感受到了极度震撼的 3D 动效。
机器之心
2025/02/19
1300
一图一3D世界,视频还可交互,昆仑万维「空间智能」开年首秀来了
李飞飞空间智能首秀:AI靠单图生成3D世界,可探索,遵循基本物理几何规则
当前,基于文本的图像和视频生成模型与大语言模型(LLMs)共同展示了 AI 在视觉领域的巨大潜力。这些模型已经让人们能够以全新的方式工作和创作,但这仅仅是冰山一角。为了突破现有模型的限制,我们需要具备空间智能的 AI,能够在三维空间和时间中对物体、地点及其互动进行建模和推理。——《World Labs》官方网站
AI研思录
2025/02/20
1990
李飞飞空间智能首秀:AI靠单图生成3D世界,可探索,遵循基本物理几何规则
谷歌世界模型爆发:单张图生成可玩3D世界,还要和马斯克一起做AI游戏
Google DeepMind 震撼宣布了他们的新一代世界模型 Genie 2,其可根据一张图生成可供人类或 AI 智能体游玩的无限 3D 世界。
机器之心
2025/02/14
1010
谷歌世界模型爆发:单张图生成可玩3D世界,还要和马斯克一起做AI游戏
世界模型进入4D时代!单视角视频构建的自由视角4D世界来了
人工智能技术正以前所未有的速度改变着我们对世界的认知与构建方式。近期,李飞飞教授团队通过单张图片生成三维物理世界的研究,再次向世界展示了空间智能技术的巨大潜力。
机器之心
2025/02/14
1420
世界模型进入4D时代!单视角视频构建的自由视角4D世界来了
每周AI论文速递(250331-250404)
大语言模型 (Large Language Models, LLMs) 的出现引发了人工智能领域的变革,推动了一系列具备复杂推理能力、强健感知能力和跨领域多任务执行能力的先进智能体的发展。随着这类智能体在 AI 研究和实际应用中的作用日益凸显,其设计、评估与持续改进过程也面临着多维度、高复杂度的挑战。本综述采用模块化的类脑架构框架,融合认知科学、神经科学与计算研究的核心原理,对智能体技术进行全面梳理。研究内容分为四个相互关联的部分:首先解析智能体的模块化基础架构,通过系统化映射其认知、感知与执行模块与人脑功能的对应关系,深入阐释记忆系统、世界模型、奖励机制及类情绪系统等核心组件;其次探讨智能体的自我增强与自适应进化机制,重点分析其通过自动化优化范式(包括新兴的 AutoML 和大语言模型驱动的优化策略)实现能力自主提升、动态环境适应与持续学习的方法;第三部分研究协作型进化多智能体系统,揭示智能体通过交互协作与社会化组织产生的群体智能,及其与人类社交行为的相似性;最后针对 AI 系统的安全性、可靠性及社会效益这一关键命题,系统分析内生与外源安全威胁、伦理对齐要求、系统鲁棒性保障等核心问题,提出确保实际部署可信度的有效缓解策略。
叶子的技术碎碎念
2025/04/08
1580
每周AI论文速递(250331-250404)
大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界
但Google DeepMind、UC伯克利和MIT的研究人员更进一步,在他们眼里,「大视频模型」也许能够像世界模型一样,真正的做到理解我们身处的这个世界。
新智元
2024/03/05
1530
大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界
「黑神话」级3A大作AI实时游戏生成!港科大、中科大等祭出最强扩散Transformer,火爆国外
几天前,专做推理芯片初创Etched曾推出世界首个实时生成AI游戏Oasis,每一帧都是扩散Transformer预测。
新智元
2025/02/14
1400
「黑神话」级3A大作AI实时游戏生成!港科大、中科大等祭出最强扩散Transformer,火爆国外
抢跑搜索大模型,百度、昆仑万维“秋色平分”
随着ChatGPT火爆出圈,大模型的热度被持续推高,AIGC也一跃成为了科技圈与资本圈的“香饽饽”,引得百度、阿里、腾讯等互联网大厂以及字节跳动、小红书等独角兽企业纷纷争相入局。得益于此,大模型也在金融、交通、娱乐、医疗、教育、办公等诸多领域打造出了多个标杆级的应用落地场景。
刘旷
2023/10/08
2870
Sora 面世,视频生成的 GPT-3 时刻来了
2月16日凌晨,正值中国春节法定节假日期间,OpenAI 毫无预兆地发布了 AI 视频生成大模型 Sora。看过视频效果后,网友纷纷感叹「现实,不存在了。」
AI科技评论
2024/02/27
2260
Sora 面世,视频生成的 GPT-3 时刻来了
黑马入局!昆仑万维版ChatGPT「天工」通过自家程序员面试,首发就敢现场演示
梦晨 金磊 发自 凹非寺 量子位 | 公众号 QbitAI 什么样的AI,能通过自家公司的程序员面试? 刚刚出炉的国产大模型「天工」做到了,黑马,绝对是黑马。 其开发商昆仑万维的CEO方汉在与量子位合作的首发直播中透露: 对天工模拟过校招算法工程师的第一轮面试,可以很流畅地通过。 △天工回答算法题示例 如果你开始好奇天工是什么,不如请先它来一段自我介绍: 除了在编程语言上经受住面试级别的考验之外,在自然语言上天工还特别修炼过中文。 天工团队投入大量资源攻克了中文语料库的质量瓶颈,从数十万亿的数据中清洗
量子位
2023/05/06
2990
黑马入局!昆仑万维版ChatGPT「天工」通过自家程序员面试,首发就敢现场演示
转身世界就变样?WorldMem用记忆让AI生成的世界拥有了一致性
近年来,基于视频生成模型的可交互世界生成引发了广泛关注。尽管现有方法在生成质量和交互能力上取得了显著进展,但由于上下文时间窗口受限,生成的世界在长时序下严重缺乏一致性。
机器之心
2025/05/12
460
转身世界就变样?WorldMem用记忆让AI生成的世界拥有了一致性
刚刚,谷歌发布基础世界模型:11B参数,能生成可交互虚拟世界
Sora 问世才不到两个星期,谷歌的世界模型也来了,能力看起来更强大:它生成的虚拟世界「自主可控」。https://mpvideo.qpic.cn/0bc37qac2aaa3iad2lo4b5svb7gdfx6aalia.f10004.mp4?
机器之心
2024/02/27
2050
刚刚,谷歌发布基础世界模型:11B参数,能生成可交互虚拟世界
昆仑万维财报解读:AI商业化卷王
过去一年多时间里,几乎所有和AI相关的企业都会被问到这样一个问题:AI何时才能够商业化变现?
Alter聊科技
2025/05/08
2120
昆仑万维方汉高质量访谈总结!!!
以下内容是访谈总结,包括大模型对行业的影响、AIGC对内容创作的影响、大模型的商业化路径、技术发展、特定企业的战略定位以及其他市场观点。
朱晓霞
2024/04/26
1670
昆仑万维方汉高质量访谈总结!!!
全球首款AI游戏诞生!无需游戏引擎,视频模型直出「我的世界」
今天,两家初创公司Decart和Etched宣布,他们打造了一款世界上首个实时、可玩、可交互的世界模型——Oasis。
新智元
2025/02/14
1130
全球首款AI游戏诞生!无需游戏引擎,视频模型直出「我的世界」
颜水成再返工业界,加入昆仑万维:“目前AI浪尖是Foundation Models”
在此之前,颜水成曾加入智源研究院,任访问首席科学家,他称其为“见过的最接近DeepMind和OpenAI风格的地方”。
量子位
2023/09/08
3050
颜水成再返工业界,加入昆仑万维:“目前AI浪尖是Foundation Models”
又一巨头宣布入局AIGC,一口气开源数个模型,还道出了它的变现之道
金磊 发自 凹非寺 量子位 | 公众号 QbitAI AIGC(AI生成内容),这个概念在今年可以说是火得一塌糊涂。 例如Stable Diffusion,只要对它说一句话,“唰唰唰”地就能秒生成画作。 再如最近大火的ChatGPT,对答如流堪比人类,简直让网友们玩得不亦乐乎。 △左:Stable Diffusion作画;右:ChatGPT作答 而就在这两天,AIGC赛道可谓是又双叒叕热闹了一把。 因为国内一家互联网出海巨头公司宣布——正式入局AIGC。 而且不同于其它玩家的单一路线,它在进军之际,直接
量子位
2023/02/28
4860
又一巨头宣布入局AIGC,一口气开源数个模型,还道出了它的变现之道
昆仑万维CEO方汉:AIGC以低成本达到80分水平,腰部工作者将大概率被淘汰 | 中国AIGC产业峰会
丰色 发自 凹非寺 量子位 | 公众号 QbitAI “如果人类的水平达不到80分,就会被AI淘汰。” 在中国AIGC产业峰会现场,昆仑万维CEO方汉抛出这样一个大胆预测。 在他看来,目前AIGC对存量知识的理解与表达已经达到80分的水平,行业从业者将随之形成两极分化的局面: 一部分人成为上游管理员,一部分成为底层AIGC操作员,两者的工作产量都会极大提升。 剩下的达不到80分的腰部从业者,大概率被淘汰。 方汉毕业于中国科学技术大学近代物理系,拥有29年互联网从业经验,从1994年开始参与和倡导开源运动,
量子位
2023/04/13
3650
昆仑万维CEO方汉:AIGC以低成本达到80分水平,腰部工作者将大概率被淘汰 | 中国AIGC产业峰会
推荐阅读
一句指令,无限宇宙!Matrix-Game硬核上线,秒杀SOTA
890
通用世界模型问世:不学习就能生成新领域视频,可实时控制
2050
一图一3D世界,视频还可交互,昆仑万维「空间智能」开年首秀来了
1300
李飞飞空间智能首秀:AI靠单图生成3D世界,可探索,遵循基本物理几何规则
1990
谷歌世界模型爆发:单张图生成可玩3D世界,还要和马斯克一起做AI游戏
1010
世界模型进入4D时代!单视角视频构建的自由视角4D世界来了
1420
每周AI论文速递(250331-250404)
1580
大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界
1530
「黑神话」级3A大作AI实时游戏生成!港科大、中科大等祭出最强扩散Transformer,火爆国外
1400
抢跑搜索大模型,百度、昆仑万维“秋色平分”
2870
Sora 面世,视频生成的 GPT-3 时刻来了
2260
黑马入局!昆仑万维版ChatGPT「天工」通过自家程序员面试,首发就敢现场演示
2990
转身世界就变样?WorldMem用记忆让AI生成的世界拥有了一致性
460
刚刚,谷歌发布基础世界模型:11B参数,能生成可交互虚拟世界
2050
昆仑万维财报解读:AI商业化卷王
2120
昆仑万维方汉高质量访谈总结!!!
1670
全球首款AI游戏诞生!无需游戏引擎,视频模型直出「我的世界」
1130
颜水成再返工业界,加入昆仑万维:“目前AI浪尖是Foundation Models”
3050
又一巨头宣布入局AIGC,一口气开源数个模型,还道出了它的变现之道
4860
昆仑万维CEO方汉:AIGC以低成本达到80分水平,腰部工作者将大概率被淘汰 | 中国AIGC产业峰会
3650
相关推荐
一句指令,无限宇宙!Matrix-Game硬核上线,秒杀SOTA
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档