AI生成未来

文章/答案/技术大牛

发布

LV0

发表了文章 1天前2026-05-27 11:37:47

东南大学&D⁴Lab社区最新LLM后训练方案LoPT:无需“全模型反传”,更便宜,更快,也更克制

作者：Hengyu Shi, Tianyang Han, Peizhe Wang等

AI生成未来 1天前2026-05-27 11:37:47

模型、数据、系统、优化、LLM

发表了文章 7天前2026-05-21 21:39:22

从Claw-Eval到Claw-Eval-Live:Agent评测“下半场”，为什么需要一个"活的" Benchmark？

Claw-Eval 回答前者，Claw-Eval-Live 回答后者。前者解决的是"怎么确认 Agent 真的做成了任务"，后者解决的是"benchmark 里...

AI生成未来 7天前2026-05-21 21:39:22

模型、agent、eval、live、工作流

发表了文章 10天前2026-05-18 16:59:41

别再被你家的AI骗了！D⁴ Lab社区最新方法TraceLift揭穿‘假推理’,模型思考过程真正靠谱

过去几年，大模型推理能力的提升很大程度上依赖可验证反馈：数学题看最终答案，代码题跑单测，能通过就给奖励。这套逻辑简单、直接，也很有效。但当 reasoning ...

AI生成未来 10天前2026-05-18 16:59:42

论文、模型、数学、算法、系统

发表了文章 29天前2026-04-29 13:56:36

国产首个开源、系统化的多模态世界模型HY-World 2.0：效果硬刚闭源商业模型

文章链接：https://arxiv.org/pdf/2604.14268v1 项目链接：https://3d-models.hunyuan.tencent.c...

AI生成未来 29天前2026-04-29 13:56:37

模型、视频、数据、渲染、开源

发表了文章 2026-04-152026-04-15 18:48:23

AI生图细节崩坏终结者！RefineAnything：多模态区域级精修，文字/Logo/人脸一键修复，背景像素级不变

【导语】 AI生图技术日新月异，但"局部细节崩坏"始终是落地应用的痛点——文字扭曲、Logo变形、手指畸变、细小结构断裂，这些问题在电商海报、广告设计、UI素材...

AI生成未来 2026-04-152026-04-15 18:48:24

设计、数据、AI生图、架构、模型

发表了文章 2026-04-152026-04-15 18:47:38

眼不见，心不忘！华科&快手联手发布混合记忆新范式：攻克视频世界模型最致命缺陷

论文链接：https://arxiv.org/pdf/2603.25716 项目链接：https://kj-chen666.github.io/Hybrid-M...

AI生成未来 2026-04-152026-04-15 18:47:38

论文、模型、视频、数据、编码

发表了文章 2026-04-152026-04-15 18:46:52

媲美Nano Banana Pro！南科大&阶跃星辰等开源真实世界图像恢复之王RealRestorer

作者：Yufeng Yang, Xianfang Zeng, Zhangqi Jiang等

AI生成未来 2026-04-152026-04-15 18:46:53

模型、数据、开源、迁移、论文

发表了文章 2026-04-152026-04-15 18:45:51

“世界模型”到底是个啥？OpenWorldLib一锤定音：感知+交互+记忆，这才叫理解世界的AI！

本工作提出了 OpenWorldLib 框架，其核心设计包含以下五个功能模块及一个调度中心：

AI生成未来 2026-04-152026-04-15 18:45:51

音频、框架、模型、视频、数据

发表了文章 2026-04-022026-04-02 13:42:34

文生图的“天花板”被捅破了！Gen-Searcher让AI学会“翻书找答案”：不是背题，是开卷考!

文章链接：https://arxiv.org/abs/2603.28767 项目链接：https://gen-searcher.vercel.app/ 代码链...

AI生成未来 2026-04-022026-04-02 13:42:34

模型、设计、数据、搜索、工作

发表了文章 2026-04-022026-04-02 13:41:35

复旦大学 × 阶跃星辰开源最新力作PixelSmile：AI 终于实现人脸表情PhotoShop

复旦大学与阶跃星辰最新研究开源，聚焦人脸的细粒度表情编辑，把表情编辑真正做出了 PhotoShop 编辑的感觉！

AI生成未来 2026-04-022026-04-02 13:41:36

框架、模型、数据、开源、photoshop

发表了文章 2026-04-022026-04-02 13:40:03

短剧革命！港中文&快手发布ShotStream:16帧/秒实时生成电影级多镜头视频，可边拍边改

现有双向架构的多镜头视频生成方法存在两大局限：一是缺乏交互性，需要预先提供所有提示，无法在生成过程中动态调整叙事；二是推理延迟高，难以实现实时生成。

AI生成未来 2026-04-022026-04-02 13:40:03

缓存、架构、模型、设计、视频

发表了文章 2026-04-022026-04-02 13:38:41

2张显卡即可20FPS流式生成！SoulX-LiveAct开启“小时级”实时数字人交互新时代

项目页：https://soul-ailab.github.io/soulx-liveact/ 代码仓库：https://github.com/Soul-AIL...

AI生成未来 2026-04-022026-04-02 13:38:42

效率、缓存、动画、模型、视频

发表了文章 2026-04-022026-04-02 13:33:16

视觉AR逆袭！177M效果媲美675M最新SOTA扩散模型，仅需一个“即插即用”的正则化reAR

视觉自回归（AR）生成模型在图像生成方面的性能显著落后于扩散模型。研究人员发现其核心瓶颈在于生成器-分词器之间存在不一致性。具体表现为：

AI生成未来 2026-04-022026-04-02 13:33:16

性能、token、模型、设计、数据

发表了文章 2026-04-022026-04-02 13:29:18

炸裂！单卡实时生成分钟级长视频，北大&字节联合推出14B大模型Helios，速度碾压1.3B

GitHub: https://github.com/PKU-YuanGroup/Helios 项目主页: https://pku-yuangroup.gith...

AI生成未来 2026-04-022026-04-02 13:29:19

框架、模型、视频、压缩、优化

发表了文章 2026-04-022026-04-02 13:27:50

真“六边形战士”！Capybara把图像视频全打通：一个模型搞定T2I、T2V、I2V！

作者：该工作出自华为小艺香港研究团队，该团队长期聚焦视觉生成、理解与Agent相关领域。

AI生成未来 2026-04-022026-04-02 13:27:50

视频、capybara、接口、框架、模型

发表了文章 2026-04-022026-04-02 13:25:51

通过强化学习赋能OpenClaw！OpenClaw-RL王炸登场：边聊天边把“全能Agent”给训练了

当前所有部署的 AI 智能体都在不断产生交互数据（动作后的下一状态），但现有的智能体强化学习系统却将这些数据白白丢弃，或仅用作下一轮预测的上下文。这导致了...

AI生成未来 2026-04-022026-04-02 13:25:51

强化学习、agent、工具、模型、终端

发表了文章 2026-04-022026-04-02 13:24:51

4B参数干翻14B！国产统一多模态“全能战士” InternVL-U开源：理解、生成与编辑迎新高度

开源代码 (GitHub) ：https://github.com/OpenGVLab/InternVL-U

AI生成未来 2026-04-022026-04-02 13:24:52

设计、数据、开源、架构、模型

发表了文章 2026-04-022026-04-02 13:23:09

图像生成迎来“思考-研究-创造”新范式！Mind-Brush:统一意图分析、多模态搜索和知识推理

文章链接：https://arxiv.org/pdf/2602.01756 Git链接：https://github.com/PicoTrex/Mind-Br...

AI生成未来 2026-04-022026-04-02 13:23:09

工作流、框架、模型、数学、搜索

发表了文章 2026-03-102026-03-10 11:53:53

ICLR 2026 | DragFlow 让DiT也能“指哪打哪”：基于区域监督的拖拽式图像编辑新SOTA

论文地址：https://arxiv.org/abs/2510.02253 项目代码：https://github.com/Edennnnnnnnnn/Drag...

AI生成未来 2026-03-102026-03-10 11:53:53

设计、拖拽、优化、架构、模型

发表了文章 2026-03-052026-03-05 15:12:55

单卡4090即可实现96FPS流式推理!Soul App开源实时数字人生成模型SoulX-FlashHead

在实时数字人赛道，开发者们曾长期面临一个困扰：追求高画质就需要具备昂贵的 H800 集群，追求低成本就得忍受“面瘫”和画面崩坏。

AI生成未来 2026-03-052026-03-05 15:12:56

app、模型、数据、音频、开源

12 3 4 5 6 7 8 9 10 下一页

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2025-08-04

个人成就

获得 185 次赞同
文章被阅读 100.1K 次

关注了：1关注者：17