首页
学习
活动
专区
圈层
工具
发布

#视频

谷歌AI“三板斧”杀回擂台!Gemini 3开刃,Veo出鞘,Banana亮招,OpenAI的王座还稳吗?

Henry Zhang

一度被 OpenAI 的 ChatGPT 打得有点“懵”的谷歌,最近终于亮剑了:一出手就是“三连招”,招招见响。就像武林高手重出江湖,谷歌不再是那个手握重剑却步...

5710

给创意安个家:用.studio域名定义你的数字工坊

腾讯云DNSPod团队

.studio是自动化创作的“掌上工坊”。在视频内容为王的时代,如何让演示视频看起来像专业大片?

4110

MIT开源BoltzGen:迈向AI驱动的通用型结合剂设计

DrugIntel

BoltzGen是MIT团队打造的一个全原子生成模型,能够设计涵盖所有模态的蛋白质和多肽,以结合各类生物分子靶标。BoltzGen在其生成式设计过程中构建了关于...

11610

MIT开源BoltzGen:迈向AI驱动的通用型结合剂设计

DrugIntel

BoltzGen是MIT团队打造的一个全原子生成模型,能够设计涵盖所有模态的蛋白质和多肽,以结合各类生物分子靶标。BoltzGen在其生成式设计过程中构建了关于...

11610

国家广播电视总局整治“AI魔改” 一边是 “名场面” 一边是 “翻车现场” AI视频怎么了?

疯狂的KK

以前我也不理解,凭啥B站的鬼畜都是几百上千万的播放量,剪辑二创就可以让各个历史人物唱歌,对话,但是凭什么AI视频就被点名?我一开始还在为AI视频等鸣不平...

11610

.chat域名:解锁在线沟通的黄金钥匙

腾讯云DNSPod团队

InSpace.chat是一个专为教育场景打造的视频协作平台,旨在通过沉浸式虚拟教室重塑在线学习体验。该平台强调社区感、协作性和关系建设,让学生在虚拟校园中拥有...

6910

国产的Android开源视频压缩工具VideoSlimmer

aqi00

《FFmpeg开发实战:从零基础到短视频上线》一书的“第 12 章 FFmpeg的移动开发”介绍了如何使用FFmpeg在手机上剪辑视频,方便开发者更好地开发类...

10410

每周AI论文速递(251229-260102)

叶子的技术碎碎念

[mHC: 流形约束的超连接](https://arxiv.org/abs/2512.24880)

6710

高速机电 | 中部某省高速公路路段监控系统的常规功能要求

高速公路那点事儿

(1)在大屏幕、显示器上显示管理区段的视频图像,当有警报发生时自动切换现场画面在大屏幕、显示器上显示(重大事件应有声音报警),并进行视频存储。

11410

高速机电 | 高速公路外场前端感知技术的简单对比与应用思路

高速公路那点事儿

在这些重点区段和点位可实现精确定位,通过雷达的全天候对道路流量和事故的感知,联动附近遥控摄像机进行视频查看,来实现突发事件主动发现、快速发现,补充视频监测的不足...

8110

LLM多模态融合技术:从理论到实践

安全风信子

视频编码器是将视频转换为向量表示的关键组件,最新的视频编码器采用了高效的3D CNN和视频Transformer架构,如Video Swin Transform...

45010

我的2025年度AI大盘点 - 前路已明。

数字生命卡兹克

甚至,以为内Suno V5的强大,以AI音乐为代表的各大模型,在B站井喷,直接掀起了文艺复兴,大量的鬼畜视频、二创视频开始用Suno V5生成歌曲。

7210

超越Wan-2.1 和 MatrixGame!Yume1.5:交互式世界生成模型,单卡12 FPS 实时交互渲染

AI生成未来

论文链接:https://arxiv.org/pdf/2512.22096 开源代码:https://github.com/stdstu12/YUME 工程...

12310

AI自己当导演?KlingAvatar 2.0“联合推理”黑科技:让数字人不仅会演,更懂剧本!新SOTA!

AI生成未来

图1 KlingAvatar 2.0生成生动、保持身份的数字人类,具备精准的摄像头控制、丰富的情感表达、高质量的动作以及精准的面部-唇部和音频同步。它实现了音频...

10110

马斯克的「移动客厅」又火了:20人座无方向盘,每公里才3毛钱

机器之心

前段时间,旧金山大停电,Waymo 无人驾驶出租车集体趴窝,但依靠 FSD 系统驱动的特斯拉汽车丝毫不受影响。

8210

SIGGRAPH Asia 2025|当视频生成真正「看清一个人」:多视角身份一致、真实光照与可控镜头的统一框架

机器之心

第一作者徐源诚是 Netflix Eyeline 的研究科学家,专注于基础 AI 模型的研究与开发,涵盖多模态理解、推理、交互与生成,重点方向包括可控视频生成及...

6910

视频生成DeepSeek时刻!清华&生数开源框架提速200倍,一周斩获2k Star

机器之心

未来,包括 TurboDiffusion 在内的视频生成加速技术势必会更加成熟,我们可以想象更长时长的 1080p 甚至 4k 分辨率的视频同样可以做到实时生成...

12610

顶刊TPAMI|多模态视频理解领域重磅数据更新:MeViSv2发布

机器之心

近日,多模态视频理解领域迎来重磅更新!由复旦大学、上海财经大学、南洋理工大学联合打造的 MeViSv2 数据集正式发布,并已被顶刊 IEEE TPAMI 录用。

12210

越狱成功率飙升至87.6%,南京大学联合美团、上交破解主流视频生成模型安全漏洞

机器之心

视觉生成模型的安全研究长期聚焦于文本到图像(T2I)单模态场景,而图生视频(I2V)技术的兴起,正带来多模态协同与维度升级的双重核心挑战。文本 - 图像输入的跨...

11610

VideoCoF:将「时序推理」引入视频编辑,无Mask实现高精度编辑与长视频外推!

机器之心

本文第一作者是 UTS 博士生杨向鹏,主要研究方向是视频生成和世界模型;第二作者是谢集,浙江大学的四年级本科生,主要研究方向统一多模态大模型和视频生成。通讯作者...

10310
领券