首页
学习
活动
专区
圈层
工具
发布

#视频

即梦AI的七面镜子:我低估了AI理解电影的速度

科技旋涡

11月9日,上海大光明电影院。当灯光暗下,即梦AI青年导演合作计划项目七部由AI生成的短片在银幕上依次亮起,我突然意识到,自己正在经历的,不仅仅是一场首映礼。

100

我们正在见证:一场由Sora发起的信息生态崩塌

科技旋涡

国庆假期被Sora刷屏了吧?朋友圈里全是各种AI生成的短视频,真人的就不提了,什么海绵宝宝、皮卡丘乱入现实世界...

100

AAAI 2026 Oral|快手提出全新「检索数据引擎」CroPS,打破搜索信息茧房

机器之心

针对这一问题,快手搜索团队提出了一套全新的检索数据引擎 CroPS(Cross-Perspective Positive Samples)。该方法通过引入用户换...

2400

独家解读|2025年AI五大趋势与底层数据革命

机器之心

2025 年,人工智能的发展重心正在发生一次根本性转移:从追求模型的规模,转向构建其理解与解决复杂现实问题的能力。在这一转型中,高质量数据正成为定义 AI 能力...

1900

别被室内基准高分骗了:大模型是在推理空间,还是在「背答案」?

机器之心

然而,这背后存在着隐忧:由于带有准确 3D 标注数据的稀缺,模型训练所用数据(如 ScanNet++、ARKitScenes)往往与测试基准高度同源。这种数据的...

2910

让模型自己找关键帧、视觉线索,小红书Video-Thinker破解视频推理困局

机器之心

随着多模态大语言模型(MLLM)的飞速发展,“Thinking with Images” 范式已在图像理解和推理任务上取得了革命性突破 —— 模型不再是被动接收...

2100

Agentic AI 每日精选 · 2026-01-09|mem-u 多模态记忆框架

AgenticAI

每日5分钟速览AI,甄选 GitHub 趋势、HuggingFace模型动向、行业观察、社区热文与精选论文。

5200

Agentic AI 每日精选 · 2026-01-07

AgenticAI

今日AI领域呈现多模态融合与高效推理并进趋势,Hugging Face热门模型LTX-2实现音视频同步生成,Qwen-Image-Lightning通过轻量化提...

4500

「听觉」引导「视觉」,OmniAgent开启全模态主动感知新范式

机器之心

相比之下,OmniAgent 引入了一种全新的主动感知推理范式。通过在迭代反思循环中策略性地调度视频与音频理解能力,该方法有效攻克了跨模态对齐的难题,从而实现了...

2910

谷歌AI“三板斧”杀回擂台!Gemini 3开刃,Veo出鞘,Banana亮招,OpenAI的王座还稳吗?

Henry Zhang

一度被 OpenAI 的 ChatGPT 打得有点“懵”的谷歌,最近终于亮剑了:一出手就是“三连招”,招招见响。就像武林高手重出江湖,谷歌不再是那个手握重剑却步...

14410

给创意安个家:用.studio域名定义你的数字工坊

腾讯云DNSPod团队

.studio是自动化创作的“掌上工坊”。在视频内容为王的时代,如何让演示视频看起来像专业大片?

7310

MIT开源BoltzGen:迈向AI驱动的通用型结合剂设计

DrugIntel

BoltzGen是MIT团队打造的一个全原子生成模型,能够设计涵盖所有模态的蛋白质和多肽,以结合各类生物分子靶标。BoltzGen在其生成式设计过程中构建了关于...

12110

MIT开源BoltzGen:迈向AI驱动的通用型结合剂设计

DrugIntel

BoltzGen是MIT团队打造的一个全原子生成模型,能够设计涵盖所有模态的蛋白质和多肽,以结合各类生物分子靶标。BoltzGen在其生成式设计过程中构建了关于...

12110

国家广播电视总局整治“AI魔改” 一边是 “名场面” 一边是 “翻车现场” AI视频怎么了?

疯狂的KK

以前我也不理解,凭啥B站的鬼畜都是几百上千万的播放量,剪辑二创就可以让各个历史人物唱歌,对话,但是凭什么AI视频就被点名?我一开始还在为AI视频等鸣不平...

13710

.chat域名:解锁在线沟通的黄金钥匙

腾讯云DNSPod团队

InSpace.chat是一个专为教育场景打造的视频协作平台,旨在通过沉浸式虚拟教室重塑在线学习体验。该平台强调社区感、协作性和关系建设,让学生在虚拟校园中拥有...

7110

国产的Android开源视频压缩工具VideoSlimmer

aqi00

《FFmpeg开发实战:从零基础到短视频上线》一书的“第 12 章 FFmpeg的移动开发”介绍了如何使用FFmpeg在手机上剪辑视频,方便开发者更好地开发类...

12210

每周AI论文速递(251229-260102)

叶子的技术碎碎念

[mHC: 流形约束的超连接](https://arxiv.org/abs/2512.24880)

7210

高速机电 | 中部某省高速公路路段监控系统的常规功能要求

高速公路那点事儿

(1)在大屏幕、显示器上显示管理区段的视频图像,当有警报发生时自动切换现场画面在大屏幕、显示器上显示(重大事件应有声音报警),并进行视频存储。

11710

高速机电 | 高速公路外场前端感知技术的简单对比与应用思路

高速公路那点事儿

在这些重点区段和点位可实现精确定位,通过雷达的全天候对道路流量和事故的感知,联动附近遥控摄像机进行视频查看,来实现突发事件主动发现、快速发现,补充视频监测的不足...

8810

LLM多模态融合技术:从理论到实践

安全风信子

视频编码器是将视频转换为向量表示的关键组件,最新的视频编码器采用了高效的3D CNN和视频Transformer架构,如Video Swin Transform...

63110
领券