首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#视频

VBench-2.0:面向视频生成新世代的评测框架

机器之心

近一年以来,AI 视频生成技术发展迅猛。自 2024 年初 Sora 问世后,大家惊喜地发现:原来 AI 可以生成如此逼真的视频,一时间各大高校实验室、互联网巨...

2510

腾讯云再度入选Gartner® VPS市场指南,持续领跑亚太厂商

腾讯云音视频

腾讯 | 行业应用产品经理 (已认证)

据悉,在前不久Gartner升级发布的VPS竞争格局报告中,腾讯云也入选代表厂商。此次再获肯定,也标志着腾讯云音视频领先的技术和产品组合优势,以及全球化的服务经...

2100

每日学术速递3.27

AiCharm

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理

3500

FFmpeg.NET:NET 平台上的音视频处理利器

郑子铭

FFmpeg.NET 提供了一套强大的 API,使得在 .NET 平台上进行音视频处理变得简单而高效。无论是格式转换、提取音频、视频剪辑还是获取视频信息,FFm...

4110

腾讯多媒体实验室技术解析“中国戏曲数字焕新行动”阶段性工作

腾讯多媒体实验室

“为更好地推动中国戏曲创造性转化和创新性发展,探索数字技术助力戏曲传承和传播。在文化和旅游部艺术司的关心和指导下,艺术发展中心与腾讯联合发起了“中国戏曲数字焕新...

9510

从架构创新到多模态探索,MiniMax如何为国产AI持续赋能?

数据结构和算法

2025年刚过,中国AI技术在国际舞台上持续闪耀,国产开源模型的集体爆发成为行业焦点。实际上在DeepSeek的开源模型爆火之前,中国的另一家公司MiniMax...

6210

FFmpeg之预设编码参数preset

liuzhen007

FFmpeg是一款非常强大的音视频处理工具,它不仅功能强大而且非常好用,比如视频转码中一个非常实用的参数就是preset。今天我们将重点介绍preset参数的作...

5310

深度解析视频颜色空间YUV420P和YUV420SP的异同

liuzhen007

本文重点介绍Planar平面模式的存储形式,YUV420P和YUV420SP的差异从名字上就可以看出一二,主要看S的含义。S是Semi(半的)的缩写,SP就是S...

7810

每日学术速递3.26 (New! 一图速览)

AiCharm

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理

7610

“我们要重建 TikTok 算法”!Perplexity CEO 放话收购 TikTok,并开源关键技术

深度学习与Python

Perplexity 提议将与其搜索结果一同出现的引用信息带到 TikTok 视频中,以帮助用户识别可靠信息,并表示其大型语言模型编排能力可以为 TikTok ...

10510

推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1

机器之心

对于每段输入视频,则以最高每秒 2 帧的速率均匀采样最多 32 帧,并将每帧的大小调整为 448 × 448 像素。对于每个 448×448 视频帧输入,视觉编...

4210

腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?

机器之心

在众多非 Transformer 架构中,Mamba 无疑是声量较大且后续发展较好的一个。然而,与最初发布时那种仿佛「水火不容」的局面不同,最近一段时间,这两种...

6710

刚刚,谷歌Gemini Live上新功能,能看懂手机屏幕、还能实时视频

机器之心

视频对话功能并非新概念。最早公开演示 AI 视频通话的 OpenAI,则在去年 12 月底就在自家产品上线了对应能力:在 ChatGPT 的移动端应用程序 Ap...

3100

每日学术速递3.24

AiCharm

1.MicroVQA: A Multimodal Reasoning Benchmark for Microscopy-Based Scientific Res...

5800

中国 AI 新势力数字人崛起:HeyGem.ai 最低12G显存可运行

疯狂的KK

HeyGem.ai 是由南京硅基智能科技有限公司推出的开源数字人模型,专为 Windows 系统设计。它基于先进的 AI 技术,仅需 1 秒视频或 1 张照片,...

40900

英伟达开源自适应多模态「世界生成」模型!开启机器人、自动驾驶训练革命

新智元

多模态可控世界生成是指基于分割、深度和边缘等多模态视频输入生成世界模拟视频的问题。

14210

杭州六小龙最新开源「空间理解模型」,保姆级教程来了!

Datawhale

前几天,“杭州六小龙”之一「群核科技」在GTC 2025大会开源了空间理解模型:SpatialLM。

20410

大模型时代,安全如何洗牌?

TVP官方团队

腾讯 | 产品经理 (已认证)

3 月 30 日(周日)上午 10:00,「大模型时代:安全如何洗牌」TVP AI 与安全高峰论坛将在腾讯云 TVP 视频号等多平台同步直播, 扫描「海报二维码...

11810

前字节跳动AI技术专家加盟千寻智能,出任具身智能部负责人

机器之心

近日,前字节跳动 AI 技术专家解浚源在朋友圈官宣加入具身智能创业公司千寻智能,并发布了千寻智能最新披露的 Spirit v1 VLA 演示视频。据悉,解浚源目...

8310

波士顿动力真「翻」不过宇树、众擎!一觉醒来,全世界的机器人都在侧空翻

机器之心

而就在这段视频发出后不到 12 小时,波士顿动力也发布了一段视频,其中不仅同样演示了机器人侧空翻这一动作,还表演了其它看起来非常近似人类的动作。

5700
领券