首页
学习
活动
专区
圈层
工具
发布

#视频

【模型免训练高效集成】DINOv2 + SAM 2

javpower

如果说第一代 SAM 已经让人眼前一亮,那么 2024 年发布的 SAM 2 则真正将图像分割推向了新高度。它在保持图像分割强大能力的同时,专门针对视频分割进行...

7610

Lovart 爽玩「Banana」,我汇总了当前的N种邪修秘法

AIGC新知

最近banana模型火出圈了,好多人发现了各种各样的玩法,比如说3D手办,P图等等。

10610

人物一致性新王Nano Banana登基,AI图片编辑史诗级升级。

数字生命卡兹克

但是这玩意我觉得真的够强,在我实际工作中也已经用上好几天,所以,体验下来,我是真的觉得对的这个史诗级名号。

10210

颤抖吧3D艺术家!字节Puppeteer让AI自动绑骨+动画:无需专家调参,生成效果超专业级

AI生成未来

论文链接:https://arxiv.org/pdf/2508.10898 Git 链接:https://chaoyuesong.github.io/Puppe...

11110

碾压SOTA!腾讯HunyuanVideo-Foley开源:让视频自动生成电影级音效,沉浸感拉满!

AI生成未来

文章链接:https://arxiv.org/abs/2508.16930 项目链接:https://szczesnys.github.io/hunyuanvi...

9610

混元世界模型上新,综合能力问鼎WorldScore排行榜

腾讯开源

混元Voyager框架创新性地将场景深度预测引入视频生成过程,融合了视频生成与3D建模优势,基于相机可控的视频生成技术,从初始场景视图和用户指定相机轨迹中,合成...

11110

怎样安装xapk软件?安卓的apk和XAPK的区别?安卓手机端安装xapk、apkm软件

小焱写作

.xapk是Android应用分发的一种格式,它是一种将Android应用的多个模块(如APK、配置文件、资源文件等)打包在一起的文件格式。其本质是一个压缩包,...

6010

美团开源InfiniteTalk,AI数字人从“对口型”到“演对手戏”!太强了

AgenticAI

本模型并不是视频生成,而是根据你提供的一段视频和一段新的音频,合成一个全新的视频。其中视频生成需要使用阿里的WAN之类的模型。

25010

你能永远陪我聊天吗?复旦&微软提出StableAvatar: 首个端到端无限时长音频驱动的人类视频生成新框架!

机器之心

如今随着扩散模型的兴起极大,涌现出大量基于音频驱动的数字人生成工作。具体而言,语音驱动人类视频生成旨在基于参考图像与音频,合成面部表情与身体动作与音频高度同步的...

8110

视频「缺陷」变安全优势:蚂蚁数科新突破,主动式视频验证系统RollingEvidence

机器之心

该论文提出了一套创新性的主动式可信视频取证系统,利用相机卷帘门效应在视频中嵌入高维物理水印,并结合 AI 技术与概率模型进行精准验证,能够有效抵御深度伪造(De...

8810

AI智能体加持,爆款视频产出速度提升了10倍,全民导演时代已来

机器之心

Video Ocean 不只是创作短视频的工具,它能应对复杂的商用级创作需求。无论是企业广告、品牌宣传片,还是产品发布会视频,你只需简单指令,Agent 即可迅...

6510

深夜惊喜!万相发布最新数字人模型

大风写全栈

https://www.modelscope.cn/models/Wan-AI/Wan2.2-S2V-14B/summary

7310

混元开源又+1:视频音效可以自动生成了

腾讯开源

这个视频音效来自腾讯混元视频音效生成模型Hunyuan-Foley。我们还可以用它来生成流行的ASMR,体验“听觉爽感”,解压效果直接拉满。

7210

炸了!Google新发图片大模型简直逆天!

磊哥

如果说 ChatGPT 真正的开创了聊天时代的智能对话,那么这次 Google 发布的 Nano Gemini 2.5 Flash Image(Nano Ban...

24120

中国AI杀疯了!全球Top 100榜单,5家中国公司冲进前20,海外巨头集体沉默…

安徽开发者圈

你没看错,前20名里有5个是中国名字。这意味着什么?意味着全世界用户正在用中国的AI工具做搜索、写文案、画画、剪视频、聊人生。

11310

【计算机视觉(CV)技术的优势和挑战】

用户1750537

背景: 在当今数字时代,博客成为了分享知识、展示个人专业能力和吸引读者的重要工具。然而,随着越来越多的博客涌现,如何优化博客的内容和用户体验成为了一个关键的问...

7710

JavaScript调用摄像头

用户1750537

在浏览器中通过JavaScript调用摄像头主要使用 MediaDevices API,以下是详细步骤和示例代码:

8710

【MATLAB实现视频图像的去雾处理】

用户1750537

6410

HTTP代理:内容分发战场上的「隐形指挥官」

富贵软件

在数字内容爆炸的今天,当用户点击视频、刷新网页时,一场精密的「数据接力赛」已在后台悄然上演。在这场赛事中,HTTP代理扮演着至关重要的「战术指挥官」角色——它既...

9310

数字人播报视频这么流行,你想要做一个吗

富贵软件

数字人播报视频是一种利用人工智能技术,将文本或语音输入转化为真实的头像和口型动作,并通过视频形式呈现出来的技术。这些数字人播报视频通常使用深度学习模型,其中包括...

8010
领券