首页
学习
活动
专区
圈层
工具
发布

#音频

Claude Code 学习最佳实践:NotebookLM 生成全套学习视频+卡片+测试题

AI进修生

“ 他将36篇Claude Code相关内容“喂”给NotebookLM AI,生成了一套包含视频和音频的深度学习资料库 ?。整个过程耗时80分钟,浏览了440...

900

Veo3.1 发布 ,附Gemini Pro免费使用教程。

AI进修生

你需要在flow中使用这个“extend” 的按钮,没升级之前,延长是没有音频的。只能使用veo2延长。

1200

Suno V5让整个B站开始文艺复兴了。

数字生命卡兹克

讲道理,作为一个13年开始用B站的用户,那个时候我的最爱,就是在B站上刷鬼畜视频,比如我最爱的伊丽莎白鼠。

10210

首个基于LLM的开源音频大模型!阶跃星辰重磅开源Step-Audio-EditX:P声音如此简单!

AI生成未来

文章链接:https://arxiv.org/pdf/2511.03601 开源链接:https://github.com/stepfun-ai/Step-Au...

15510

一部爆燃MV,窥见国产大模型的天花板:音乐界DeepSeek背后的“思维链”核心技术解读

AI生成未来

这两天发现一个超燃MV作品《Digital Heartbeat》,歌曲和画面的适配度非常高,一开始就被它震撼的音乐节奏和极具未来感的画面所吸引。其中最惊艳我的是...

12510

让虚拟人秒懂人类情感!多模态DiT架构炸裂升级:字节OmniHuman-1.5让Ta拥有灵魂!

AI生成未来

文章链接:https://arxiv.org/pdf/2508.19209 项目链接:https://omnihuman-lab.github.io/v1_5...

10010

AI的倾听艺术与语音交互温度教学——从语料清洗到唤醒响应的系统实践

安全风信子

四、系统拓扑(Mermaid) 引子:声音是一条不稳定的河流。我们在语料的沙砾间清洗、在唤醒的涟漪里判断,在ASR与NLU的桥上与人交谈,再用TTS把冷静而温...

10110

103_隐写术进阶:视频隐写技术深度解析——从帧操作到多媒体流数据隐藏的完整指南

安全风信子

视频隐写不仅可以隐藏在视频本身中,还可以结合音频隐写,实现多模态的数据隐藏。这一章我们将探讨音频隐写技术以及如何将视频隐写与音频隐写结合使用。

10010

113_脑筋急转弯:CTF中的智力挑战与解题思路

安全风信子

音频文件也是隐藏信息的良好载体,CTF中经常会出现需要从音频文件中提取隐藏信息的题目。

9610

110_反隐写技术深度解析:从统计特征到机器学习检测的隐写对抗策略完整指南

安全风信子

音频隐写通常会改变音频信号的统计特性,如频谱分布、能量分布等。通过分析这些特性的变化,可以检测出是否存在音频隐写。

7910

106_隐写术进阶:音频隐写技术深度解析——从时域操作到频域变换的完整实现指南

安全风信子

与图像隐写相比,音频隐写具有其独特的挑战和特点。人耳对音频信号的感知非常敏感,尤其是在安静环境下,微小的失真都可能被察觉。同时,音频处理过程中的压缩、传输和重采...

17010

097_数字取证高级技术:AI生成内容检测与深度伪造识别实战指南——从特征提取到模型对抗的全面分析方法

安全风信子

将音频转写(ASR)与视频中口型(lip movement)进行时间对齐,检出语音与口型不同步的伪造线索;对于仅音频场景,可与文本内容进行语义一致性审查。

21610

89_数字取证高级技术:隐写术检测与数据隐藏识别实战指南——从LSB分析到统计异常的全面取证方法

安全风信子

在当今数字化时代,隐写术作为一种将秘密信息隐藏在看似普通媒体文件中的技术,已成为网络犯罪、情报活动和数据泄露的重要手段。数字取证分析师面临着越来越复杂的隐写挑战...

9610

音频工作流总卡壳?Melody+cpolar让远程团队实时协作做音乐!

用户8589624

音频创作者是不是常遇到:团队分散各地,音源文件传来传去版本混乱?Melody本地部署版帮你打造一站式音源管理闭环,素材分类、版本控制、批量导出样样行🔄。但默认只...

12410

打造沉浸式古诗欣赏页面:HTML5视频背景与音频的完美结合

用户8589624

在当今数字化时代,传统文化与现代技术的融合为文学欣赏带来了全新的体验。本文将以唐代诗人李绅的《悯农》为例,详细介绍如何创建一个结合视频背景和背景音乐的古诗欣赏网...

10610

小智AI ESP32S3 学习课件 - 第4周:工程结构与类图解析

网罗开发

UML类图教程: https://www.uml.org.cn/oobject/201211231.asp

18710

开源TTS语音克隆神器GPT-SoVITS_V2版本地整合包部署与远程使用生成音频

用户8589624

本文主要介绍如何在Windows系统电脑使用整合包一键部署开源TTS语音克隆神器GPT-SoVITS,并结合cpolar内网穿透工具轻松实现远程访问,训练声音模...

44910

【开发者亲测】百度文心5.0体验:这可能是目前我见过在“多模态理解”上最接近“人”的模型之一

肥晨

作为一名常年泡在各种AI模型里的开发者,每次有重磅模型发布,我都想第一时间上手尝试一下。今天,我们可能见证了一个历史性的时刻:全球AI竞赛正式进入“更聪明、更高...

41020

Spring Boot集成免费的EdgeTTS实现文本转语音

程序猿DD

在需要文本转语音(TTS)的应用场景中(如语音助手、语音通知、内容播报等),Java生态缺少类似Python生态的Edge TTS 客户端库。不过没关系,现在可...

10910
领券