音频 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签音频

#音频

写作和思考，应该被AI改变么？

程序新视界 1小时前2026-07-10 18:23:22

自己常年保持着写作输出的习惯（包括技术类文章、个人思考以及日记记录等），截止目前，今年的日记字数已经突破四万字了。

000

做一本100万字的有声书大概多少钱？从画本、演播、后期到审听完整拆解有声书制作成本

声音那些事 1天前2026-07-09 18:41:37

最根本的原因，是有声书的制作模式不同。而在每种模式背后，AI技术的深度介入，也正在悄然改变着有声书制作流程中每一个环节的成本结构。

2310

【直播】AI时代的“工具价值”：还需要学习软件吗？

Tableau喜乐君 1天前2026-07-08 20:22:51

以下是话题二（技术公式与AI）、话题三（分析师职业终局）、话题四（工具与思维训练）的完整精修逐字稿。

5000

19K stars：Meetily 把会议录音从云端搬回本机

智能时代蛮子 2天前2026-07-08 15:30:05

Meetily 是一款基于 Tauri + whisper.cpp + Ollama 的全本地 AI 会议助手，把 Otter.ai / Fireflies.a...

8110

一本小说真的可以一键变成多人有声剧吗？全自动AI多播有声剧生产流程揭秘

声音那些事 3天前2026-07-07 15:10:13

全自动方案的生产成本较传统人工制作有显著降低，具体因所选模型方案、音色数量和音频质量要求而异。对比传统人工制作通常需要的成本，差距在一个数量级以上。⚠ 实际成本...

9010

ICML 2026 | 一个模型，统一人、物、声、动作:OmniShow把多模态可控视频生成卷成系统工程！

AI生成未来 7天前2026-07-03 19:51:03

更妙的是，gating vector 顺便当了一把"探针"：通过观察 gate norm，团队发现音频影响集中在 dual-stream blocks，于是只在...

12800

牛！一款国产AI语音登顶全球第一，首个可编辑语音模型来了！

开源星探 7天前2026-07-03 12:56:34

传统的语音克隆需要提供一段说话人的音频，以及对应的准确文字内容。但ViiTorVoice首创了"无参考文本（Zero-Shot）"的跨语种语音克隆能力，你只需要...

35010

多模态大模型落地：开发者最该避开的三个坑

用户12493922 7天前2026-07-03 06:42:52

14210

多模态大模型实战：从选型到落地指南

用户12493922 7天前2026-07-03 00:45:49

12010

有声书到底是怎么做出来的？全面解析有声书制作体系、产业生态与未来趋势

声音那些事 4天前2026-07-06 15:31:50

从版权授权、商业模式、文本工程、导演统筹、录音制作、声音后期、质量控制，到平台发行、国内外制作模式比较，以及 AI 技术带来的行业变革与未来趋势，系统梳理有声书...

12510

从技术视频到短视频：AI辅助剪辑全流程技术复盘

heidsoft 8天前2026-07-02 10:53:58

A: 检查是否使用了 -an 参数（禁止音频）。竖屏转制时如果不需要单独处理音频，应去掉该参数。

13610

登上 GitHub 日榜 TOP5，收获 1.2 万标星的自动剪辑视频开源工具。

开源星探 9天前2026-07-01 19:26:14

前两天看到一个自动剪视频的开源项目，只需要对着 AI 说："把这些剪成一条发布视频"，然后，它就自动去口癖、调颜色、加字幕，甚至做动画。

56310

Voicebox：本地优先的 AI 语音工作室

山行AI 9天前2026-07-01 18:28:40

Captures 则把每次听写、应用内录音、上传音频都保存下来：原始音频、transcript、重新转写、refine、inline edit、转成 voice...

37710

PHP Neuron V3 正式全面支持多模态

Tinywan 9天前2026-07-01 15:01:49

通常纯 AI 音频服务不支持工具和对话等完整的代理能力。因此，您可以将这些组件作为独立服务在代理工作流程中使用，或者因为它们实现了 AIProviderInte...

11910

LTX2.3 最强导演台工作流来了！一键实现「视频参考 + 相机运动控制 + 音频驱动」附工作流踩坑记录

疯狂的KK 11天前2026-06-29 13:48:58

如果一个视频的运镜非常的炫酷，但是对专业的运镜又不懂，那么怎么实现？反推视频？又不够细节，我们生图都可以参考图，如果视频能够严格遵循轨迹运动就好了，LT...

31010

国外大学生都用FPGA做什么项目（十六）

FPGA技术江湖 11天前2026-06-29 13:04:02

阔别已久的大学生项目，今天又开始了，主要是2024年和2026年两年的（之前是到2023年的）。

12510

PD 芯片：转接器边充边传的技术，手机快充并进行数据传输

legendary_163 11天前2026-06-29 09:00:56

手机直播、短视频录制时，通常需要外接声卡、采集卡、硬盘存储素材，外设持续耗电会导致手机快速掉电。PD 芯片转接器同时打通快充与数据通道，直播全程稳定补电，画面录...

14710

AI 懒人起号秘籍！用 Coze 工作流 3 步搞定「治愈系老爷爷」图文 / 视频，新手 7 天暖哭全网转评赞爆单～

HELLO程序员

GSK(中国) ｜全栈架构师 (已认证)

14天前2026-06-26 18:14:17

15800

Adobe Audition 音频问题定位与修复：基于频谱分析的四类典型场景处理方案

PC电脑医生 14天前2026-06-26 10:14:50

摘要：录音中出现的噪音、回声、削波失真和间断性杂音，在波形图上往往难以直观判读，但在频谱视图下每种问题都有独特的"指纹"。本文从频谱诊断入手，拆解四类高频音频...

13810

#音频

写作和思考，应该被AI改变么？

做一本100万字的有声书大概多少钱？从画本、演播、后期到审听完整拆解有声书制作成本

【直播】AI时代的“工具价值”：还需要学习软件吗？

19K stars：Meetily 把会议录音从云端搬回本机

一本小说真的可以一键变成多人有声剧吗？全自动AI多播有声剧生产流程揭秘

ICML 2026 | 一个模型，统一人、物、声、动作:OmniShow把多模态可控视频生成卷成系统工程！

牛！一款国产AI语音登顶全球第一，首个可编辑语音模型来了！

多模态大模型落地：开发者最该避开的三个坑

多模态大模型实战：从选型到落地指南

有声书到底是怎么做出来的？全面解析有声书制作体系、产业生态与未来趋势

从技术视频到短视频：AI辅助剪辑全流程技术复盘

登上 GitHub 日榜 TOP5，收获 1.2 万标星的自动剪辑视频开源工具。

Voicebox：本地优先的 AI 语音工作室

PHP Neuron V3 正式全面支持多模态

LTX2.3 最强导演台工作流来了！一键实现「视频参考 + 相机运动控制 + 音频驱动」附工作流踩坑记录

国外大学生都用FPGA做什么项目（十六）

PD 芯片：转接器边充边传的技术，手机快充并进行数据传输

AI 懒人起号秘籍！用 Coze 工作流 3 步搞定「治愈系老爷爷」图文 / 视频，新手 7 天暖哭全网转评赞爆单～

Adobe Audition 音频问题定位与修复：基于频谱分析的四类典型场景处理方案

热门专栏

腾讯开源的专栏

进击的Coder

贤羽的前端小栈

张善友的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

#音频

写作和思考，应该被AI改变么？

做一本100万字的有声书大概多少钱？从画本、演播、后期到审听完整拆解有声书制作成本

【直播】AI时代的“工具价值”：还需要学习软件吗？

19K stars：Meetily 把会议录音从云端搬回本机

一本小说真的可以一键变成多人有声剧吗？全自动AI多播有声剧生产流程揭秘

ICML 2026 | 一个模型，统一人、物、声、动作:OmniShow把多模态可控视频生成卷成系统工程！

牛！一款国产AI语音登顶全球第一，首个可编辑语音模型来了！

多模态大模型落地：开发者最该避开的三个坑

多模态大模型实战：从选型到落地指南

有声书到底是怎么做出来的？全面解析有声书制作体系、产业生态与未来趋势

从技术视频到短视频：AI辅助剪辑全流程技术复盘

登上 GitHub 日榜 TOP5，收获 1.2 万标星的自动剪辑视频开源工具。

Voicebox：本地优先的 AI 语音工作室

PHP Neuron V3 正式全面支持多模态

LTX2.3 最强导演台工作流来了！一键实现「视频参考 + 相机运动控制 + 音频驱动」 附工作流踩坑记录

国外大学生都用FPGA做什么项目（十六）

PD 芯片：转接器边充边传的技术，手机快充并进行数据传输

AI 懒人起号秘籍！用 Coze 工作流 3 步搞定「治愈系老爷爷」图文 / 视频，新手 7 天暖哭全网转评赞爆单～

Adobe Audition 音频问题定位与修复：基于频谱分析的四类典型场景处理方案

腾讯开源的专栏

进击的Coder

贤羽的前端小栈

张善友的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

LTX2.3 最强导演台工作流来了！一键实现「视频参考 + 相机运动控制 + 音频驱动」附工作流踩坑记录