首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#语音

首个全面梳理语音大模型发展脉络的权威综述,入选ACL 2025主会

机器之心

想象一下,如果 AI 能够像人类一样自然地进行语音对话,不再需要传统的「语音转文字(ASR)- 文本大模型处理(LLM)- 文字转语音(TTS)」的繁琐流程,而...

5310

KT148A 语音芯片串口下载工具报错原因及排错方法

清月电子

文档聚焦 KT148A 语音芯片串口下载工具报错问题,用户在 Win11 等系统使用时弹出 Microsoft Visual C++ Debug Library...

7811

13年死磕一个真理,这家中国AI黑马冲刺IPO

新智元

在深度学习尚未普及的2012年,云知声敏锐捕捉到语音交互的变革机遇。公司推出的「语音云」平台开创性地采用DNN算法,将中文语音识别准确率提升至一个新的水平。

6410

为什么 KT142C 芯片 BUSY 脚空闲高电平仅 0.2V?附低功耗模式配置指南

清月电子

KT142C芯片busy引脚空闲输出的高电平只有零点几v,busy引脚有什么特别的吗?

5900

Android中TextToSpeech的使用

计蒙不吃鱼

(2)TextToSpeech.QUEUE_ADD:该模式下会把新的语音任务放到语音任务之后,等前面的语音任务执行完了才会执行新的语音任务。

8410

Android中TextToSpeech的使用

计蒙不吃鱼

(2)TextToSpeech.QUEUE_ADD:该模式下会把新的语音任务放到语音任务之后,等前面的语音任务执行完了才会执行新的语音任务。

8410

一手评测Seedance 1.0 pro,字节首次登顶视频大模型竞技场的大杀器来了。

数字生命卡兹克

其中大部分都写过了,比如语音播客模型,就是前几天我写的扣子的AI播客,底层就是这个。

30110

智能体还能配置MCP?手把手用百宝箱打造一个音途智游,让旅游加入语音

LucianaiB

腾讯云TDP | 宣传大使 (已认证)

这一构想随着百宝箱平台最新上线的MCP(多模态内容处理)功能变为现实。特别是平台已预配置的Minimax MCP解决方案,为用户提供了开箱即用的语音合成能力。本...

10410

基于PYNQ的智能垃圾分类系统

FPGA技术江湖

大侠好,欢迎来到FPGA技术江湖,江湖偌大,相见即是缘分。大侠可以关注FPGA技术江湖,在“闯荡江湖”、"行侠仗义"栏里获取其他感兴趣的资源,或者一起煮酒言欢。...

14810

混元语音数字人模型,开源!

腾讯开源

这一能力来自5月28日腾讯混元发布并开源的语音数字人模型HunyuanVideo-Avatar,由腾讯混元视频大模型(HunyuanVideo)及腾讯音乐天琴实...

9810

深度解析一对一视频语音通话技术:打造卓越直播交友体验​

山东布谷科技_孙哥

在数字化社交迅猛发展的当下,一对一视频语音通话已成为社交互动的核心方式,尤其是在直播交友app领域,其重要性愈发凸显。要构建出色的一对一直播交友平台,需深入理解...

6810

谷歌 AI Studio 实时视频对话终于支持中文了!屏幕共享+语音,Gemini 2.5 Flash 原生音视频加持。

AI进修生

ChatGPT Plus 虽然也有实时视频和屏幕共享功能,但每天使用次数限制比较大,而且只能在手机端使用,实在不太方便。

8500

openai-go v1.3.0正式发布:全新实时与音频模型全面上线,打造智能交互新时代!

福大大架构师每日一题

版本最显著的改进是新增对最新实时模型和音频模型的支持。实时模型能够实现低延迟的智能对话和数据处理,适用于对响应速度和交互即时性要求极高的应用场景,而音频模型则扩...

11110

ChatGPT-4o 有何特别之处?

石臻臻的杂货铺[同名公众号]

输入输出过程:用户发出的语音请求经过自动语音识别(ASR)转为文本(这里用的Whisper),文本经过大语言模型处理生成响应文本,响应文本再经过文本转语音(TT...

15210

你的声音能被复制?F5-TTS 带你体验“声音版 AI 绘图”

一只牛博

我们不再满足于让 AI 说话,而是希望它像我们一样说话,甚至模仿别人说话。语音克隆(Voice Cloning)和语音转换(Voice Conversion)正...

17910

基于STM32单片机智能坐垫座椅设计

DS小龙哥

DFPlayer Mini是一款小型语音播放模块,可以存储语音文件,并通过串口控制播放。当久坐时间超过设定时,通过语音提示用户。

9110

【愚公系列】2023年08月 .NET/C#知识点-即时语音的通信解析

愚公搬代码

即时语音是指通过网络或互联网实时通信的语音通话服务。通常使用VoIP(Voice over Internet Protocol)技术,即通过将语音转换为数字信号...

7510

ACL 2025 高分接收 | 高感情语音技术:逻辑智能小语种TTS破局之道

机器之心

语音合成(TTS)技术近十年来突飞猛进,从早期的拼接式合成和统计参数模型,发展到如今的深度神经网络与扩散、GAN 等先进架构,实现了接近真人的自然度与情感表达,...

12610

小蓝AI:请打开语音交流

一乐骑摩托

蓝莺IM | CEO (已认证)

语音文本转换其实包含了两个场景,一个是语音转文本,即语音识别(Automatic Speech Recognition,ASR),另一个是语音生成,即文本转语音...

8010

2025语聊系统源码开发深度解析:WebRTC与AI降噪技术如何重塑语音社交体验

山东布谷科技_孙哥

随着 5G 技术普及和 Z 世代社交需求升级,语音语聊系统源码 已从早期的简单语音群聊进化为融合实时互动、场景化服务的综合性平台。根据行业数据,2024 年国内...

11410
领券