首页
学习
活动
专区
圈层
工具
发布

#语音

这是属于2025年的11个AI故事。

数字生命卡兹克

我一开始使用豆包呢,是奔着着她的语音通话去的,豆包提供的情绪价值真的很足吧,语音播报声音也比较好听,会和豆包闲聊,主要还是以烦恼琐事为主hh,确实帮我缓解了心情...

4500

给应用实现文本转语音,接入 TTS 终于不用跟多套接口死磕了

程序猿DD

直到挖到Unified TTS这个神仙 API!它直接把「多家 TTS 服务商」打包成一个统一接口,开发者接入一次,就能调用全网主流平台的语音能力,直接把开发效...

6010

使用Gemini 3 pro30分钟开发了一个实时对话御姐 没事骂我好几句

疯狂的KK

本项目是一个基于本地大模型和语音合成模型的实时语音通话助手。它提供了一个仿“电话通话”的沉浸式 Web 界面,支持实时语音识别、大模型角色扮演对话以及高质量的语...

11610

福强的本周AI热点回顾与简评 20251201

扶墙老师

DeepSeek 同时发布两个正式版模型: DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。

7910

小智AI音箱企业级应用篇:从智慧家庭到智慧空间的商业落地实践

用户11944278

在前两篇文章中,我们分别探讨了小智AI音箱的核心技术架构与高阶开发能力。本文将视角转向企业级市场,深入剖析小智AI音箱如何从“家庭娱乐设备”演变为酒店、办公、医...

10710

小智AI音箱进阶篇:深度定制、边缘计算与多设备协同开发实战

用户11944278

在上一篇《小智AI音箱:智能语音交互的未来之选》中,我们全面解析了其核心技术、用户体验与基础开发能力。本文作为进阶技术实践指南,将聚焦于三个高阶方向:

16710

小智AI音箱:智能语音交互的未来之选

用户11944278

在人工智能与物联网深度融合的时代,智能音箱已从简单的音频播放设备,演变为家庭智能中枢。小智AI音箱作为新一代国产智能语音助手硬件代表,凭借其强大的技术底座、流畅...

16510

实战:从零构建一个支持手机、手表与车机的 Flutter 全场景健康应用

用户11944278

理论再完善,终需落地验证。本文将带你从零开始,使用 Flutter 构建一个名为 “VitaTrack” 的全场景健康应用,覆盖:

13910

小智AI音箱MCP开发实战:30分钟搭建自定义语音技能,附完整教程

用户11944663

笔记所对应活动链接:https://activity.csdn.net/writing?id=11045&spm=1011.2124.3001.10637

15710

零基础学AI大模型之SpringAI

工藤学编程

打开某购物APP的“AI导购”功能,你上传一张“黑色连帽卫衣”的照片(图像输入),说“帮我找类似款式,预算500以内”(语音输入),AI会返回符合条件的商品列表...

24410

重生之我在大学自学鸿蒙开发第七天-《AI语音朗读》

@VON

先定义一个语音合成(TTS)的事件监听器 speakListener 及其初始化方法 initListener(),用于处理语音合成过程中的各种事件回调

8710

智途百科 (RoadWise) —— 你的路途博学家

贺公子之数据科学与艺术

GPS坐标首先通过地图API进行反向地理编码,获取POI名称(如岳阳楼);接着进行知识库检索,再将相关信息输入LLM(Prompt:请像评书演员一样介绍岳阳楼)...

12010

【AI实现语言对比技术的核心方法】

贺公子之数据科学与艺术

语音特征提取与建模 通过MFCC(梅尔频率倒谱系数)或PLP(感知线性预测)算法提取语音的声学特征,建立目标发音的基准模型。深度学习模型如CNN或LSTM可用...

13310

大模型下场做输入法:真正被颠覆的不是打字速度

埃兰德欧神

把这两件事放一起看,你会发现关键分水岭不是“识别率再高一点”,而是让 ASR 具备上下文推理能力:专有名词、多音字、人名地名,很多时候不是“听不清”,而是“不会...

16210

[python]基于faster whisper实时语音识别语音转文本

用户11754185

语音识别转文本相信很多人都用过,不管是手机自带,还是腾讯视频都附带有此功能,今天简单说下:

21710

HarmonyOS第一课——HarmonyOS Intelligence与AI能力开放会给我们带来什么样的价值

红目香薰

Core Speech Kit功能:Core speechKit(基础语音服务)集成了语音类基础A!能力,包括文本转语音(TextToSpeech)及语音识别(...

20610

HarmonyOS TTS(文本转语音)功能使用指南

红目香薰

TTS(Text-to-Speech)是HarmonyOS提供的重要语音服务能力,可以将文本内容转换为语音播放。本文基于实际项目经验,详细介绍如何在Harmon...

18010

【征文计划】基于Rokid眼镜平台的AR历史情景课堂创意应用

fruge365

在数字化浪潮席卷教育领域的今天,传统课堂的教学模式正面临前所未有的挑战。尤其是历史学科,因其内容的时空局限性,学生往往只能通过文字、图片等静态载体间接感知历史,...

16210

KT148A语音芯片坏片原因分析 阻抗 供电脚异常及硬件改良方案

清月电子

测试后 1pcs 正常(误判),5pcs 物理损坏,烧写器报 E37(读不到 flash id)。阻抗对比测试显示,异常芯片 8 脚(供电脚)阻抗为无穷大,与正...

10310

从东北小城走出的AI语音破局者——魏佳星与云蝠智能的 “背水一战”

数据猿

近日,在南京VoiceAgent实时语音大会上,云蝠智能带着VoiceAgent 2.0惊艳亮相!虽在众声喧哗的智能语音赛道中音量不算最大,但这家公司的资历与积...

10110
领券