首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#语音

SC5080B sop8语音芯片替代开发记录_KT148A flash型420秒

清月电子

SC5080B 封装是SOP8,客户反馈芯片已经停产,需要我们使用KT148A语音芯片,进行原有的芯片方案替代和升级,毕竟flash型的语音芯片在使用和修改,有...

900

KT148A的语音地址是u8类型,只支持256个语音文件寻址 超了怎么办

清月电子

KT148示例给的语音地址是u8的数据,那总共只支持256个语音文件的寻址,假如后期要做多国语言的话,可能会超过256个寻址。。?怎么处理这个问题呢?

3300

这AI绝对偷了格莱美奖杯!直接把LLaMA喂成乐坛顶流:开源版Suno来了!

机器之心

还有这首 AI 新编版《世界赠与我的》!模仿王菲空灵仙嗓也太到位了吧,完全不一样的旋律,一样的嘎嘎好听,宁静中带一点哀伤的意境拿捏得简直了!

5610

KT148A语音芯片接受串口播放一线指令,播放完成如何检测

清月电子

发送一条播放语音命令给KT148A之后,会有返回信号吗?表示播放完成或者播放成功之类的

2900

检测物体+估计距离和方向 | 附源码

小白学视觉

计算从语音命令接收的物体到摄像头的距离,并用语音通知最终用户物体在时钟上的位置方向。

5410

给语音模型戴上「眼镜」,错误率降低12.5%!人大CMU最新开源 | AAAI 2025

新智元

【新智元导读】视觉+语音=更强的语音识别!BPO-AVASR通过优化音视频输入和输出偏好,提升语音识别在真实场景中的准确性,解决了传统方法在噪声、口语化和视觉信...

8710

OpenAI语音智能体诞生,怼脸实拍语气狂到飞起!API降到每分钟0.3美分

新智元

如果开发者希望构建低延迟的语音转语音体验,OpenAI建议使用语音转语音模型来构建实时API。

7610

重大突破!OpenAI 发布语音Agent;百度调查“开盒事件”始末:谁在偷我们的隐私?AI独角兽百川智能高管出走!| Q资讯

深度学习与Python

3 月 21 日凌晨 1 点,OpenAI 进行了技术直播发布了三款全新语音模型,专用于开发语音 AI Agent。

7710

刚刚,OpenAI又发新货!3个新模型+1个新网站,语音识别比Whisper更强!

AI进修生

三个音频模型:gpt-4o-mini-tts(文字转语音),gpt-4o-transcribe 和 gpt-4o-mini-transcribe(语音转文字)。

9910

打工人必藏!60+AI黑科技开挂工具箱:从智能管家到灵感核爆

AI.NET 极客圈

人工智能(AI)工具已经成为我们日常生活和工作中不可或缺的一部分,它们不仅显著提高了工作效率,还为创意和创新开辟了新的可能性。小编特地整理了60+的AI工具提供...

7600

OpenAI放大招!macOS桌面版ChatGPT开放下载,免费使用GPT-4o

AgenticAI

还在苦于没法练口语?没有外国人陪练?现在你只需要打开App就能开始语音对话啦,点击右下角的?按钮即刻开始实时语音交流。

7400

声音比真人还像真人的Maya,背后模型开源了!跨越语音恐怖谷

机器之心

但当今 AI 语音助手虽然接近人类但仍有机械感或情感表达不自然的时候,用户可能会感到怪异,甚至比完全机械化的语音更难以接受。这种现象被称为语音恐怖谷效应,是当前...

10010

突破性语音合成技术!Spark-TTS:用大模型打造你的专属AI语音助手

AI浩

你是否想过,未来的语音助手不仅能“说话”,还能根据你的需求调整音色、语速甚至情绪?近日,一项名为Spark-TTS的突破性技术横空出世,它基于大语言模型(LLM...

70710

MATLAB用CNN-LSTM神经网络的语音情感分类深度学习研究

拓端

在语音处理领域,对语音情感的分类是一个重要的研究方向。本文将介绍如何通过结合二维卷积神经网络(2 - D CNN)和长短期记忆网络(LSTM)构建一个用于语音分...

14610

从鹦鹉学舌到灵魂对话,AI的「人话革命」

科技云报道

智能语音助手如Apple的Siri、Google的Google Assistant等开始兴起,能够识别语音指令并提供有用的信息。

8710

ChatGPT-5更新大曝光!免费用户能升级GPT-4了?

用户11203141

AIPRM首席工程师Tibor Blaho最近在X上透露了ChatGPT即将推出的功能和界面更新。尽管Sam Altman曾明确表示GPT-5不会那么快推出,而...

9210

什么是DeepSeek-R1?如何入门DeepSeek-R1?手机端和网页端使用攻略

猫头虎

DeepSeek-R1是由中国人工智能公司深度求索(DeepSeek)推出的新一代AI智能助手,定位于多场景生产力工具。它基于自主研发的大语言模型(LLM),支...

25610

千万网友围观,两个语音AI开始加密通话,网友:中间真没骂我两句?

机器之心

两个 AI 智能体语音对话这件事听起来平平无奇,这不就是基操吗?但当他们确认彼此的 AI 身份后,一切变得超乎想象了。

10100

微软发布Phi系列新成员:Phi-4-multimodal与Phi-4-mini,引领小型语言模型新潮流

GPUS Lady

本周,微软宣布推出Phi家族的最新成员——Phi-4-multimodal和Phi-4-mini,这两款小型语言模型(SLMs)旨在为开发者提供先进的AI能力,...

18310

微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B

机器之心

2024 年底,微软正式发布了 Phi-4—— 在同类产品中表现卓越的小型语言模型(SLM)。仅用了 40% 合成数据,140 亿参数的 Phi-4 就在数学性...

4500
领券