首页
学习
活动
专区
圈层
工具
发布

#语音

fpga实现音频预加重(pre-emphasis)滤波器

FPGA技术江湖

在语音信号中,声门波激励和口鼻辐射效应共同导致语音信号的高频分量能量要比低频分量弱。预加重(Pre-emphasis)的目的就是: 1 .提升高频分量,平衡语音...

2400

基于语音钓鱼的Aura客户数据泄露机制与防御架构研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着通信技术的演进,网络攻击正从传统的文本钓鱼向更具欺骗性的语音钓鱼(Vishing)形态演变。近期,智能照明品牌Aura遭遇的客户数据泄露事件,揭示了攻击者利...

7910

韩国语音钓鱼案件中资金隐匿机制与检方补充侦查策略研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着信息通信技术的迭代升级,电信网络诈骗犯罪呈现出组织化、智能化及非接触化的显著特征。其中,语音钓鱼(Voice Phishing)作为传统社会工程学攻击的现代...

9010

谷歌Tensor G5发布:3nm制程,CPU性能提升34%,TPU性能提升60%!

芯智讯

8月21日消息,谷歌刚刚发布了新一代 Pixel 10 系列机型,其搭载了谷歌最新的Tensor G5处理器,这是谷歌首款交由台积电代工的出货量,并且也是谷歌当...

13410

苹果首款AI眼镜曝光:将采用S10处理器,预计2026年上市

芯智讯

12月15日消息,据韩国媒体ebn.co.kr报道,最新供应链与产业消息指出,苹果可能不会为首款人工智能(AI)眼镜采用iPhone的A系列芯片,而是转为采用A...

11110

韩国信用信息服务语音钓鱼攻击机制与防御体系研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

近期,韩国发生了一起针对韩国信用信息服务(Korea Credit Information Service, KCIS)的复杂语音钓鱼(Vishing)攻击事件...

16210

8.8K Star!真正的本地实时 Whisper 开源神器,彻底干翻云端 STT!

开源星探

它不是简单的 Whisper 包装,而是一套专门为本地流式语音识别优化的全栈解决方案,真正把 Whisper 流式延迟高的痛点给干碎了。

47310

微软又上大分!刚刚开源一款 0.5B 轻量级实时 TTS 模型,还能边想边说!

开源星探

大家平时用各种 AI 助手语音模式时,你问了一个问题,对面沉默了 2-3 秒(虽然他在思考),然后突然给你念一段完美的稿子。

27210

TEN VAD 开源:低延迟、高准确率,提升「语音 Agent」上限就靠它!

开源星探

当我们在聊 Voice Agent、语音 AI、实时对话时,大家的注意力几乎都被 ASR、TTS、LLM 抢走了。

25110

英伟达开源上瘾了!推出了一款实时语音智能体的终极 ASR:24ms 极速锁定。

开源星探

NVIDIA(英伟达)最近开源了最新的 Nemotron Speech ASR 模型。

19010

5.6K Star!原本付费现在开源!本地版“ElevenLabs”,视频翻译+声音克隆全免费!

开源星探

有没有一种方案,既能拥有顶级的语音识别和克隆效果,又能完全免费、无限量地使用呢?

68310

52KB 的奇迹!NovaSR 开源:16kHz 秒变 48kHz,快出天际的音频超分模型!

开源星探

当你打开 Hugging Face 或者 GitHub,映入眼帘的绝大多数都是参数量爆炸的巨兽:动辄几十几百 GB,让我们这种普通玩家望洋兴叹。

13910

微软重磅开源!22K星的 VibeVoice 再添新成员,60分钟音频 ASR 端到端统一输出!

开源星探

现在的 ASR(语音转文字)模型,像 OpenAI 的 Whisper,识别率确实已经很顶了。

23810

微信 AI 工作流又进一步:WorkBuddy 打通 OpenClaw

技术人生黄勇

周二刚上线的 WorkBuddy (腾讯版"小龙虾"免费用!WorkBuddy 公测上线|QClaw 也在内测中)今天又整活了。

93630

Handy-完全本地的语音识别工具

山行AI

Handy 是一款跨平台桌面应用,基于 Tauri(Rust + React / TypeScript) 构建,专注于简单、隐私友好的语音转写体验。 只需按下快...

25510

Clawdbot — 开源的新一代个人 AI 助手

山行AI

Clawdbot 是一款运行在你自己设备上的个人 AI 助手。它可以在你已经使用的通讯渠道中与你对话,包括:WhatsApp ,Telegram ,Slack ...

20610

Voicebox-轻松管理你的语音克隆与音色设计

山行AI

Voicebox 是一个本地优先的语音克隆工作室,具有类似数字音频工作站(DAW)的功能,用于专业的语音合成。把它当作 ElevenLabs 的本地、免费的开源...

31710

OpenAI正准备发布其首个语音驱动型个人设备

春哥大魔王

OpenAI当前的语音模型与文本模型分属不同架构,导致用户通过语音与ChatGPT对话时,获得的回答质量和速度均逊于文本模型。

10910

特斯拉将搭载豆包大模型和DeepSeek大模型

春哥大魔王

其中,豆包大模型将承担语音命令功能,如导航设定、媒体播放操控、空调温度调节等,同时,还具备车主手册查询功能;DeepSeek模型则提供AI语音闲聊服务 。

12910

从上海 WAIC 归来的一些见闻和感想

技术人生黄勇

出门问问 TicNote 现场直接卖光了,科大讯飞区也超级火爆,语音相关的产品区让人感觉太卷了,大家把能想到的硬件软件都做了。

11310
领券