昨日,百度语音能力引擎论坛在北京召开。在论坛上,百度展示了其在语音技术上的最新成果,并公开了语音专用终端芯片——百度鸿鹄的落地情况。此外,机器之心也采访了百度语音首席架构师贾磊。百度通过本次发布说明,深度学习端到端技术依然大有发展空间,软件驱动专用芯片设计成 AI 落地新打法。
介绍了一种以ARM为核心的嵌入式语音识别模块的设计与实现。模块的核心处理单元选用ST公司的基于ARM Cortex-M3内核的32位处理器STM32F103C8T6。本模块以对话管理单元为中心,通过以LD3320芯片为核心的硬件单元实现语音识别功能,采用嵌入式操作系统μC/OS-II来实现统一的任务调度和外围设备管理。经过大量的实验数据验证,本文设计的语音识别模块具有高实时性、高识别率、高稳定性的优点。本文引用地址:http://www.eepw.com.cn/article/201706/347845.htm
自动语音识别技术在十多年之前还难登大雅之堂,但现在它正成为人们和主要计算设备之间进行交互的主要手段。 据麻省理工学院报道,该院的研究人员已成功开发出了自动语音识别的低功耗专用芯片。通常人们在手机上启用一次语音识别软件需要消耗1瓦左右的电量,而这款新芯片只需消耗0.2到10毫瓦的电量;当然,具体的能耗大小和需要识别的单词数量有关。 在实际应用中,这可能意味着节约90%到99%的电量,从而使得语音控制可应用到相对简单的电子设备中;包括电容量有限而需要从其所处环境中吸取能量的设备,以及几个月才进行电池充电的设备。
关于声音的需求,从始至终,都是很刚需的需求 。从语音芯片的演化就能看出很多的端倪,很多很多的产品他必须要有语音,才能实现更好的交互。而语音芯片的需求分类,其实也是很好理解的,从市场上常用的芯片产品特性,大概就能归类如下:
4月20日,百度旗下人工智能品牌小度发布了新款无屏智能音箱——小度智能音箱 2 红外版。据百度官方介绍,该音箱搭载了百度首款针对远场语音交互研发的鸿鹄芯片,性能上有三大提升:1)在语音识别上错误率平均降低30%;2)高噪声下首次唤醒率提升10%以上,且达到家居场合使用的超低误报要求;3)平均工作功耗仅100mw左右,待机功耗下降90%。
近日,在亚马逊举行的一次技术开发大会上,英特尔正式宣布,其将与亚马逊进行合作,于明年第一季度推出一款类似亚马逊Echo的智能音箱产品“Smart Home Hub”(智能家庭中枢)。 在这项计划中,Smart Home Hub理所当然的将采用英特尔自家的芯片。不过,英特尔似乎并没有自己动手研发一个独立智能语音平台的打算,而是选择直接内嵌亚马逊的Alexa智能语音助手。按照英特尔的说法,他们希望将这款产品作为一个原型参考,引导更多的合作伙伴学习借鉴。 既然做音箱,英特尔为何将“蛋糕”分给别人? 近些年,由于P
当你想要知道明天的天气情况时,可以直接问家里的智能音箱;当你开车时想要切换导航路线,可以直接说出新的目的地;当你感觉空调不够凉爽的时候,也可以直接告诉空调把温度调低一些……
全球最大存储器厂商(三星)和全球最大Fintech独角兽(蚂蚁金服)的加持对这家成立不到两年的初创公司意味深长。 昨天,深鉴科技召开了成立以来的第一次新品发布会,正式宣布已完成约4000万美金的A+轮融资。本轮融资由蚂蚁金服与三星风投领投,招商局创投与华创资本跟投。深鉴科技创始人、CEO 姚颂表示,本次融资将继续用于安防、数据中心领域及后续芯片产品的开发。深鉴与三星将展开包括存储在内的多方面合作。而蚂蚁金服的战略资源注入,将帮助深鉴进一步开拓包括金融在内的更多应用场景,而关于金融领域的进一步布局,深鉴没有
---- 新智元报道 来源:Google 编辑:小咸鱼 David 【新智元导读】谷歌发布年度旗舰手机Pixel 6和Pixel 6 Pro,谷歌自研的「Tensor」芯片成为最大亮点,三星5nm工艺打造,CPU性能比去年Pixel 5提升80%,GPU性能提升更是高达370%,大杯599美元,超大杯899美元。 那个深耕搜索引擎,智能手机操作系统,深度学习框架等等领域的硬核科技公司又鼓捣出新东西啦! 是的,10月20号,谷歌带来了最新的年度旗舰手机Pixel 6和Pixel 6 Pro。 不同
前言:本文作者@焦糖玛奇朵,是我们“AI产品经理大本营”早期成员,下面是她分享的第1篇文章,欢迎更多有兴趣“主动输出”的朋友们一起加入、共同进步:) 📷 音频由公众号“闪电配音”提供 媒体和AI巨头们乐于给大众描绘一幅幅精彩的未来生活蓝图:人工智能可以化身为你的爱车,在沙漠、森林或小巷中风驰电掣;可以是智慧公正的交警,控制红绿灯、缓解交通的拥挤;还可以是给人以贴心照顾的小助理,熟悉你生活中的每一处小怪癖。 在看到这些美妙的畅想之后,作为一个严谨认真的AI产品经理,我不禁想去探索上述美好未来的实现路径;今天,
【新智元导读】苹果正在开发专门处理 AI 相关任务的处理器——Apple Neural Engine。苹果已经考虑将照片应用中的面部识别、一部分语音识别以及 iPhone 的键盘预测功能卸载到该芯片中。将一些任务卸载到专门针对苛刻的 AI 处理任务设计的专用模块中,可以显著提高苹果的硬件性能,尤其是电池性能。新消息可能在 6 月份即将举行的年度开发者大会上正式发布。 在 AI 领域,苹果起步很早。2011年,苹果就推出了 AI 软件 Siri,可以让用户使用语音命令来操作智能手机。 现在,这家电子巨头正在把
从“冷板凳”到“最热风口”,俞凯博士(思必驰联合创始人、首席科学家)一直相信人机交互,将带给人类一个更美好的未来。并且,他还有一个更远大的目标,借助科技,沟通万事、打理万物,从而改变世界。
语音识别是AI领域的一项重要基础服务,同样也是vivo AI体系中举足轻重的能力,是Jovi输入法、Jovi语音助手等应用的基石。打造高准确率、高性能的语音识别引擎,才能给vivo亿级的语音用户带来良好的体验。基于wenet端到端语音识别工具,vivo结合自身业务场景进行深度优化,成功研发离线和流式识别引擎,支撑vivo语音业务的快速发展。
智能家居技术在近年来取得了巨大的发展,并逐渐成为人们日常生活中的一部分。智能家居系统带来了便利、舒适和高效的生活体验,拥有广泛的应用领域,其中之一就是智能窗帘控制系统。
智能语音在近年一直是个很火的话题,商业应用也在不断增加,在10月10号的深蓝&大咖面对面活动中,我们邀请到了语音界大佬陈果果博士,针对目前语音领域问题进行分享与探讨。
对于黄伟和云知声来讲,今年是让AI芯片UniOne经受市场考验的一年,也是进一步扩大业务的一年。 去年,智能音箱以及智能家居的盛行让语音交互再次走上一个高峰,同时,作为人工智能的重要一环,AI芯片也得到了广大的关注。现在,云知声将两者进行了一次融合,为自己的定位扣上了最后一环。 创立云知声公司 只因人机自然对话是接下来的变革 在创立云知声之前,创始人兼CEO黄伟已经连续创业两次了,而云知声则是他的第三次创业。不过,贯穿三次创业,黄伟一直围绕的重心都是“智能语音技术”。 “我相信,以语音识别为代表的自然人机
▼ 人工智能就是人脸识别? ▼ 深度学习和机器学习有什么区别? ▼ 大家都在谈的迁移学习到底讲了些啥? ▼ 看个新闻都要查字典怎!么!破! AI高频词汇TOP15(入门版) 特!别!放!送!啦! ---- 01计算机视觉 Computer Vision 计算机视觉(Computer Vision,简称 CV)是人工智能学科中发展最快、应用最广的领域之一。 与自然语言处理、语音识别这些不同的是,它是一门研究如何使机器「看」的科学,其主要任务是通过对采集的图片或视频进行处理以获得相应场景的信息;更进一步的说
2015 年,有投资人跟云知声创始人/ CEO 黄伟说:“老黄啊,你要专注赛道,做好语音识别就够了。”
场景描述:在全民抗击疫情时期,做好全面的防护是重中之重。电梯按键因为必须接触使用等原因,具有很高的潜在感染传播风险。为此,一家科技公司开发了「无接触式」方案,用语音控制来完成对电梯的呼叫和使用。
深度学习广泛用于各种人工智能任务中,传统的深度学习加速器侧重于面向数据流的计算架构优化。然而传统冯·诺依曼体系结构所带来的「存储墙」问题日益突显,计算单元与存储单元间的频繁数据搬移造成了大量的能耗。
这家以“图”起家的AI公司,现在宣布修个“语音”双学位,而且出场便是学霸的方式——随手甩出一张摸底考第一名成绩单。
据彭博社援引消息人士称,苹果正在紧锣密鼓开发一款专用优化苹果人工智能服务的人工智能芯片。 苹果早在2011年就推出了Siri语音助手服务,加快了人工智能服务的进程。现在又有消息放出,说苹果正在将人工智
语音控制的基础就是语音识别技术,可以是特定人或者非特定人的。非特定人的应用更为广泛,对于用户而言不用训练,因此也更加方便。语音识别可以分为孤立词识别,连接词识别,以及大词汇量的连续词识别。对于智能机器人这类嵌入式应用而言,语音可以提供直接可靠的交互方式,语音识别技术的应用价值也就不言而喻。 1 语音识别概述 语音识别技术最早可以追溯到20世纪50年代,是试图使机器能“听懂”人类语音的技术。按照目前主流的研究方法,连续语音识别和孤立词语音识别采用的声学模型一般不同。孤立词语音识别一般采用DTW动态时间规整
人工智能从幕后走向实用离不开人工智能技术取得的突破和发展。在互联网时代背景下,大数据、新型高性能计算架构以及深度学习帮助人工智能技术实现了从量变到质变的转变。其中,计算机视觉、语音识别技术均已能够规模
素来被认为是“人脸识别独角兽”——或者更宽泛一点说,“计算机视觉独角兽”的依图科技,公布了他们中文语音识别技术的最新突破,以及令人瞩目的产业布局。
原创2015-04-02罗超 去年今日,一款名为“Typany”的智能输入环红遍网络,不少人都信以为真,成为互联网巨头借势愚人节营销的经典案例。最后这款能够彻底改变我们输入方式的产品并未成为事实,搜狗发布了一款名为“糖猫”的儿童手表,变相地进入了智能可穿戴设备领域。今年,搜狗又发布了一款名为“智齿”的概念产品,其功能更是让人脑洞大开。那么它究竟是不是YY呢? 这款名为“智”齿的设备将被植入口腔,主要功能有4个。1、全新人体植入技术,智能矫正发音;2、方言词库,改善普通话不标准状况;3、提高说话流畅度,表达
李根 发自 凹非寺 量子位 报道 | 公众号 QbitAI 还记得教科书里的“经济基础决定上层建筑”、“生产关系反作用于生产力”吗? 2018年刚开始,过往以技术变革为主的AI,频频在政策方面搞出大新闻。 以下是量子位摘选的最新重要AI相关政策。 AI创新发展和数字经济试点重大工程 2017年12月27日,国家发改委已经公布了《国家发展改革委办公厅关于组织实施2018年“互联网+”、人工智能创新发展和数字经济试点重大工程的通知》,并在12月27-1月3日进行了公示。 如今公示期已过,关于AI创新发展的重大
从年初起,几家国际大厂的开发者大会,无论是微软Build、Facebook F8还是稍后的Google I/O,莫不把“AI优先”的大旗扯上云霄。 如果这一波AI大潮只是空喊几句口号,空提几个战略,空有几家炙手可热的创业公司,那当然成不了什么大气候。但风浪之下,我们看到的却是,Google一线的各大业务纷纷改用深度学习,落伍移动时代的微软则已拉起一支近万人的AI队伍。而国内一线大厂的情况,恐怕也是差不多的。 这一迹象,对于广大程序员来说,特别是对即将走向技术一线的准程序员而言,还是值得重点关注的。回顾一下移
很多计算机专业大学生经常和我交流:毕业设计没思路、不会做、论文不会写、太难了......
AI 科技评论按:随着神经网络的研究和应用越来越多,人们也越发地认识到神经网络所需的计算力近乎于无底洞 。如果说高校实验室和一般爱好者在耐心等待之外办法不多的话,大公司们要面对的则是“做还是不做”的问题。 英特尔、英伟达、微软、谷歌这几年为了“做”,都有哪些举动呢?纽约时报的这篇文章可以带我们看看这一变化的梗概。AI 科技评论编译如下,有删改。 最近人们希望电脑能做的事情越来越多。电脑要跟人对话,要能认出人脸,也要能认出路边的小花,再过不久还要给人类开车。所有这些人工智能都需要极高的计算能力,即便当下最
1.Elon Musk因人工智能被提名为“勒德分子” Elon Musk 是高端电动汽车Tesla 和Space X的首席执行官,2015年对于Elon Musk 是非常出彩的一年。近日,Space
在波士顿的Re-Work深度学习峰会上,高通公司的人工智能研究员Chris Lott介绍了他的团队在新的语音识别程序方面的工作。
李杉 编译自 Bloomberg 量子位 报道 | 公众号 QbitAI 苹果在人工智能领域起步并不算晚,2011年就推出了面向消费者的智能助理Siri。可是后来,“掉队”的感觉越来越强烈。 现在,“掉队巨头”的大动作要来了。彭博社援引知情人士的说法称,苹果计划将人工智能引入芯片。 知情人士透露,苹果正在开发一款专门用于执行人工智能相关任务的处理器。这款芯片在苹果内部的名称是“苹果神经引擎”(Apple Neural Engine),它将提升该公司的设备处理人工智能任务的能力——例如面部识别和语音识别等
智能核心是对认知能力的升级革命,从感知、认知到决策执行,目前基础理论层、技术层的发展已经达到认知层面的建模与分析,应用层则体现为利用智能技术解决各种多模态目标识别的速度和精度,本文整理了目前市场上智能识别领域的典型应用进展及部分厂商。
高通公司人工智能研究人员表示,该公司正在研制用于智能终端的语音识别系统,通过综合采用循环神经网络和卷积神经网络,该系统语音识别准确率可达95%。
语音识别技术,也被称为自动语音识别Automatic Speech Recognition (ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
【新智元导读】新智元100创业调研第一期走进云知声,与CEO黄伟面对面访谈,探究三大问题:如何在谷歌等开源趋势下,开发差异化产品;如何押注物联网AI,突破车载、家居、医疗领域应用;AI创业公司如何避免泡沫,应对资本寒冬。AI创业典型公司,一手数据首度曝光。 “新智元100”是新智元旗下专注AI创业与投融资研究的子品牌。“新智元100”正在寻找中国最具竞争力AI初创企业。欢迎企业报名参与调研评选。 新智元100创业调研第一期,走进云知声。 提到云知声,业内人士通常会同时想起国内的科大讯飞、思必驰和捷通华声
【AI创新者】是CSDN人工智能频道精心打造的专栏,本期主人公是云知声创始人、CTO梁家恩。 作者:王艺 CSDN AI 编辑 / 记者 投稿、采访、寻求合作请邮件至 wangyi@csdn.ne
2200多年前,老子在《道德经》中写下:“祸兮福之所倚,福兮祸之所伏。”随着中兴事件敲响了自主创新的警钟,如今的中国芯片和AI产业站到了发展机遇的十字路口。2011年,AI初创企业只有70家。到2016年,中国AI企业709家,全球每10.9个小时就诞生一家AI企业。
今年8月,AI语音独角兽公司思必驰完成了数亿元Pre-IPO轮融资,参与本轮投资的包括美的资本、中信证券投资、元禾控股等知名投资机构。思必驰表示,融资后将加大对AI芯片、软硬件一体化的语音交互整体解决方案的研发投入,并全面开启上市计划。
接上一篇文章,这次是集合了语音识别+语音合成(就是语音播报实现一种反馈)+SG90舵机实现垃圾桶的开与闭,给出上篇文章链接,如果对LD3320语音识别还有问题的朋友可以看看:LD3320语音识别模块与Arduino软串口通讯实现开关灯功能 发现还是有好多人都在做这个,当玩具也好,毕设也好,这个都是一个好玩又有趣的项目。因为这只是现在的一门小课设,就拿来当玩具玩玩,后期看情况会加入WIFI(或者蓝牙?)实现无线通讯,顺便学习一下物联网,用Android Studio开发一个APP就可以实现手机控制。还是一样,这篇文章仅作为参考。如有做得不足或者不对的地方,欢迎一起交流学习。
清华大学 Thinker 团队在VLSI会议上发表了两款极低功耗 AI 芯片(Thinker-II 和 Thinker-S)的相关论。Thinker-S 芯片还受邀在大会的 DEMO Session 进行了现场演示。
云端语音服务最主要的问题就是隐私和安全的问题,其次是识别率(Accuracy),功耗和处理时间(prcessing time)等问题。其中隐私,又涉及到深层次的技术和伦理问题(mix of technical ability and ethics)。
在人工智能产业中,应用层是一个极大的部分,是人工智能技术最终的目的地。除了机器人、无人机和无人驾驶等硬件产品之外,人工智能的软件应用在单独商业化的同时,也在为这些硬件产品提供服务,像智能家居的语音控制
文 / 陈孝良 11月16号,百度发布了渡鸦智能音箱和DuerOS开发板SoundPi,至此,国内再一名巨头加入智能音箱大战。迄今为止,国内战场上的巨头有阿里、京东、腾讯、百度、小米、科大讯飞等,国外则有苹果、微软、亚马逊、谷歌、脸书、三星等,这些巨头占据了全球市值的排名榜,同时发力争夺未来人工智能时代的语音入口,甚至亚马逊和阿里率先不惜代价开启了补贴大战。这些全球巨头的激烈竞争,将对未来十年产生极其重要的影响,同时,这更是新一波的职业快速发展机会。 语音智能当前的核心关键是声学问题和语义理解,随着市
近日,著名的语音识别与图像处理解决方案提供商Nuance Communications(以下称Nuance)宣布,已经以2.15亿美元完成了对客户服务与互动解决方案提供商TouchCommerce的收
百度在公司年度人工智能开发者大会上宣布已开始量产中国第一辆L4全自动巴士Apolong。Apolong是与中国客车制造商金龙合作开发的,由百度Apollo自动驾驶开放平台提供动力,将在北京,深圳,雄安,武汉和福建平潭等城市投入商业运营,并将目光瞄准海外市场。在会议上,百度还宣布了最新升级到Apollo 3.0以更好地支持区域内的自动驾驶。
【新智元导读】人工智能系统的加速正在从根本上重塑着每年创造了3350亿美元的半导体行业。计算机开始认识一切,从花草到人脸,从文本到声音,以及学会开车。统治了计算机行业近半个世纪的摩尔定律正在受到挑战,计算性能的提升不再依赖于晶体管数量的增长,还有专用负载芯片产业的蓬勃。英特尔面临着英伟达、微软、苹果、谷歌等巨头以及CEVA、Eyeriss、寒武纪、华为等 AI 芯片新玩家不同方向的围攻。 人工智能技术尤其是深度学习的兴起,让各大公司都注意到必须要填补的计算力鸿沟。越来越多的研究人员开始重新思考计算的本质,从
捷通华声通过为企业推出更为贴心的全套灵云语音交互解决方案,以及为开发者提供的灵云麦克风阵列SDK、灵云麦克风阵列开发板、灵云种子SDK、灵云语音识别SDK、语音合成SDK、语义理解SDK 等等众多相关
【新智元导读】微软亚洲研究院常务副院长芮勇在《新智元:机器+人类=超智能时代》书中畅想人工智能发展6大阶段,详细介绍微软语音识别、图像识别、牛津计划等多项人工智能项目。芮勇指出,越来越多的科技公司都在开放或开源核心的人工智能技术。微软已经开放了很多人工智能技术,包括我在上文中提到的牛津计划,还包括Azure Machine Learning,以及不久前亚洲研究院开源的分布式机器学习工具包DMTK。我们不仅仅是开源某一个具体的算法,我们其实开源了一整套的分布式训练框架,使得任何别的机器学习的算法能在一个更大规
领取专属 10元无门槛券
手把手带您无忧上云