李根 发自 Vegas 量子位 报道 | 公众号 QbitAI 万万没想到,一条数据线火了。 在2018 CES现场,这根线成为关注的热点之一,它被华尔街日报评价“Best of CES 2018”,还拿到了智能家居、智能车载、智能应用软件以及科技促进生活等4项2018 CES创新大奖。 不说你也猜到了。AI时代下,这肯定不会是一条普普通通的手机数据线。 那它有何不同之处?可以先看看这段网上流传挺广的视频。 KikaGO 这个数据线,真名叫做KikaGO。 除了给手机充电,KikaGO还能以语音交互的方
随着人工智能技术越来越多的应用到我们的工作和日常生活中,人们对与计算机交互提出了更高的要求。人们显然已不满足于只是简单的人机对话,而是畅想可以达到人与人交流那样的酣畅淋漓,就像科幻片像人们所展现的那样。
微软小冰第六代发布会上正式宣布上线全新的共感模型,同时也开始公测一种融合了文本、全双工语音与实时视觉的新感官。这项新技术可以实时预测人类即将说出的内容,实时生成回应,并控制对话节奏,从而使长程语音交互成为可能。而采用该技术的智能硬件设备不需要用户在每轮交互时都说出唤醒词,仅需一次唤醒,就可以轻松实现连续对话,使人与机器的对话更像人与人的自然交流。
今天微软宣布成立人工智能通用实验室,研发AI系统以挑战谷歌Deepmind,再联系到微软、苹果、Amazon等互联网巨头的动作,我们看到顶尖互联网公司都在布局人工智能。在中国,BAT在人工智能上动作频频,不过我们可能忽视了一个重要玩家,那就是搜狗,其进军人工智能的路线独辟蹊径。近日,被誉为“科技界达沃斯”的WebSummit亚洲姊妹站RISE峰会第二届在香港召开,搜狗CEO王小川发表演讲,探讨AI是走向通用型还是功能型?他的思路是后者,同时,王小川还在演讲中透露搜狗即将推出AI导航产品“搜狗智能副驾”,这也
大数据文摘出品 企业营销模式正在经历一场巨变。数字化营销早已替代传统的营销方式,成为企业营销的主流方式和发展战略中不可或缺的部分。然而随着数字化营销的普及,市场迈入存量竞争时代,获客成本也逐年攀升。面对营销过程中不断增加的资金投入和巨大的资源推广,企业开始在获客过程中强调拓客效率和成本控制,以实现更高的投资回报率。如何靶向瞄准潜在客户,找到最佳营销策略来吸引消费者,提高目标客户的转化率,成为数字化营销面临的一大难题。 智能外呼作为高效触达客户的手段,也在积极适应企业在现阶段的营销诉求,不断调整产品方案形态。
如今,AI已是大家最喜闻乐见的话题。无论是巨头还是创业者,都纷纷推出了相关产品,比如三星在11月21日发布了Bixby中文版,又比如灵伴即时在11月22日发布的睿思2.0版本,为广大企业用户带来了更进一步的智能客服。主流观点认为,在历经几十年的发展之后,AI已经逼近技术临界点。不过,当AI风口渐起之时,市场却充斥着狂炒概念的聒噪之声,那么这时什么领域又或者什么产品才是AI真正的突破口呢?
2023 年下半年,产品与应用成为 GPT 讨论的话题中心。相比模型的参数与能力,AIGC 的落地更能考验各个厂商的“秀肌肉”。
6 月 23 日,讯飞开放平台乐享 A.I. 技术沙龙“A.I. 虚拟人多模态创新交互”专场在成都圆满落幕。 35 秒带你回顾现场精彩瞬间↓↓↓ 近几年,随着图像处理、语音合成、语音识别、语义理解、多语种等多项人工智能技术不断发展,AI 虚拟人开始在各行各业落地应用,各大公司争相布局。这背后,其实是 AI 虚拟人多模态交互技术正在成为大趋势。 多模态融合视觉、听觉、文本等多种模态信息,能够打破单模态输入输出限制,从而更贴近人类真实使用习惯。对于 AI 交互产品来说,只有综合利用多模态信息才能更准确地理解人类
前言:本文作者@焦糖玛奇朵,是我们“AI产品经理大本营”早期成员,下面是她分享的第1篇文章,欢迎更多有兴趣“主动输出”的朋友们一起加入、共同进步:) 音频由公众号“闪电配音”提供 媒体和AI巨头们乐于给大众描绘一幅幅精彩的未来生活蓝图:人工智能可以化身为你的爱车,在沙漠、森林或小巷中风驰电掣;可以是智慧公正的交警,控制红绿灯、缓解交通的拥挤;还可以是给人以贴心照顾的小助理,熟悉你生活中的每一处小怪癖。 在看到这些美妙的畅想之后,作为一个严谨认真的AI产品经理,我不禁想去探索上述美好未来的实现路径;今天,
大家好,我是shadow,今天是1024,属于开发者的节日,日子很特别,今天的推送由我来完成~
李根 发自 乌镇米仓 量子位 报道 | 公众号 QbitAI 北京时间12月4日下午13点,纽约时间12月4日午夜0点。搜狗上市缄默期正式结束,王小川可以“说话”了。 6个小时后,在世界互联网大会召
“全球95%的信息是用英文所写的,100%的国际商贸活动是用英文的,因此如何帮助中国人跟外国人进行更好的交流,这变成了一个重大的技术课题。”
这的确是大势所趋,但比起匆忙加入浪潮,先看看手里有着怎样的牌,才能在这战场上打得更漂亮。
回看2017,科大讯飞取得了哪些举世瞩目的突破成就?又在AI赋能营销领域实现了怎样的不朽成果?全方位展示+深度解读关于智能营销,那些你不知道的事…… 2017年人工智能领域一大关键词——“语音” 20
让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音已成为未来最被看好的人机交互方式,语音比其他的交互方式有更多的优势。 目前,语音服务存在于各种场景中,包括实时会议记录、视频实时直播字幕、呼叫中心语音质检、实时会议记录等。想要实现不同的语音服务,这涉及到方方面面的技术,例如,在进行实时会议记录任务时,需要将会议中的音频实时转写为文字,辅助会议记录工作,同时适用于电视会议等远距离场景,这涉及到自动语音识别(ASR)技术。 除此以外,我们在日常生活中,也经常遇到需要将文本转化成语音的技术(TTS) ,该技术可以通过自然逼真的智能语音,让机器拥有「说话」的能力。 那么,有没有一种技术,可以同时完成自动语音识别、语音合成技术的任务? 今年,英伟达发布了 NVIDIA Riva,这是一种现成的语音服务,可以轻松部署在任何云或数据中心。NVIDIA Riva的设计旨在帮助用户轻松、快速地访问会话 AI 功能,实现开箱即用,通过一些简单的命令和 API 操作就可以快速构建高级别的语音识别服务。该服务可以处理数百至数千音频流作为输入,并以最小延迟返回文本;还能快速构建高级别的对话式 AI 服务。 NVIDIA Riva是一个使用了 GPU 加速,快速部署高性能会话式 AI 服务的 SDK,可用于快速开发语音 AI 的应用程序。Riva SDK 在 NVIDIA GPU 上运行,在高吞吐量水平下提供最快的推断响应。 目前,NVIDIA Riva整合了 ASR 和 TTS 等智能算法引擎,用户可以使用这些功能进行科学研究。
本文介绍了Google Home和Jibo两款智能音箱产品,它们分别代表了Google和物灵科技在智能音箱领域的最新成果。Google Home基于Google Assistant智能语音助理,旨在为用户提供更便捷的生活体验。Jibo则是一款面向家庭用户的社交机器人,能够识别和回应用户的情感需求。两款产品在功能属性和情感属性上实现了统一和平衡,代表了人工智能在智能音箱领域的最新发展方向。同时,物灵科技联合科技自媒体“极客吐司”在「Ling Talk」活动中,探讨了智能音箱的市场前景和未来发展,强调了AI技术商业落地的重要性。
就目前的 AI 来看,判断某项工作是不是会被机器替代,有俩前提,大前提:可以获得足够的有效数据(能自动生成数据则无敌),也就是说机器有快速进化的基础;小前提:人本身的进化过程没有见过大量的数据,也就是说人的起点并不高。考虑到“自动生成数据”这个关键,我冥思苦想以后发现,还真没准是编程。
全球AI已经势不可挡,中国人工智能的脚步也未曾停歇。在今年6月的夏季达沃斯上,人工智能就已经成为会上被反复讨论的一个世界级热门话题。有专家预测,2030年中国或成人工智能最大受益者。2016年是AI60年,中国人工智能学会联合近30家学会共同发起了AI60年系列活动,当年AlphaGo击败李世石,AI正式崛起;2017年则更成为了AI的爆发年。 在这一年间,众多AI技术涌现,给人们带来了认知上的冲击。人们对于人工智能的认识,不再局限于高深莫测的描述,而是被更为具象化的实物和可体验的应用所取代,各类人工智能交
★导语★ 英国演员Alexa Lee通过动捕设备实时驱动数字人Siren,这标志着实时高保真数字人技术迈向了一个新的高度。技术的进步为Siren赋予了逼真的3D形象,我们能否进而为她赋予精致的“灵魂”呢?腾讯互娱NEXT技术中心和AI Lab的研究团队携手进行了一次尝试,让Siren在没有真人驱动的情况下,自主和人类交互。虽然,该技术尚处于试验阶段,我们已经可以看到“高保真可交互虚拟人”这一领域的美好前景。值得一提的是,本次Siren AI参加SIGGRAPH Asia2018,是其首次亮相国际舞
“AI+IoT”将是未来的风口,各种应用和商机将成井喷式增长,国内外各大互联网巨头早已提前布局AI+IoT的战略,这同时也是恩智浦的核心战略之一。AI+IoT技术的应用,大到汽车和电视,小到灯泡、闹钟,都可以使用AI的控制技术。
译自 Edge AI: How to Make the Magic Happen with Kubernetes 。
前两天,HTC 发布年度旗舰手机U11,可谓亮点满满,算得上是HTC手机业务的救火队员:不只是有双曲面玻璃机身带来的高颜值,还有骁龙835处理器、DxOMark突破90分的拍照能力,在软件层面则引入了
但我们至少能看到,无论巨头还是初创者,都在涌入这个领域;5G、AI、AR、分布计算,你能想到的那些技术,也正在这个领域积蓄着能量。
---- 新智元报道 编辑:张乾 【新智元导读】昨天下午,微软全球技术院士黄学东博士、微软大中华区副总裁兼市场营销及运营总经理康容、ROOBO CTO雷宇接受了包括新智元在内的媒体专访,详细解答了微软的语音技术、产品落地以及生态合作。 在昨天的微软人工智能大会上,微软全球技术院士黄学东展示了微软多项语音、翻译等技术,微软Build大会上的“黑科技”全球首创AI会议系统再次被演示。 昨天下午,黄学东博士、微软大中华区副总裁兼市场营销及运营总经理康容、ROOBO CTO雷宇接受了包括新智元在内的媒体专访
点击上方“LiveVideoStack”关注我们 编者按:树枝上鸟儿的啁啾声,潺潺流水声,人们踏青时的欢歌笑语声,与春暖花开的画面融合在一起,呈现出一幅春色正浓的动态美景。可是当一切声音被消除,整个世界陷入沉寂,这幅美丽的春景图仿佛也在瞬间失去了色彩。声音在我们的日常生活中占据着至关重要的地位,与声音相对应的音频也是如此:音频可以独立于视频存在,而且音频的感知受到长短时记忆的影响更明显。这也是为什么音频可以调动人的情绪变化和好恶感知。 近日,LiveVideoStack采访到了声网的音频算法负责人冯建元,请
数千万年前,猿猴为了生存,学会使用石器,跳下大树直立行走,从而为人;人类为了更好地交流,发展出语言;为了记住过去,又发明了文字,从此人类有了有记载的历史。
提到智能管理,可能大家首先想到的就是智能质检,这类应用与客服机器人有着本质的区别。前者是 AI 帮助人做数据挖掘、人机协同,后者是机器完全替代人来完成封闭场景的对话交互。
ChatGPT在当下已经风靡一时,作为自然语言处理模型的佼佼者,ChatGPT的优势在于其能够生成流畅、连贯的对话,同时还能够理解上下文并根据上下文进行回答。针对不同的应用场景可以进行快速定制,例如,在客服、教育、娱乐等领域中,ChatGPT可以作为智能助手为用户提供便捷的服务和娱乐体验。
机器之心原创 作者:李泽南 为用户带来具有价值的技术,才会有真正持久的影响力。7 月 5 日,百度 AI 开发者大会(Baidu Create 2017)在北京国家会议中心举行,其中以「开放创新 共襄 AI 未来」为主题的 AI 技术与开放平台分论坛,吸引了众多开发者们的关注。 在昨天下午举行的论坛中,百度副总裁、百度 AI 技术与平台体系(AIG)总负责人王海峰在开场致辞中表示,百度在人工智能领域深耕多年,从十七年前百度诞生之日起就开始积累,几乎所有主要人工智能技术都已在百度搜索引擎中得到应用,来自搜索引
8月1日,百度发布了2018年二季度财报。财报显示,百度二季度营收260亿元人民币,同比增长32%,净利润64亿人民币,同比增长45%,移动端收入占比77%,高于去年同期的72%。当然,作为公司核心战略,AI依然是百度财报最高频出现的元素。不论是成为收入增长新驱动的信息流业务,还是给百度编织未来的DuerOS和Apollo,均与AI直接相关。
语音播报(Text to Speech,下文简称TTS),基于华为智慧引擎(HUAWEI HiAI Engine)中的语音播报引擎,向开发者提供人工智能应用层API。该技术提供将文本转换为语音并进行播报的能力。
而就在昨天,微软(亚洲)互联网工程院在北京召开微软小冰年度发布会,重磅推出了第七代微软小冰——这是史上最大跨度的一次升级。
经过数次迭代,目前微软小冰已从一个领先的人工智能对话机器人,发展成为以情感计算为核心的完整人工智能框架。
当发现更多AI科技作用于日常生活时,你是否想过竟然有一天会与AI数字人做同事?日前,火山语音团队重磅推出了一位神秘新成员——首个超写实数字员工小灿!这位新同事不仅形象清新美丽,还有着很强的亲和力,大幅提升了工作幸福感,真可谓让大家率先体验到了拥有一位超写实数字人同事的快乐。
曾几何时,人们与手机、汽车交互的方式从选择指令变成了自然对话,这种方式让人们享受了方便,因为技术不断发展,AI 助手能为我们做的事情也越来越多。
AI,能读懂你的情绪吗? 分享一则有趣的见闻, 在较早之前,一家名为Teatreneu的巴塞罗那喜剧俱乐部因为加税政策流失了30%的夜场观众,为了减少经营损失,俱乐部在广告服务商的建议下试行按笑声次数向观众收费。 即在剧院的座椅安装一个带有面部表情识别软件的设备,用来捕捉观众在观看演出的过程中笑了多少次。 首先,观众入场免费,但每笑一次就要收费0.3欧元,不过笑点低的朋友不用担心遭遇笑破产的情况了,因为封顶价格为24欧元(即发笑80次)。 根据剧院的统计,实行“按笑付费”措施以来,观众量增加了35%
最新公布的第一季度财报显示,搜狗输入法移动版的日均用户为4.43亿人次,年同比增长23%,目前每天处理6亿条语音请求,搜狗称已是中国最大的语音应用。
Sensory是嵌入式语音软件,或者说是边缘侧语音技术的行业和技术领导者,作为专注于边缘侧语音人工智能的厂商,Sensory可以用很多种技术方式和解决方案满足用户对隐私的关切。
前脚刚拿到智能语音行业最大融资的云知声,后脚就发布了一款完全自主设计的AI芯片。 今天下午,国产芯又添一员大将! 刚拿到智能语音行业最大融资的云知声,在北京正式发布全球首款面向物联网领域的AI芯片“雨燕”(Swift)。作为云知声UniOne系列的第一代物联网AI芯片,“雨燕”完全由云知声自主设计研发。 芯片完全自研 采用CPU+uDSP+DeepNet架构将算力提升50倍 “雨燕”由云知声自主研发,采用云知声自主AI指令集,拥有具备自主知识产权的DeepNet、uDSP(数字信号处理器),支持DNN/LS
首批合作伙伴也来头不小:奔驰、奥迪和沃尔沃。今年6月开始,奔驰、沃尔沃相关的车中,就会集成阿里AI推出“家车-空间融合”的解决方案。
从2021年7月至今,我国数智人赛道融资事件总金额已超过8亿人民币。甚至有机构预测,仅围绕数智人赛道,我国将在2030年形成一个高达2700亿的蓝海市场。
Sensory近期不断推出新技术,新平台和新应用。除了于去年底推出的VoiceHub(Voicehub.sensory.com)离线语音模型在线生成平台之外,Sensory的离线语音技术,创新的离线语音助理自然语音交互技术组合 -TrulyNature,也在主流的家电产品中获得了广泛的采用。如于2021年二季度在美国上市的语音控制微波炉 - Farberware FM11VABK。
雷刚 发自 杭州网易 量子位 报道 | 公众号 QbitAI 你怎么看网易? 快公司?慢公司?或者总能令人耳目一新的神奇公司。 1997年创立,至今已有21年,是中国最早的科技互联网代表。靠邮箱起步,其后又在门户厮杀中争得一方格局,再以游戏安身立命,近些年还能在教育、音乐和垂直电商中竖起鲜明大旗。 而且颇为神奇的是,在唯快不破的中国互联网竞争里,网易近几年的新业务往往不是最快的那一个,但却总能是以慢打快的那一个。 结果也有目共睹:业务版图从邮箱、游戏、新闻扩展至电商、娱乐等领域,在每个领域都做得风生水起
【新智元导读】2016年12月18日,新智元百人峰会闭门论坛在微软亚洲研究院举行。云知声CEO黄伟在会上带来了《构建AI生态,技术和商业应该是一个良性循环 》的分享。黄伟认为:人工智能领域里面虽然BAT很重视AI,而且有了很强的人才团队,但是跟行业结合恰恰是BAT很难做到的,因为他们在上面。AI和IoT是新的一波机会。 以下是黄伟演讲实录。 大家下午好!今天前面杨总(新智元杨静)说了雾霾天出来做这样的交流其实都是真爱,前面二位老总介绍的一些微软包括海尔做的事情,我非常高兴的一点是,我们选择的方向都是对的,都
让我们把时间拉回到56年前,MIT 的 AI Lab做出聊天机器人,说不定不是第一个,但也是非常早期的一个聊天机器人——Eliza。
机器之心报道 编辑:蛋酱 2023 年的 AI 领域,难以回避「大模型」这个关键词。 半年前 ChatGPT 的发布,在海内外引发了一场大模型之战。多家公司加紧研发,纷纷推出类 ChatGPT 产品,或是宣传要打造「中国的 OpenAI」。 有这样一家公司,却以低调的方式走在了研发和落地的前列。 今年三月初,国产 AI 模型「元乘象 ChatImg」推出「图片对话」功能,不仅支持文字聊天,还能看懂图片上的内容并根据图片内容回答问题。这一多模态对话能力的开放,甚至早于 OpenAI。 一周之后,震撼全球的 G
作者 | 阿司匹林 语音助手大战已经进入到白热化的阶段了,除了苹果、亚马逊、Google、微软等国际玩家,国内的百度、阿里、腾讯、天猫也已经纷纷在这个赛道上加快布局,好不热闹。 不论你承认与否,现阶段的语音助手都还处在探索阶段。苹果的 Siri 作为元老,已经很多年没有带给我们惊喜了,而亚马逊虽然 Alexa 风头正盛,但是他们其实也在焦虑,没人敢断定,现在的 Alexa 就一定是语音助手的终极形态。 与此同时,微软却通过小冰向大家展示了另外一种可能性——基于 Session-oriented 基础框架
并且,小冰框架中的数百个不同人工智能原型主体,已全部完成这项超级自然语音技术的升级。
OpenAI 发布 GPT-4o,ChatGPT 基于GPT-4o 实现了语音交互,并在文本与视觉能力上有显著提升。
在近日于上海举办的2016年亚洲消费电子展(CES Asia 2016)上,无人驾驶、智能汽车等相关技术成为最大热点。在CES Asia上,搜狗地图发布了“搜狗智能导航”,最大亮点是可实现车内的全语音交互,而交互并不局限于地图导航本身,几乎可实现驾驶之外的常规车内交互,包括打电话、发短信、查天气、歌曲播放等等。这款产品可运行在智能手机上,还可通过车机互联协议使之运行于汽车屏幕,如果汽车厂商与搜狗进行前装合作则可独立运行于汽车的OS上。基于庞大的POI数据和人工智能技术,搜狗地图在国内首次实现了车内的全语音智
领取专属 10元无门槛券
手把手带您无忧上云