首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

“猜画小歌” 只是小试牛刀,谷歌AI的强大远远超过你的想象

昨天,谷歌发布了一款叫做“猜画小歌“的微信小程序,转眼就在朋友圈里刷屏了!

“这不是你画我猜吗?”

“当然不是,这个可高级了,有AI的!”

这款游戏的玩法是这样的:由用户和谷歌AI组队,用户来画、AI来猜;如果20秒内画被AI猜中了,你就能进入下一轮,积累连胜次数;游戏过程中还伴随着销魂的谷歌女声。

每画一笔,AI都在猜你画的是啥。实在太灵魂了,它还会用经典谷歌口音说:“我没看懂你在画什么”。

比方说,你能认出这是个芦笋?反正谷歌AI认出来了!

“猜画小歌”工作原理:

神经网络技术

“猜画小歌“对你画作的辨识,利用的是神经网络技术,是基于对大量涂鸦样本的学习。

涂鸦是人们对事物的抽象表达,只不过,这个抽象对AI来说有点困难。谷歌的研究人员正在朝这个方向努力,训练机器像人类一样学习绘画和生成抽象的概念

这里利用到的技术有一个高大上的名字:RNN,也就是递归神经网络。不过你不用管这个名字,你只需要知道,你们费力怼出来的灵魂作品,最后都跑去丰富了人家庞大的人类涂鸦数据集。

光是苹果就已经攒了这么多

那……拿到了这些涂鸦,AI怎么学?

研究人员在人类涂鸦数据集中训练神经网络,让AI来理解人们在绘制涂鸦时是在何时起笔、走笔方向、何时停笔的。当经过训练的RNN模型接收到人类绘制的涂鸦后,会生成一张类似的新涂鸦:

有样学样哈?

不过照着描毕竟还是简单。如果人类提供的涂鸦本身有瑕疵,AI“知道”要纠正吗?

答案是肯定的。

在RNN模型中,当研究者输入参与者创作出的灵魂涂鸦,例如没眼睛猫、没鼻子猫和没胡子猫,AI仍然能够重构(强扭)出“正常”的图像来。甚至到了下图的最后一排,那明显是一把刷子啊,但是模型仍然执着于生成有猫耳朵、猫胡须、猫脚的图像。

还真把刷子当猫……

除了你画我猜,这个研究还能用来做什么?研究人员表示:能用到的地方还是很多的,提出绘画建议啦、扩展艺术家想象力啦、让AI帮学生学绘画啦……

以上就是一身艺术细菌的该模型提出的指导意见。

但“猜画小歌”只是谷歌强大的AI技术的冰山一角。谷歌AI如今已经在医疗和通讯等领域都有了突破性发展,强大得远远超乎你的想象。

医疗领域:

谷歌 AI 已经可以预测你的死亡时间

Google 最新开发的 AI 算法可以预测人们的死亡时间,据其研究人员表示,预测准确率高达 95%。

该项研究着眼于住院患者的一系列临床问题,最近发表在了Nature合作期刊(npj)Digital Medicine上。Google 将 AI 技术应用到大量的数据上,这些数据来自两个医学中心共 21 万 6 千名患者,这些患者每位都在医院停留了至少 24 小时。

研究使用的数据来自患者的电子医疗记录

研究者在杂志文章中解释道:”我们想知道在面对范围宽广的临床问题时,深度学习能否提供有效的预测。所以我们在差距很大的临床领域挑选出预测项目,包括一项最重要的临床结果——死亡,一项标准的医疗质量指标——是否再次入院,一项资源利用率指标——住院时长,以及对于患者病情掌握情况的指标——诊断结果。

这项概念验证研究的结果显示,该算法可以准确预测患者的死亡风险、是否会再度入院、是否会延长住院时间以及患者的出院诊断。并且,在上述各种情况下,这项新的算法的预测都比以前发表的模型更准确

根据该研究,使用加利福尼亚大学旧金山医疗系统的数据所作出的患者死亡预测准确率为 95%,使用芝加哥大学医学系统的数据所作出的死亡预测准确率为 93%。

由于依赖于大量的信息,医疗越来越被认为是应用 AI 技术的合适领域。FDA 官员 Scott Gottlieb 在今年早些时候发表的演讲中就探讨了 AI 技术在医疗行业中应用的前景。

通讯领域:

谷歌AI帮你接电话

在前不久的Google I/O大会上, CEO桑德尔·皮查伊(Sundar Pichai)终于带来拯救社交恐惧症的福音。他在现场演示中,展示了智能助手如何通过电话预约理发店和餐厅,能够流畅和自然交流的AI顿时技惊四座,成为此次大会的焦点。Google称其为Google Duplex结合了自然语言处理、深度学习和文字语音转换的黑科技

在演示中,AI的声音已经可以媲美人类,在电话的一端你绝不会听出这是蹩脚的机器语音。而这也是Google正在开发的领域,此次他们就为语音助手带来6种不同的自然语音,其中还包括歌手John Legend的声音。

图片来源:发布会直播截图

不过,更令人惊艳的是毫无破绽的人机对话。正如皮查伊在现场所说的那样,“智能助手能够真正理解对话中的细微差别”。例如在另一个订餐的演示中,尽管对方的英语有口音且不完整,AI仍然理解并完成了对话

自动语音识别(ASR)技术在Duplex中的应用:声音输入由ASR处理,通过上下文数据和其他输入分析生成文字,然后由TTS系统朗读。

为了让对话更自然,谷歌让AI在对话停顿期间发出“嗯哼”、“呃”之类的语气词。为了响应人们在说出“你好!”时对即时回复的期待,他们还设计了低延迟系统,以快速响应相关场景中的对话。另外,他们在测试中发现,当句子更复杂时,更多的延迟反而会让对话更自然

谷歌AI:

回归中国的“大杀器”

在中国的互联网领域,谷歌做了好几年的“局外人”,谷歌的缺席,也给了国内一众互联网公司崛起和发展的机会,比如百度。但谷歌一直没有忘了自己“重返中国”的目标,错过了PC和移动端时代的谷歌,不想再错过AI。

在如何重返中国这个问题上,谷歌也变得日益实际。搜索等服务不能回归,那就先从服务Android开发者开始;Android服务不能重新连接,那就先从AI这样的未来技术着手。

2017年是谷歌人工智能在中国的落地之年。3月份,谷歌翻译时隔三年之后在中国大陆正常使用;5月份,柯洁和AlphaGo的人机大战终极版几乎吸引了国内所有科技爱好者和科技媒体的眼球……

昨天,“猜画小歌”小程序强势刷屏朋友圈,这大概只是谷歌AI布局中国市场的“小试牛刀”。

谷歌AI还将给我们带来什么黑科技?谷歌在回归中国的战略上还将有怎样出乎意料的大动作,让我们拭目以待。

-END-

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180719A1PGU000?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券