首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Facebook发布部署在CPU上的高效、实时文本转语音系统,速度提高160倍

近日,Facebook AI 宣布已经在 CPU 服务器上创建和部署了一款实时神经网络文本转语音系统,音频质量能达到人类水平。...以前的系统通常依赖于 GPU 或其他专用硬件来实时生成高质量的语音,但通过将模型进行广泛地优化,该系统可以将合成速度比基准速度提高 160 倍,且能够在 500 毫秒内在 CPU 上生成一秒钟的音频。...据介绍,该系统已经部署在了 Facebook 的视频通话设备 Portal 上,并可以在 Facebook 多个应用程序上使用,包括支持视障人士阅读和 VR 体验。...在多核上的分布 最后,通过将重运算器分布在同一个 socket 上的多个核心上实现了进一步的加速。...通过在训练过程中迫使非零参数分块均匀地分布在参数矩阵上,并在推理过程中将矩阵乘法在多个 CPU 内核之间进行分割和分配来实现。

95820

业界 | Facebook将反馈融入AI系统,视觉障碍者现在也能“读懂”照片啦

AI科技评论按:Automatic Alt-Text (AAT) 的发布让盲人(或使用屏幕阅读器的用户)更好地读懂新闻推送 (News Feeds) 里的照片的内容。...背景 众所周知,Facebook的新闻推送大多都带有图像和视频,随着配备高画质相机的手机上越来越普及,大家分享的图像和视频会越来越多。...通过视觉媒体让大家观看和讨论所发生的事,是Facebook提供的一项关键功能。事实上,人们每天在Facebook、Instagram、Messenger和WhatsApp上分享的照片超过20亿张。...为此我们的目标是革新这种定制服务,以此构建一个新的Facebook功能。 AAT项目通过寻求更佳的算法,针对照片得出有用和准确的描述,这种方法不会受限于用户的知识面,可以在更大范围进行扩展。...在成功实现这项功能的基础上,我们聘请了第一个全职的无障碍研究员,现在团队上下都对未来的发展充满憧憬。 via Facebook

75790
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    学界 | Facebook、谷歌分别改进何恺明 FPN 工作

    AI 科技评论按:在计算机视觉领域中,多维度目标检测一直被用作输入以生成反映不同维度信息的特征组合,这种办法能够有效表达图片上的各种维度特征,然而却对硬件计算能力及内存大小有较高要求,因此只能在有限的领域内部使用...Facebook 于 2016 年在论文《Feature Pyramid Networks for Object Detection》中提出的 FPN,通过利用常规 CNN 模型内部从底至上各个层对同一...scale 图片不同维度的特征表达结构,提出了一种可有效在单一图片视图下生成对其的多维度特征表达的方法。...近期,Facebook 和谷歌接连发布了基于 FPN 的改进工作,我们将之整理如下。 ?...由于全景分割任务近期开始变得热门,Facebook 考虑把 FPN 模型用于一次性解决全景分割任务,于是在今年 1 月发布了《Panoptic Feature Pyramid Networks》,以下为论文摘要

    97910

    学界 | 发美照时打上「#」,还能帮Facebook提升图片识别率哟

    AI 科技评论按:近日 Facebook 科学家团队发布基于主题标签的深度学习方法,使用已有的拥有主题标签的图片作为训练数据,从而大幅提升了训练数据集的大小。...数据集的增大必然会引起图片错误率的提升,他们同时发布了处理图片噪音的方法。他们团队的这项工作对于现今的图片识别领域有着广泛而深远的影响。AI科技评论对全文翻译如下。...现在我们的研究员和工程师通过训练带有主题标签的数据集的方法解决了这个问题,这个超大数据集包含了 35 亿张图片和 17,000 个主题标签。...这项新的工作基于 Facebook 之前的研究,比如基于评论、主题标签和视频的图像分类调查。...抛开主题标签的使用不谈,这项研究依旧取得了广泛的图片识别相关的进展,这些改进足以影响现有产品和新产品。例如,更加精确的模型可能会改善我们在 Facebook 上呈现历史记录的方式。

    38920

    如何通过AI自动辨别虚假新闻?计算机科学家Filippo Menczer教你识别互联网虚假信息

    网络购物评论信息只是网络信息的一个雏形,我们每天都从互联网上浏览信息、广告、发布会、医院简介等等信息,我们有意无意地将这些信息作为我们消费、判断的标准。...为此计算机科学家Filippo Menczer以及他的团队开发了一个系统,用来追踪鉴定这些Twitter上的僵尸账户。这项技术也被用在Twitter和Facebook上的推荐系统。...图一:捏造的社交媒体帖子吸引了数百万用户分享挑衅性的谎言。Dave Cutler(艺术家)提供的图片。 在2016年的美国总统大选中,虚假新闻海啸式地猛增。...他们都做了各自的努力,例如,在大选一周后,Facebook和谷歌都宣布不再允许公然虚假的新闻网站在他们的平台上通过网络广告赚钱。...Facebook就一直在把培养新闻素养作为其新闻项目的关键部分,通过为记者提供教育和合作创新新闻产品,加强公司与新闻业的联系。

    2.1K120

    向 Deepfake 宣战!

    图片来源:GitHub 当然,Deepfake 也有局限——无法在小样本上工作,也就是说无法凭一两张照片就替换两张脸,模型的训练过程也需要消耗大量资源。...荷兰网络安全初创公司 Deeptrace 曾于 2019 年 10 月发布了一份关于 Deepfake 现状的报告(详见AI科技评论此前报道),并指出网络上现有的 Deepfake 视频中有 96% 涉及色情...月末,Twitter 发布了平台拟将执行的草案,并公开征集用户意见。 正如本文开头提到的,Facebook 近日发布博客,公开了针对 Deepfake 视频的新政策。...实际上,虚假信息制造者往往是利用“讽刺”的标签做幌子,一次次顺利通过 Facebook 的事实核查,病毒式传播着带有明显误导性的消息。...在AI科技评论看来,Facebook 一直以来联合企业、学术界、政府做出的努力,的确表现出了它作为全球最大社交媒体的社会责任感;但不得不说,面对让众多女性、名人深受其害的 Deepfake,Facebook

    70910

    向 Deepfake 宣战!

    图片来源:GitHub 当然,Deepfake 也有局限——无法在小样本上工作,也就是说无法凭一两张照片就替换两张脸,模型的训练过程也需要消耗大量资源。...荷兰网络安全初创公司 Deeptrace 曾于 2019 年 10 月发布了一份关于 Deepfake 现状的报告(详见AI科技评论此前报道),并指出网络上现有的 Deepfake 视频中有 96% 涉及色情...月末,Twitter 发布了平台拟将执行的草案,并公开征集用户意见。 正如本文开头提到的,Facebook 近日发布博客,公开了针对 Deepfake 视频的新政策。...实际上,虚假信息制造者往往是利用“讽刺”的标签做幌子,一次次顺利通过 Facebook 的事实核查,病毒式传播着带有明显误导性的消息。...在AI科技评论看来,Facebook 一直以来联合企业、学术界、政府做出的努力,的确表现出了它作为全球最大社交媒体的社会责任感;但不得不说,面对让众多女性、名人深受其害的 Deepfake,Facebook

    63820

    还原Facebook数据泄漏事件始末,用户信息到底是如何被第三方获取的?

    获取数据(用户信息,评论,照片),发布到用户时间表和页面,并使用你的应用进行测试,最终获取你已测试的操作代码示例。...如果你还没有在 Facebook 上填写有关个人信息,那么该区域在“节点”面板中将呈现灰色,且在用户响应中不会返回有关个人信息的行。 想要查看可用于节点的字段列表吗?...在Facebook上创建数据 将评论添加到你的时间表 访问令牌:你需要给予管理器权限,以便将其发布到你的时间表中。 点击Get Token并选择publish_actions权限。...发布一张照片 想要在 Facebook 上发布一张照片,你需要的是该图片 url 地址,它的大小要小于 4 MB,且是 JPG,PNG,GIF 或 TIFF 格式的文件。...你可以在新闻源以及浏览器中查看它。 发表评论 页面ID:使用上面的 / me / accounts 请求获取你想要评论的页面 id(page_id) 。

    4K50

    动态 | Facebook 开源首个全卷积语音识别工具包 wav2letter++

    AI 科技评论按:近日,Facebook 人工智能研究院 ( FAIR ) 宣布开源首个全卷积语音识别工具包 wav2letter++。...虽说递归卷积神经网络在处理具有远程依赖性的建模任务上很占优势,如语言建模、机器翻译和语音合成等,然而在端到端语音识别任务上,循环架构才是业内的主流。...Github 开源地址: https://github.com/facebookresearch/wav2letter/ 在 Facebook 对外发布论文中,wav2letter++被拿来与其他主流开源语音识别系统进行对比...图片来源:Facebook 上面为系统的网络结构图,主要由 4 个部分组成: 可学习前端(Learnable front end):这部分包含宽度为 2 的卷积(用于模拟预加重流程)和宽度为 25 ms...声学模型:这是一款带有门线性单元(GLU)的卷积神经网络,负责处理可学习前端的输出内容。基于自动分割准则,该模型在字母预测任务上进行训练。

    84610

    DeepText:Facebook的文本解析引擎

    起初Ronan Collobert与Yann LeCun在Facebook AI Research发布了论文,DeepText在此技术上提供了实现并在深度学习上进行了扩展。...很多情况下,作为牺牲标签数据集合的补偿,无监督学习和监督学习的组合能够显著提高性能。 在Facebook上探索DeepText DeepText已经在Facebook一些功能上进行了测试。...DeepText通过对意图、情绪和实体(人物/地点/事件)的提取,结合文本、图片并自动移除垃圾信息的干扰,能够更好的提升Facebook用户体验。许多名人和公众人物使用Facebook与公众交流。...反过来,这些工作能够进一步分改进Facebook其它功能的文本解析系统,从而提高用户体验。 同步理解文本与可视化信息 通常,人们会同步发布图片或视频来描述文字内容。...其中的一些场景,需要结合文字和可视化信息理解人们的意图。例如,一个朋友会发布一个自己宝宝的图片,配上“Day 25”这样的文字。图片与文字清晰地表明,这是一条有关家庭的消息。

    1.4K20

    一个关于Facebook用户个人和好友隐私信息泄露的漏洞

    前言 大家好,在我的上一篇文章中,我分享了Chrome浏览器中存在的一个Facebook用户信息泄露漏洞,此后,在接下来的研究中,我又发现了另外一个关于Facebook的漏洞,利用该漏洞,可允许其它网站提取出...GET请求,像大多数搜索接口一样,这里接口后端没有设置跨站请求伪造(cross-site request forgery,CSRF)保护机制,也就是说,用户可以通过URL来共享搜索结果页面。...通过操纵Facebook的图谱搜索(Facebook’s Graph Search)功能,我们可以构造一些反映Facebook受害者用户的个人隐私信息搜索请求。...比如,针对英文版Facebook的图谱搜索场景,在漏洞利用中,我用“pages I like named Imperva”搜索一些目标Facebook受害者用户赞过的主页用户,通过伪造带有迷惑性质的POC...受害者是否有朋友,在朋友圈发布了包含某个特定词汇的帖子:https://www.facebook.com/search/posts/?

    89040

    Facebook AI 野心与LeCun的小目标:拥有类人智能的对话助理

    在通往打造类似人类的智能的道路上,Facebook将使用机器学习(ML) 来了解用户反馈给公司的基础设施的所有内容。 Facebook想要使用AI来让其平台理解贴文,故事,评论,图像和视频的意义。...这种交互是可能的,这要得益于创建于 Facebook 人工智能研究院(FAIR)建造的记忆网络(Memory Network)。一个记忆网络指的是带有内存的神经网络。...一旦训练好以后,模型和元数据被处理,就可供整个 Facebook 内部的开发人员使用。 Facebook 图像识别工作现在主要用于区分两大类型的图片。一是暴力、仇恨言论和色情图片。...模型是基于应用机器学习小组的经过验证的研究而构建,用于解决通用性的问题。模型通过专门的 ML 技术和技术优化在 Facebook 的基础架构上运行,然后将其抽象,以便产品团队开发人员可以使用这些模型。...去年 12 月,Facebook 通过发布商品硬件来源的 Big Sur AI 计算服务器规范,将开源硬件模型应用于 AI 硬件。

    78260

    这里有一些最棒的项目推荐

    项目 1:自动完成功能 ---- 传统上,自动完成是通过键值查找来实现的,在键值查找中,将用户输入的不完整单词与字典进行比较,并给出潜在单词。 然而,使用机器学习,自动完成可以更进一步。...它建立在谷歌著名的 BERT 的基础上,因此在 RoBERTa 中使用了奇怪的大写字母,并通过实现稍微不同的训练方法改进了 BERT 的性能。...预先训练好的 RoBERTa 通过 PyTorch Hub 加载,它带有一个内置的 fill_mask()方法,允许你传入一个字符串,指向 RoBERTa 应该预测的下一个单词/短语的位置,并接收你的预测...根据 Reply.ai 的数据,平均一家公司可以通过一个 ML 驱动的机器人来处理 40% 的入站支持请求,下面就是哪一个例子: ?...而如今,完整的模型已经发布,并且在 Skynet 上没有相关报道。 和这个模型交互非常简单,给它发一段文本,然后等着它生成就行。

    68831

    脸书 AI 识别翻车,误将黑人标记为「灵长类动物」

    整理 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 最近,Facebook用户在观看一段以黑人为主角的视频时,会看到一个自动生成的提示,询问他们是否愿意“继续观看灵长类动物的视频”。...Groves 还将其发布到一个面向 Facebook 现任和前任员工的产品反馈论坛。...Facebook 拥有世界上最大的用户上传图像存储库之一,用于训练其面部和对象识别算法。...然而两年后,《Wired》杂志发现谷歌的解决方案仅仅是防止将任何图片标记为大猩猩、黑猩猩或猴子。 随后谷歌证实,在2015 年之后,为了解决这一错误,谷歌直接从搜索结果中删除了这一词条的标签。...结 语 有人认为:这是一个复杂的计算机视觉问题。 有人评论:但是人类不会犯这种低级的错误,为什么 AI 会呢? 还有人评论:算法对于这种人脸识别的经验较少,并且不知道如何将它们归类。

    48610

    iCDO一周数据要闻:苹果将下调日本iPhone XR价格;Ins将使用机器学习打击买粉买赞;5G云服务市场规模达4100亿美元

    (图片来自于网络) 据悉,这一专利软件还可通过分析用户发布在Facebook和Instagram的图片,用于更加精确的定向广告投放。...它还允许用户在体育赛事直播时添加评论不过,对于用户在搜索结果中发布的内容,需要服从谷歌的政策。“不遵循谷歌政策的评论可能无法显示出来。”谷歌在帮助文档中写道。...这意味着用户要想在搜索结果上留下评论,必须事先登录谷歌账号,否则无法在搜索结果上留言。此外,用户可以删除他们在搜索结果上的评论。...(图片来自于网络) 36氪讯,微博发布公告表示,微博用户特别是头部账号发布广告信息的,应遵守相关法律规定和社区规则,通过微博提供的商业产品渠道发布广告,广告内容和营销信息必须经过审核和备案,以确保合规性和可识别性...(图片来自于网络) 周跃峰举例称,未来PC的Windows运算会放在云端,通过手机把内容传到显示器上,加一个计算机键盘就可以变成一台电脑了,未来电视机屏幕就是一台完完全全的云计算机。

    1.2K30

    iCDO一周要闻:中国有哪些全球百大AI公司;智能家居收集大量用户数据;99%安卓手机存在漏洞等

    去年从中国获50亿美元广告收入占营收10% 中国公司和其他实体渴望在国际上引起人们的注意,这出人意料地使中国成为Facebook最大的广告收入来源之一。...有数据显示,Meet Social(Facebook中国合作伙伴,是Facebook在中国的七家官方广告经销商之一)的软件每天在Facebook上发布大约2万个中国广告。...Insights日前发布AI 100 2019报告,在这100家最有前景的AI初创公司名单上,有6家为中国公司:商汤、依图、第四范式、旷视、Momenta、地平线,另外,估值来到10亿美元独角兽等级的公司也成长到了...(图片来自网络) 从2017年CB Insights首次发布AI 100报告,这一榜单如今已经来到了第3届,从这3年的结果来看,中国公司在AI领域的崛起已经成为了一个明显的趋势。...在AI 100 2017年名单上,来自中国的公司还仅有4家,这一数字在2018年增加到了7家。2019年则有6家中国公司:商汤、依图、旷视、第四范式、Momenta、地平线。

    50730

    围观|中国Martech生态究竟长什么样?

    前不久,关注Martech的国内知名新媒体弯弓研究院也制作并发布了2019中国营销技术生态图谱2.0版本。该图谱显示,原力大数据在会员管理、千人千面、销售自动化等多个细分领域走在了行业的前列。 ?...在商品流通过程中,“技术”和“营销”分别影响供给和需求两侧,追求供、需的平衡实际上内在要求“技术”与“营销”要发生某种有机的结合,这种结合就产生了Martech营销技术。...而Martech概念在商界和学术界开始广泛流传,很大程度上要归功于2014年Scott Brinker与Laure McLellan在《哈佛商业评论》上发表的文章《首席技术营销官的崛起》。...这八大领域分别是: 数据收集与分析:数字化营销驱动力的管理和测量 营销应用:营销软件的配置、操作和整合 广告网络:数字化广告系统的管理和优化 社交与移动平台:Facebook、微信等社交平台及其使用的工具和应用程序界面...随着5G时代的带来,Martech+销售和服务或催生Salestech分支、Martech+人工智能或使图片文本和语音的分析应用更广泛、Martech+AR/VR等智能设备或显著提升品牌主与消费者的互动效果

    1.3K40

    从深度学习到机器人控制,2017 人工智能新开发工具盘点

    如果本文没有涵盖你心目中最爱的 AI 开发工具,欢迎你在评论区留言讨论。 深度学习 BigDL BigDL 是 Intel 开源的一个基于 Apache Spark 的分布式深度学习库。...Open Images Dataset 包含 900 万张图片 URL,里面的图片都已经被标注,带有标签和边框,横跨成千上万个类。...借助 Faiss,Facebook 在十亿级数据集上创建的最邻近搜索(nearest neighbor search),比此前的最前沿技术快 8.5 倍,并创造出迄今为止学术圈所见最快的、运行于 GPU...Facebook 人工智能实验室(FAIR) 借此创造了数个世界纪录,包括在十亿高维矢量上的构建的、世界最快的 k-nearest-neighbor 图。...Python Fire 已开源,用户可通过 `pip install fire` 在 PyPI 进行下载,也可以去 GitHub 查看它的源代码。

    93360

    Facebook反垃圾实践:人工治理与机器算法齐飞

    垃圾信息在不断变化,Facebook的反垃圾策略和技术系统也在不断升级。 ? Facebook上的网络钓鱼攻击,2011年 Facebook反垃圾策略 制定反垃圾策略首先需要明确的是垃圾信息的定义。...找到可疑帐号的一个方法,是通过异常行为检测,比如一个人发的同样类型评论非常多,所有评论里都包含一个相似链接,这就非常有问题。一般人不会在不同人的主页上发表一样的评论,这就是一种异常行为。...在攻击者控制阶段,系统还没有响应能力,攻击者可以发布大量的垃圾信息,受攻击对象都会受到垃圾信息的影响;在防御者控制阶段,垃圾信息才会受到控制。...该系统将规则和机器算法相结合,判断所有用户的评论、链接、朋友请求等行为是否正常,日均处理信息数量达百亿级。...Facebook采用了新闻流排序算法,通过机器学习(根据点赞、评论、分享等行为)预测用户对内容感兴趣的程度,决定其排序的权重,这在某种意义上说也是反垃圾,然而目前还没有Facebook用排序算法影响虚假新闻的消息

    2K90

    独立开发 一个社交 APP 的架构分享 (已实现)

    新浪微博 帖子模块 发布 文字输入,包含敏感词检索,例如脏话 图片选择,含相册或拍照,可以移出 视频录制,自定义时间长度、断点录制,支持预览 共享位置 浏览: 公共部分 都会显示出用户头像、发帖或评论的时间和评论的数目...按编辑 图文混排类型 图文加视频录制类型 按类型(内容布局各不相同) 圈子,可以发布视频,显示位置 我的作品,图文混排,瀑布流显示 创业,不开启评论与点赞 操作: 帖子评论与评论的回复,包含表情的插入...帖子与评论的点赞与撤销点赞 分享、收藏、举报、信息分享到微信等平台、删除(帖主)等功能 文章模块 浏览: 内容页纯html,网页浏览 发布: 由管理员通过网页后台编辑发布,形成html标签流 兼容...4) 帖子详情页的显示 代码结构 由于帖子的类型有三种,这三种帖子除了内容部分布局不一样,评论布局是一样的,分享、删除等按钮也是一样的,当然,也可以自己通过接口改变评论布局。...SDK实现 以用户账号注册推送 在服务端评论、点赞的接口代码处触发推送API 通过广播的形式获取推送,显示消息提醒 6) 表情模块 匹配 以图片的名字组合其他标记符组合为 key,例如 [ ],资源

    4.9K101
    领券