首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

AutoML构建加速器优化模型首尝试,谷歌发布EfficientNet-EdgeTPU

今日,谷歌宣布推出一种衍生自 EfficientNet 的图像分类模型 EfficientNet-EdgeTPU,通过定制化在谷歌 Edge TPU 实现最佳运行。...谷歌 Edge TPU 是一个通过 Coral Dev Boardand 和 USB 加速器提供给开发人员的低能耗硬件加速器。...为了创建旨在利用 Edge TPU 加速器架构的 EfficientNet,谷歌调用了 Auto MNAS 框架,并利用在 Edge TPU 上高效执行的构建块(building block)扩增了原始...有趣的是,NAS 生成的模型在网络的初始部分中非常大量地使用常规卷积,在加速器上执行时,深度可分离卷积往往不如常规卷积有效。...这项研究代表了首次使用 AutoML 构建加速器优化模型的尝试。基于 AutoML 的模型定制不仅可以扩展到各种硬件加速器,还可以扩展到依赖神经网络的多种不同应用。

67920

谷歌发布EfficientNet-EdgeTPU,首次基于AutoML构建加速器优化模型

---- 新智元报道 来源:Google AI 编辑:大明 【新智元导读】谷歌发布EfficientNet-EdgeTPU,这是一个源于EfficientNet的定制化图像分类模型,能够通过...Auto ML在谷歌Edge TPU上实现自定义运行,运行速度比ResNet-50快10倍,延时由53ms缩短至5ms。...昨日,谷歌宣布推出EfficientNet-EdgeTPU,这是一个源自EfficientNets的图像分类模型系列,但是可以自定义在Google的 Edge TPU上运行,这是一种节能的硬件加速器,可供开发人员通过...Coral Dev Board和USB加速器运行。...这项研究使用AutoML构建加速器优化模型的第一个实验。基于AutoML的模型定制不仅可以扩展到各种硬件加速器,还可以扩展到依赖神经网络的几种不同应用。

1K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    谷歌全面开源 MLIR 及生态联盟,全球 95% 的加速器硬件都在使用

    谷歌希望通过向社会提供该架构来激励更多的创新,从而进一步加速 AI 领域发展。我们将 MLIR 的详细内容及谷歌相关报道整理编译如下。 ?...图 2 谷歌 MLIR(相关 ppt 见文末) MLIR 深受 LLVM 的影响,并不折不扣地重用其许多优秀理念,比如拥有灵活的类型系统,可在同一编译单元中表示、分析和转换结合多层抽象的图等。...MLIR 没有众所周知的固定或内置的操作列表(无「内联函数」),方言可完全定义自定义类型,即 MLIR 如何对 LLVM IR 类型系统(拥有一流汇总)、域抽象(对量化类型等经机器学习 (ML) 优化的加速器有着重要意义...Habana,IBM,Intel,Mediatek,NVIDIA,Qualcomm Technologies,Inc,SambaNova Systems,Samsung,Xilinx 的小米——占全球数据中心加速器硬件的...在谷歌,MLIR 正在整合并用于我们所有的服务器和移动硬件工作。 机器学习已经走过了漫长的道路,但之后的路仍然很长。

    1.6K20

    创业加速器在美国

    实际上,本文分析的美国近700家机构被归类为“加速器”或“加速器/孵化器”,要么是由加速器本身对自己进行认定,要么是通过各种数据库的分类认定。...创业加速器在美国 一流的加速器能带来很多明显的好处,那就值得整理一下美国一流加速器的发展情况。...然而,现在这两家加速器仍然是两家最顶级的加速器项目—至少是属于一流加速器。 美国加速器的发展,就像是创业企业,早期投资和风险资本一样自2008年之后开始加速。...加速器领域的先驱TechStars就诞生在科罗拉多,科罗拉多的加速器分布比较广泛,像杜兰戈和Telluride,还有博尔德,而且博尔德有一家加速器叫CanopyBoulder,是该州大麻产业的专业加速器...创业加速器最佳运作指南 加速器对当地创业生态系统和当地经济发展有很大的推动作用,所以有必要深入了解加速器的运作模式:什么样的加速器才最有效?

    5.4K50

    光子硬件加速器

    最近APL photonics刊登了一篇关于光子加速器的review文章"Novel frontier of photonics for data processing—Photonic accelerator...光子硬件加速器(photonic accelerator,简称PAXEL)是用光子处理一些特殊的计算任务,辅助已有的数字计算机。其典型的框架图如下图所示, ?...(图片来自文献1) 与电子硬件加速器相比,光子加速器方案中信号加载在光信号上,因而会需要额外的光电转换步骤。PAXEL的主要优势是计算速度快、功耗小。...文献1中列出了光子硬件加速器的几个应用情景, 1)人工神经网络(articifical neural network) 深度学习的计算涉及大量的矩阵计算, ?...(图片来自文献1) 以上是文献1中提及到的光子加速器的几个应用场景,相比较而言,在深度学习方面的应用,受到了更多的关注,并且也在往商业化的道路推广。

    2.4K30

    谷歌开源GPipe库

    为此,谷歌提出并开源了一种新的方法——GPipe,利用管道并行化扩展 DNN 训练以克服这种局限。它可以让研究者轻松部署更多的加速器,以训练更大的模型,并在不调整超参数的前提下实现性能扩展。...然而,在这段时间里,GPU的内存只提高了3倍左右,当前最优的图像模型却已经达到了谷歌云 TPUv2的可用内存。因此,我们急需一个能够实现大规模深度学习并克服当前加速器内存局限的可扩展高效架构。 ?...谷歌在云 TPUv2上进行试验,每个芯片上有8个加速器内核和64GB的内存(每个加速器8GB内存)。没有TPUv2的情况下,由于内存限制,单个加速器最多训练8200万模型参数。...因为训练至少需要两个加速器来适应模型大小,谷歌衡量了在两个分区但没有管道并行化的naive情况下的加速,发现训练过程中几乎是线性加速。...虽然本文所有的实验都使用了云TPUv2,但谷歌发现当前可用的云TPUv3会有更好的性能,每个芯片有16个加速器内核和256GB内存(每个加速器16GB)。

    66120

    谷歌开源GPipe库

    为此,谷歌提出并开源了一种新的方法——GPipe,利用管道并行化扩展 DNN 训练以克服这种局限。它可以让研究者轻松部署更多的加速器,以训练更大的模型,并在不调整超参数的前提下实现性能扩展。...谷歌在云 TPUv2上进行试验,每个芯片上有8个加速器内核和64GB的内存(每个加速器8GB内存)。没有TPUv2的情况下,由于内存限制,单个加速器最多训练8200万模型参数。...谷歌还发现,如预期所料,在管道并行化的情况下,最大模型大小与分区数量成正比。有了GPipe,AmoebaNet 能够在云TPUv2的8个加速器上加入18亿参数,是没有GPipe时的25倍。...因为训练至少需要两个加速器来适应模型大小,谷歌衡量了在两个分区但没有管道并行化的naive情况下的加速,发现训练过程中几乎是线性加速。...虽然本文所有的实验都使用了云TPUv2,但谷歌发现当前可用的云TPUv3会有更好的性能,每个芯片有16个加速器内核和256GB内存(每个加速器16GB)。

    71030

    数据猿专访微软加速器·北京CTO王雷:微软加速器如何构建创业生态

    数据猿导读 被称为创投界的“黄埔军校”、比哈佛还难进的微软加速器是如何甄选创业公司的?微软加速器在微软的商业体系中处于何种地位?...作为BizSpark Plus计划的一部分,微软在全球成立了八个加速器,亚洲地区的四个加速器分别位于印度班加罗尔,以色列特拉维夫,以及中国北京和上海,其中微软加速器·上海刚刚与去年5月进驻上海市徐汇漕河泾开发区...被称为创投界的“黄埔军校”、比哈佛还难进的微软加速器是如何甄选创业公司的?微软加速器在微软的商业体系中处于何种地位?...之前还提到,作为一家国际企业,微软在全球成立了八个加速器。进入微软加速器的企业,可以享受到所有加速器的服务。...王雷表示,微软加速器北京会与行业内大企业共同合作,让企业专家帮助加速器筛选出有潜力的企业。

    2K50

    详解AI加速器:为什么说现在是AI加速器的黄金时代?

    选自 Medium 作者:Adi Fuchs 机器之心编译 机器之心编辑部 在上一篇文章中,前苹果工程师、普林斯顿大学博士 Adi Fuchs 解释了 AI 加速器诞生的动机。...处理器发展第三阶段:加速器时代(2010 年代至今) 暗硅本质上是「摩尔定律终结」的大预演——对处理器制造商来说,时代变得具有挑战性。...面向特定应用的加速器。...具体来说,由于加速器在给定的域内运行,加速器程序的代码应该更紧凑,因为它编码的数据更少。 举个例子,假如你要开一家餐厅,但面积、用电预算是有限的。...回到处理器世界:类比上面的例子,CPU 就相当于选项 a,面向特定领域的加速器就是选项 b,店面大小限制就相当于硅预算。你将如何设计你的芯片?

    1.3K20

    Jeff Dean发推:谷歌超硬年终总结「第三弹」来了!大力发展Jax

    与之类似,谷歌最近提出的Pathways系统,在TPU运行时间之上增加了一个额外的虚拟化层——加速器由长期存在的进程管理,而不是直接分配给用户。...(条形图内的数字代表使用的芯片/加速器的数量) 然而,构建新的硬件加速器会产生很高的初始成本,并且需要大量的开发和部署时间。...全栈加速器搜索技术 而全栈搜索技术(FAST)通过引入一个硬件加速器搜索框架,就解决了这个问题。 这个框架同时优化了数据路径、调度和重要的编译器决策。...这表明,单工作负载加速器对于中等规模的数据中心部署是实用的。...PRIME使用记录的加速器数据(包括可行的和不可行的加速器)来训练模型,其设计的加速器的延迟小了1.5倍,同时减少了99%的硬件模拟时间 依赖于硬件的模型设计 虽然神经架构搜索(NAS)在SOTA模型的发现方面展示出了巨大的能力

    55940

    谷歌将基于AI的谷歌镜头引入谷歌图像搜索

    谷歌宣布将其基于AI的Lens技术引入谷歌图像搜索。该公司解释说,这个想法是允许网络搜索者更多地了解照片中的内容,特别是他们可能想要购买和购买的商品。...谷歌镜头现在能够提供帮助。你可以点击照片中显示的“点”,指定谷歌镜头识别的项目,或者可以用手指“画”照片中的对象以触发Google图片搜索相关信息。...但是,当涉及到将用户引导到产品以及潜在的谷歌广告商的网站时,谷歌自然会认为谷歌镜头非常适合。这也是Pinterest一直稳步前进的领域。...出于这些原因,谷歌应该利用自己的技术来帮助改善购物以及其网站上零售商的点击率。...谷歌表示,Lens in Images目前正在移动网络上直播,供美国人用英语搜索,并将很快推广到其他国家,其他语言和谷歌图像位置。

    90030
    领券