首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

朱俊彦团队提出GAN压缩算法:计算量减少20倍,生成效果不变,GPU、CPU统统能加速

统一未配对和配对学习 有些GAN是通过配对数据集学习的,有些则是非配对数据集。因此要在损失函数中加入第二项,统一非配对和配对学习的损失: ?...初始化的student鉴别器D使用来自teacher鉴别器D’的权重。 中间特征蒸馏 蒸馏是CNN中广泛使用的模型压缩方法。 CNN模型压缩的一种广泛使用的方法是知识蒸馏。...对于每个卷积层,可以从8的倍数中选择通道数,可以平衡MAC和硬件并行性。 解耦训练和结构搜索 为了解决该问题,作者遵循one-shot神经体系结构搜索方法的最新工作,将模型训练与体系结构搜索分离 。...通过这种方式,我们可以将训练和搜索生成器体系结构分离开来:只需要训练一次,在无需进一步训练的情况下评估所有可能的通道配置,并选择最佳的作为搜索结果。 实验结果 最终实验结果如下: ?...效果差距大不大,肉眼看了不算,还是要计算一下FID(用于评估GAN生成图像的质量,分数越低代表与真实图像越相似)。 该项目提供了几个数据集的真实统计信息: bash .

86000

解读 | 2019 年 10 篇计算机视觉精选论文(上)

更进一步,我们使用神经体系结构搜索来设计一个新的基准网络,并对其进行扩展以获得称为 EfficientNets 的模型系列,该模型系列比以前的 ConvNets 具有更高的准确性和效率。...因为人是静止的,所以可以使用多视图立体重建来生成训练数据。在推理时,我们的方法使用来自场景的静态区域的运动视差线索来指导深度预测。...•作者使用 YouTube 上模仿人体模型的人的视频数据库 Mannequin Challenge(人体模型挑战数据集)训练了一个深度神经网络,该深度可以通过现有的立体声技术进行映射。...此论文在人工智能界的荣誉 •该论文在计算机视觉和模式识别的领先会议 CVPR 2019 上获得了最佳论文奖(荣誉奖)。 未来的研究领域是什么? •扩展模型以适用于移动非人类物体,例如汽车和阴影。...•此外,使用 SIL 模仿 RCM agent 先前在训练集上的最佳体验,会导致平均路径长度从 15.22m 下降到 11.97m,并且对 SPL 度量的结果甚至更好(38%)。

58020
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    解读 | 2019年10篇计算机视觉精选论文(上)

    更进一步,我们使用神经体系结构搜索来设计一个新的基准网络,并对其进行扩展以获得称为 EfficientNets 的模型系列,该模型系列比以前的 ConvNets 具有更高的准确性和效率。...因为人是静止的,所以可以使用多视图立体重建来生成训练数据。在推理时,我们的方法使用来自场景的静态区域的运动视差线索来指导深度预测。...•作者使用 YouTube 上模仿人体模型的人的视频数据库 Mannequin Challenge(人体模型挑战数据集)训练了一个深度神经网络,该深度可以通过现有的立体声技术进行映射。...此论文在人工智能界的荣誉 •该论文在计算机视觉和模式识别的领先会议 CVPR 2019 上获得了最佳论文奖(荣誉奖)。 未来的研究领域是什么? •扩展模型以适用于移动非人类物体,例如汽车和阴影。...•此外,使用 SIL 模仿 RCM agent 先前在训练集上的最佳体验,会导致平均路径长度从 15.22m 下降到 11.97m,并且对 SPL 度量的结果甚至更好(38%)。

    58230

    在自己的数据集上训练TensorFlow更快的R-CNN对象检测模型

    使医生能够提高识别上述血球计数的准确性和通量,可以大大改善数百万患者的医疗保健! 对于自定义数据,请考虑以自动方式从Google图像搜索中收集图像,并使用LabelImg之类的免费工具对其进行标记。...对于自定义数据集,请按照此简单的分步指南将图像及其注释上载到Roboflow 。...首先,访问将在此处使用的数据集:网站(请注意,使用的是特定版本的数据集。图像已调整为416x416。)...对于自定义数据集,此过程看起来非常相似。无需从BCCD下载图像,而是可以从自己的数据集中下载图像,并相应地重新上传它们。 下一步是什么 已经将对象检测模型训练为自定义数据集。...现在,在生产中使用此模型将引起确定生产环境将是一个问题。例如是要在移动应用程序中,通过远程服务器还是在Raspberry Pi上运行模型?模型的使用方式决定了保存和转换其格式的最佳方法。

    3.6K20

    入门必备 | 一文读懂神经架构搜索

    我们有很好的图像分类任务架构,但像我这样的许多年轻学习者通常花费数小时的时间来修复体系结构,同时处理那些不是Image的数据集。我们当然希望别人能为我们做这件事。...因此神经架构搜索(NAS),自动化架构工程的过程就出现了。我们只需要为NAS系统提供数据集,它将为我们提供该数据集的最佳架构。NAS可以被视为AutoML的子域,并且与超参数优化具有明显的重叠。...然后在数据集上训练模型,并将模型对验证数据的性能作为奖励。 ? 控制器扮演代理的角色,准确性被作为奖励 通常,递归神经网络(RNN)被视为控制器或代理。它产生字符串,模型是随机构建的字符串形式。 ?...id=r1Ue8Hcxg 渐进式神经架构搜索(PNAS) PNAS执行本教程的搜索空间部分中讨论的单元搜索。他们通过以预定义的方式添加单元来构建来自块的单元并构建完整网络。 ?...例如,我们可以构造所有256个单块单元并测量它们的性能。并使用这些数据训练代理模型。然后使用此模型预测2个块单元的性能,而无需实际训练和测试它们。当然,代理模型应该能够处理可变大小的输入。

    1.1K10

    谷歌研究:通过自动增强来提高深度学习性能

    解决这个问题的一种方法是将图像的对称性硬编码到神经网络体系结构中,这样它们就能更好地运行,或者让专家手动设计数据增强方法,比如旋转和翻转,这些方法通常用于训练表现良好的视觉模型。...直观地说,数据增强用于教导关于数据域中图像不变性的模型,其方式使得神经网络对这些重要的对称性不变,从而改善其性能。...与以前手动设计数据增强策略的先进深度学习模型不同,我们使用强化学习从数据本身中找出最佳图像转换策略。这样做的结果是提高了计算机视觉模型的性能,而不依赖于新的、不断扩展的数据集。...AutoAugment是以自动的方式为计算机视觉设计定制数据增强政策的数据集,例如,指导基本图像转换操作的选择,例如水平或垂直翻转图像,旋转图像,更改图像颜色等。...AutoAugment不仅可以预测要合并的图像转换,还可以预测使用转换的每个图像的概率和大小,这样图像不总是以相同的方式操作。

    46140

    药物设计的深度学习

    2.用于小分子药物发现的通用深度学习体系结构 有不同类型的DL体系结构,每种体系结构都可以根据训练数据的结构以不同的方式识别模式并提取高级特征。本文主要讨论了主流架构,包括CNN,RNN和生成网络。...发生器(G)负责从随机向量中制作非真实的图像,以混淆另一个称为鉴别器(D)的网络。当D收到伪造和真实图像时,它会将它们分开。该模块中,G和D彼此竞争并同时训练,直到他们都找到最佳参数。...试图使用2D分子绘制分子图像作为CNN模型的输入数据来预测化学性质。...与使用QSAR模型的常规筛选方法不同,它们的模型从6252个训练分子的输入分子指纹中提取特征,并使用非监督生成模型为潜在选择性化合物产生新的指纹矢量。...温克勒等人最近报道了他们的贝叶斯正则化神经网络(BNN)模型与Ma等人生成的DL模型之间的比较。使用来自Merck的相同KAGGLE数据集。

    95850

    视频架构搜索

    这不仅对于自动理解视频的语义内容(例如网络视频分类或体育活动识别)必不可少,而且对于机器人的感知和学习也至关重要。就像人类一样,来自机器人摄像机的输入很少是世界的静态快照,而是采用连续视频的形式。...尽管已经广泛探索了神经体系结构搜索(例如Zoph等人,Real等人)以发现良好的体系结构以获取图像,尚未开发针对视频的机器优化神经体系结构。...开发的视频架构在多个公共数据集上的性能明显优于现有的手工制作模型,并证明网络运行时间可提高10倍至100倍。...代表性的AssembleNet模型是使用Moments-in-Time数据集演化而来的。一个节点对应于一个时空卷积层块,每个边指定它们的连通性。较暗的边缘表示更牢固的连接。...使用新的进化算法生成的视频架构在相当大的程度上优于公共数据集上最著名的人工设计的CNN架构。还表明,随着架构的发展,学习计算效率高的视频模型TinyVideoNets是可能的。

    85210

    ImageNet错误率小于4%,数据量依然不够,N-Shot Learning或是终极解决之道?

    简而言之,我们的模型必须能够在使用数量极其有限的热狗图像的条件下进行训练。 要处理像这样复杂的问题,我们首先需要定义明确。...这些图像属于支持数据集,学习模型称为 Ns-Shot 模型。而另一个随机采样的 Nq 类图像属于查询集。...现在的问题是,这个“Image2Vector”模型的体系结构是什么样的呢? Image2Vector 作用 ?...我们将 4200 个类的图像分割成训练数据集,而其余的则分割成测试数据集。对于每一个片段,我们基于 5 个实例训练的模型,而这5个实例是来自随机选择的 64 个类中的一个。...首先,我们从输入数据中随机地选择 Nc 的类。对于每个类,我们使用random_sample_cls函数从图像中随机选择一个支持数据集和一个查询数据集。

    81240

    【GAN全局实用手册】谷歌大脑最新研究,Goodfellow力荐

    深度生成模型可以应用于学习目标分布的任务。 他们最近在各种应用程序中被利用,在自然图像的背景下充分发挥其潜力。 生成对抗网络(GAN)是以完全无监督的方式学习这些模型的主要方法之一。...我们首先定义GAN landscape—损失函数集,归一化和正则化方案以及最常用的体系结构。...通过分析损失函数的影响,我们得出结论,非饱和损失(non-saturating loss)在数据集、体系结构和超参数之间足够稳定。然后,我们继续分析各种归一化和正则化方案以及不同的体系结构的效果。...LSUN-BEDROOM数据集[包含300多万张图像。 我们将图像随机分成训练集和测试集,使用30588张图像作为测试集。...其次,我们使用30k张图像的CELEBA-HQ数据集,将3000个示例作为测试集,其余示例作为训练集。

    55200

    神经网络架构搜索(NAS)

    大型人类工程图像分类体系结构 不久之后,我了解到许多工程师和科学家用他们多年的经验建造了这个建筑。还有更多的预感,而不是完整的数学,会告诉你“我们现在需要一个5×5的过滤器,以达到最佳精度”。...对于图像分类任务,我们有很好的体系结构,但是很多像我这样的年轻学习者在处理非图像数据集时,通常会花费数小时来修复架构。我们当然希望有人能为我们做这件事。...在神经架构搜索(NAS),自动化架构工程的过程就出现了。我们只需要为NAS系统提供一个数据集,它将为我们提供该数据集的最佳架构。NAS可以看作AutoML的子域,与超参数优化有明显的重叠。...强化学习 我们知道强化学习;在哪里根据θ参数化的策略执行一些操作。然后,代理根据所采取操作的奖励更新策略θ。对于NAS,代理生成模型体系结构、子网络(操作)。...然后对模型进行数据集培训,并将模型对验证数据的性能作为奖励。 控制器扮演代理人的角色,准确度作为奖励 一般来说,递归神经网络(RNN)被视为控制器或代理。

    1.6K30

    总结神经网络架构搜索(NAS算法)

    大型人类工程图像分类体系结构 不久之后,我了解到许多工程师和科学家用他们多年的经验建造了这个建筑。还有更多的预感,而不是完整的数学,会告诉你“我们现在需要一个5×5的过滤器,以达到最佳精度”。...对于图像分类任务,我们有很好的体系结构,但是很多像我这样的年轻学习者在处理非图像数据集时,通常会花费数小时来修复架构。我们当然希望有人能为我们做这件事。...在神经架构搜索(NAS),自动化架构工程的过程就出现了。我们只需要为NAS系统提供一个数据集,它将为我们提供该数据集的最佳架构。NAS可以看作AutoML的子域,与超参数优化有明显的重叠。...强化学习 我们知道强化学习;在哪里根据θ参数化的策略执行一些操作。然后,代理根据所采取操作的奖励更新策略θ。对于NAS,代理生成模型体系结构、子网络(操作)。...然后对模型进行数据集培训,并将模型对验证数据的性能作为奖励。 控制器扮演代理人的角色,准确度作为奖励 一般来说,递归神经网络(RNN)被视为控制器或代理。

    3.1K21

    深度学习的未来:神经网络架构搜索(NAS)

    大型人类工程图像分类体系结构 不久之后,我了解到许多工程师和科学家用他们多年的经验建造了这个建筑。还有更多的预感,而不是完整的数学,会告诉你“我们现在需要一个5×5的过滤器,以达到最佳精度”。...对于图像分类任务,我们有很好的体系结构,但是很多像我这样的年轻学习者在处理非图像数据集时,通常会花费数小时来修复架构。我们当然希望有人能为我们做这件事。...在神经架构搜索(NAS),自动化架构工程的过程就出现了。我们只需要为NAS系统提供一个数据集,它将为我们提供该数据集的最佳架构。NAS可以看作AutoML的子域,与超参数优化有明显的重叠。...强化学习 我们知道强化学习;在哪里根据θ参数化的策略执行一些操作。然后,代理根据所采取操作的奖励更新策略θ。对于NAS,代理生成模型体系结构、子网络(操作)。...然后对模型进行数据集培训,并将模型对验证数据的性能作为奖励。 ? 控制器扮演代理人的角色,准确度作为奖励 一般来说,递归神经网络(RNN)被视为控制器或代理。

    2.5K30

    使用深度学习进行分心驾驶检测

    有10类图像: https://www.kaggle.com/c/state-farm-distracted-driver-detection 图:来自训练数据的样本图像 评估指标 在继续构建模型之前...图:应对数据泄漏后的模型拟合 为了进一步改善结果,探索并使用了久经考验的深度神经网络体系结构。 迁移学习 迁移学习是一种方法,其中为相关任务开发的模型被重用为第二个任务上的模型的起点。...可以重用针对标准计算机视觉基准数据集开发的预训练模型的模型权重,例如ImageNet图像识别挑战。通常将替换具有softmax激活的最后一层以适合数据集中的类数。...图:使用(i)亚当(ii)SGD跨时期的精度 使用哪种架构? 使用ImageNet数据集上的训练权重(即预先训练的权重)尝试了多种迁移学习模型。 VGG16 VGG16模型具有16层。...MobileNet在测试设备上的损失最小 比较最佳模型 尽管上面的每种体系结构都带来了很好的效果,但是每种模型对于单个类的性能还是存在很大差异的。

    3.2K20

    深度学习时间系列预测的总结及发展趋势

    太阳能的生产经常受到云层覆盖的影响,这在卫星图像数据中可以看到,但在数值数据中没有很好地体现出来。除了模型本身外,论文的另外贡献是研究人员构建并开源的多模态卫星图像数据集。...作者还在整合图像数据方面区分了困难和容易的任务,他们的方法优于其他模型。 这篇论文提供了一个有趣的框架,ROPE的概念也很有趣,对于任何使用坐标形式的地理数据的人都有潜在的帮助。...数据集本身对于多模态预测的持续工作非常有用,这是一项非常有益的贡献。...对于那些不熟悉的人来说,元学习通常被应用在计算机视觉数据集上,像MAML这样的论文可以对新的图像类进行少量的学习。...并且没有提供测试集的链接,也没有在他们的论文中说明这些数据集是什么。 2、论文中架构图和模型体系结构的描述非常糟糕。这看起来就像是作者复制了其他论文的图表,强加上注意力的定义和LLM相关的流行词汇。

    25010

    深度学习时间系列预测的总结及发展趋势

    太阳能的生产经常受到云层覆盖的影响,这在卫星图像数据中可以看到,但在数值数据中没有很好地体现出来。除了模型本身外,论文的另外贡献是研究人员构建并开源的多模态卫星图像数据集。...作者还在整合图像数据方面区分了困难和容易的任务,他们的方法优于其他模型。 这篇论文提供了一个有趣的框架,ROPE的概念也很有趣,对于任何使用坐标形式的地理数据的人都有潜在的帮助。...数据集本身对于多模态预测的持续工作非常有用,这是一项非常有益的贡献。...对于那些不熟悉的人来说,元学习通常被应用在计算机视觉数据集上,像MAML这样的论文可以对新的图像类进行少量的学习。...并且没有提供测试集的链接,也没有在他们的论文中说明这些数据集是什么。 2、论文中架构图和模型体系结构的描述非常糟糕。这看起来就像是作者复制了其他论文的图表,强加上注意力的定义和LLM相关的流行词汇。

    33810

    深度学习在时间序列预测的总结和未来方向分析

    太阳能的生产经常受到云层覆盖的影响,这在卫星图像数据中可以看到,但在数值数据中没有很好地体现出来。除了模型本身外,论文的另外贡献是研究人员构建并开源的多模态卫星图像数据集。...作者还在整合图像数据方面区分了困难和容易的任务,他们的方法优于其他模型。 这篇论文提供了一个有趣的框架,ROPE的概念也很有趣,对于任何使用坐标形式的地理数据的人都有潜在的帮助。...数据集本身对于多模态预测的持续工作非常有用,这是一项非常有益的贡献。...对于那些不熟悉的人来说,元学习通常被应用在计算机视觉数据集上,像MAML这样的论文可以对新的图像类进行少量的学习。...并且没有提供测试集的链接,也没有在他们的论文中说明这些数据集是什么。 2、论文中架构图和模型体系结构的描述非常糟糕。这看起来就像是作者复制了其他论文的图表,强加上注意力的定义和LLM相关的流行词汇。

    49310

    Tensorflow入门教程(四十九)——UXNet

    今天将分享Unet的改进模型UXNet,改进模型来自2020年的论文《UXNet: Searching Multi-level Feature Aggregationfor 3D Medical Image...但是3D医学图像中异常大小,形状,位置的巨大变化通常需要来自多级特征表示的信息才能实现鲁棒且密集的预测。但是目前文献中,许多研究表明,多级特征的聚集可以解决异常巨大变化问题,从而实现更准确的分割。...(1)提出一个新颖的体系结构搜索设置:搜索最佳的多级特征聚合策略,以融合类似UNet的体系结构中的特征图进行3D医学图像分析。...3、实验设置与结果 3.1、数据 使用3D医学分割十项全能(MSD)挑战的三个子集(即大脑,心脏和前列腺)上评估UXNet,其中分别包含484、20、32个要训练的案例。采用相同的图像预处理策略。...由于测试数据集的注释不公开,因此使用5倍交叉验证结果。皮肤病变分割和分类2018挑战发布的二维病变分割数据集的验证结果,该数据提供了2594个训练图像。

    93730

    【翻译】A New Approach for Sparse Matrix Classification Based on Deep Learning Techniques

    图3显示了我们的方法的不同阶段。我们假设一组来自不同实际问题的大型稀疏矩阵,它们代表了各种特征和非零模式。该数据集将作为SpMV基准测试和图像生成阶段的输入。...当一个通道不被使用时,它对于图像中所有像素的值为0。 从现在开始,使用RxGyBz符号表示选择x、y和z分别计算图像的R、G和B值。在图像数据集生成阶段,可以使用多个通道和指标的组合。...注意,图像数据集分为训练集和测试集(如图3所示),这样训练过程只考虑训练集中的图像,而测试集中的图像则需要评估最终选择的分类模型的误差。我们使用了交叉验证方法,这通常被认为是模型选择和评估的最佳方法。...B.稀疏矩阵数据集 正如我们在第三节中指出的,为了训练网络,有必要有一个大的稀疏矩阵集。这个数据集应该包含来自不同实际问题和应用的矩阵。通过这种方式,我们期望这些矩阵涵盖广泛的特征和非零模式。...这种归一化的执行方式会影响分类器的结果。为了找到最佳的归一化方法,进行了大量的实验研究。 接下来,我们将详细介绍如何为评估中使用的图像数据集计算RGB值(数字标识相应的度量): ?

    1.1K20

    TimeSformer:视频理解所需的只是时空注意力吗?

    TimeSformer已在多个具有挑战性的行为识别数据集上取得了SOTA结果。...本文使用的数据集包括Kinetics-400,Kinetics-600,Something-Something-v2,Diving-48和HowTo100M数据集。...我们还注意到,虽然注意力模式只显示在两个相邻的帧上,但它以同样的方式扩展到clip.Source[1]的所有帧 图中,蓝色的图像块是查询的图像块,剩余颜色的图像块是每种自我注意策略使用的图像块,没有颜色的图像块不被使用...其中,分离时空的注意力是最好的。 ? 从表中可以看出,对于K400数据集,最好只使用空间信息对其进行分类。这些是前人的研究也发现,但对于SSv2数据集,仅利用空间信息的效果非常差。...此外,与其他体系结构相比,论文所提出的模型训练速度更快,测试时间效率更高。

    1.3K11
    领券