开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

关于将单个图像的多个补丁放入单个小批量

的问题，我可以给出以下完善且全面的答案：

将单个图像的多个补丁放入单个小批量是指在图像处理中，将一个图像分割成多个小块（补丁），然后将这些补丁放入一个小批量中进行处理。这种方法常用于图像分割、目标检测和图像生成等任务。

分类：这个问题涉及到图像处理和机器学习领域。

优势：

提高计算效率：将多个补丁放入单个小批量可以减少数据传输和计算的开销，提高处理速度。
增加样本多样性：通过将不同位置的补丁放入同一个小批量，可以增加样本的多样性，有助于提高模型的泛化能力。
降低内存占用：将多个补丁放入单个小批量可以减少内存的占用，特别是在处理大尺寸图像时更为明显。

应用场景：

图像分割：将图像分割成多个补丁后，可以将这些补丁放入小批量进行分割任务，例如语义分割、实例分割等。
目标检测：将图像中的不同目标分割成补丁后，可以将这些补丁放入小批量进行目标检测任务。
图像生成：在生成对抗网络（GAN）等模型中，将图像的不同部分分割成补丁后，可以将这些补丁放入小批量进行生成任务。

推荐的腾讯云相关产品和产品介绍链接地址：腾讯云提供了多个与图像处理相关的产品和服务，包括图像识别、图像处理、图像分析等。以下是一些相关产品和其介绍链接地址：

腾讯云图像处理（https://cloud.tencent.com/product/imagex）：提供了图像处理的基础功能，包括图像裁剪、缩放、旋转等。
腾讯云智能图像（https://cloud.tencent.com/product/tii）：提供了图像识别、图像分析等高级功能，包括人脸识别、物体识别、场景识别等。
腾讯云图像分析（https://cloud.tencent.com/product/tia）：提供了图像分析的能力，包括图像标签、图像内容审核等。

通过以上腾讯云的产品和服务，可以满足将单个图像的多个补丁放入单个小批量的需求，并提供丰富的图像处理和分析功能。

相关搜索:将多个元素从ArrayList放入单个数组？关于单个表单中的多个文件上传使用python将图像的多个部分连接到单个图像 msforeachdb将多个查询放入单个结果集创建临时表无法将多个图像保存为单个pdf 使用PDFBox将多个图像合并到单个PDF。将多个组合框值的总和放入单个文本框中将单个图像背景分成不同高度的多个div 将单个图像跨越多个图片框(Visual Basic)如何使用图像、图像、高度和宽度控件将多个图像合并为单个图像在codeigniter中显示单个产品的多个图像。在Matlab中裁剪单个图像的多个部分将显示单个图像，但不会使用Python Turtle库显示多个图像 3个js -单个对象上的多个纹理/图像无法使用imshow将多个单个图像应用于大网格将GIF的所有帧显示为单个图像将包含列表的单个列的系列拆分为具有单个值的多个列具有ngx图像裁剪器的单个图像上的多个裁剪框如何将配置文件中的参数放入单个模块？将多个.TIFF图像与R中的单个标题一起打印

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Momentum Contrast for Unsupervised Visual Representation Learning

我们提出了无监督视觉表征学习的动量对比(MoCo)。从作为字典查找的对比学习[29]的角度来看，我们构建了具有队列和移动平均编码器的动态字典。这使得能够动态构建一个大型且一致的词典，从而促进对比无监督学习。MoCo在ImageNet分类的通用线性协议下提供了有竞争力的结果。更重要的是，MoCo了解到的情况很好地转移到了下游任务中。在PASCAL VOC、COCO和其他数据集上，MoCo在7项检测/分割任务中的表现优于其监督的预训练对手，有时甚至远远超过它。这表明，在许多视觉任务中，无监督和有监督表示学习之间的差距已经基本消除。

03

你也可以训练超大神经网络！谷歌开源GPipe库

深度神经网络（DNN）推动了许多机器学习任务的发展，包括语音识别、视觉识别、语言处理。BigGan、Bert、GPT2.0取得的近期进展表明，DNN模型越大，其在任务中的表现越好。视觉识别领域过去取得的进展也表明，模型大小和分类准确率之间存在很强的关联。例如，2014年ImageNet视觉识别挑战赛的冠军GoogleNet以400万的参数取得了74.8%的top-1准确率，但仅仅过了三年，冠军的宝座就被Squeeze-and-ExcitationNetworks抢去，后者以1.458亿（前者的36倍还多）的参数量取得了82.7%的top-1准确率。然而，在这段时间里，GPU的内存只提高了3倍左右，当前最优的图像模型却已经达到了谷歌云 TPUv2的可用内存。因此，我们急需一个能够实现大规模深度学习并克服当前加速器内存局限的可扩展高效架构。

02

你也可以训练超大神经网络！谷歌开源GPipe库

深度神经网络（DNN）推动了许多机器学习任务的发展，包括语音识别、视觉识别、语言处理。BigGan、Bert、GPT 2.0取得的近期进展表明，DNN模型越大，其在任务中的表现越好。视觉识别领域过去取得的进展也表明，模型大小和分类准确率之间存在很强的关联。例如，2014年ImageNet视觉识别挑战赛的冠军GoogleNet以400万的参数取得了74.8%的top-1准确率，但仅仅过了三年，冠军的宝座就被Squeeze-and-ExcitationNetworks抢去，后者以1.458亿（前者的36倍还多）的参数量取得了82.7%的top-1准确率。然而，在这段时间里，GPU的内存只提高了3倍左右，当前最优的图像模型却已经达到了谷歌云 TPUv2的可用内存。因此，我们急需一个能够实现大规模深度学习并克服当前加速器内存局限的可扩展高效架构。

03

深度学习中的9种归一化方法概述

深度学习模型正在创建一些复杂任务的最先进模型，包括语音识别、计算机视觉、机器翻译等。然而，训练深度学习模型（如深度神经网络）是一项复杂的任务，因为在训练阶段，各层的输入不断变化。

03

Batch Size对神经网络训练的影响

这篇文章非常全面细致地介绍了Batch Size的相关问题。结合一些理论知识，通过大量实验，文章探讨了Batch Size的大小对模型性能的影响、如何影响以及如何缩小影响等有关内容。

02

Batch Size对神经网络训练的影响

这篇文章非常全面细致地介绍了Batch Size的相关问题。结合一些理论知识，通过大量实验，文章探讨了Batch Size的大小对模型性能的影响、如何影响以及如何缩小影响等有关内容。

03

比DGL快14倍：PyTorch图神经网络库PyG上线了

项目链接：https://github.com/rusty1s/pytorch_geometric

04

【翻译】Efficient Data Loader for Fast Sampling-Based GNN Training on Large Graphs

Efficient Data Loader for Fast Sampling-Based GNN Training on Large Graphs | IEEE Journals & Magazine | IEEE Xplore

04

【Scikit-Learn 中文文档】分解成分中的信号（矩阵分解问题） - 无监督学习 - 用户指南 | ApacheCN

2.5. 分解成分中的信号（矩阵分解问题） 2.5.1. 主成分分析（PCA） 2.5.1.1. 准确的PCA和概率解释（Exact PCA and probabilistic interpretation） PCA 用于对一组连续正交分量中的多变量数据集进行方差最大方向的分解。在 scikit-learn 中， PCA 被实现为一个变换对象，通过 fit 方法可以降维成 n 个成分，并且可以将新的数据投影(project, 亦可理解为分解)到这些成分中。可选参数 whiten=Tr

07

学界 | 超越何恺明等组归一化 Group Normalization，港中文团队提出自适配归一化取得突破

AI 科技评论：港中文最新论文研究表明目前的深度神经网络即使在人工标注的标准数据库中训练（例如 ImageNet），性能也会出现剧烈波动。这种情况在使用少批量数据更新神经网络的参数时更为严重。研究发现这是由于 BN（Batch Normalization）导致的。BN 是 Google 在 2015 年提出的归一化方法。至今已有 5000+次引用，在学术界和工业界均被广泛使用。港中文团队提出的 SN（Switchable Normalization）解决了 BN 的不足。SN 在 ImageNet 大规模图像识别数据集和 Microsoft COCO 大规模物体检测数据集的准确率，还超过了最近由 Facebook 何恺明等人提出的组归一化 GN（Group Normalization）。原论文请参考 arXiv:1806.10779 和代码 https://github.com/switchablenorms

01

Batch Normalization论文翻译——中文版

本文介绍了深度学习模型在图像识别领域中的技术细节和最新进展，包括卷积神经网络、循环神经网络和图像识别的广泛应用。

00

CVPR 2022丨特斯联AI提出：基于图采样深度度量学习的可泛化行人重识别

最近的研究表明，显式深度特征匹配以及大规模多样化的训练数据均可显著提升行人重识别的泛化能力。但是，在大规模数据上，学习深度匹配器的效率还未得到充分研究。近日，特斯联科技集团首席科学家邵岭博士及团队提出了一种高效的小批量采样（mini-batch sampling）方法——图采样（Graph Sampling， GS），用于大规模深度度量学习，极大改善了可泛化行人重识别。目前，该研究成果（题为: Graph Sampling Based Deep Metric Learning for Generaliz

04

截断梯度

强非线性函数往往倾向于非常大或非常小幅度的梯度。这导致的困难是，当参数梯度非常大时，梯度下降的参数更新可以将参数抛出很远，进入目标函数较大的区域，到达当前解所做的努力变成了无用功。梯度告诉我们，围绕当前参数的无穷小区域内最速下降的方向，这个无穷小区域之外，代价函数可能开始沿曲线背面而上。更新必须被选择为足够小，以避免过分穿越向上的曲面。我们通常使用衰减足够慢的学习率，使连续的步骤具有大致相同的学习率。适合于一个相对线性的地形部分的步长经常在下一步进入地形中更加弯曲的部分时变得不适合，会导致上坡运动。

01

深度模型中的优化(一)、学习和纯优化有什么不同

深度学习在许多情况下都涉及优化。例如，模型中的进行推断(如PCA)涉及求解优化问题。我们经常使用解析优化去证明或设计算法。在深度学习涉及到的诸多优化问题中，最难的是神经网络训练，甚至是几百台机器投入几天到几个月来解析单个神经网络训练问题，也是很常见的。因为这其中的优化问题很重要，代价也很高，因此研究者们开发了一组专门为此设计的优化技术。下面关注一类特定的优化问题：寻找神经网络上的一组参数，它能显著的降低代价函数，该代价函数通常包括整个训练集上的性能评估和额外的正则化。

03

训练GANs的陷阱与提示

生成性对抗网络（GANs）是目前深度学习中最热门的话题之一。在过去几个月里，在GANs上发表的论文数量大幅增加。GANs已经被应用于各种各样的问题，如果您错过了那一班车，这里有了关于GANs的一些很酷的应用列表。

04

最优解的平坦度与鲁棒性，我们该如何度量模型的泛化能力

选自inFERENCe 作者：Ferenc Huszár 机器之心编译参与：陈韵竹、刘晓坤深度网络最优解附近的平坦度一直是我们理解模型泛化性能的重点，通常较为平坦的最优解有更好的鲁棒性。而本文作者则进一步提出一个好的指标可能不仅涉及平均损失函数极小值附近的平坦度，还涉及两个平坦度指标之间的比率。我看到大家在 Twitter 和 Reddit 中谈论这篇论文《Visualizing the Loss Landscape of Neural Nets》，于是撰写此文。这篇论文与《Sharp Minima

07

深度 | 最优解的平坦度与鲁棒性，我们该如何度量模型的泛化能力

选自inFERENCe 作者：Ferenc Huszár 机器之心编译参与：陈韵竹、刘晓坤深度网络最优解附近的平坦度一直是我们理解模型泛化性能的重点，通常较为平坦的最优解有更好的鲁棒性。而本文作者则进一步提出一个好的指标可能不仅涉及平均损失函数极小值附近的平坦度，还涉及两个平坦度指标之间的比率。我看到大家在 Twitter 和 Reddit 中谈论这篇论文《Visualizing the Loss Landscape of Neural Nets》，于是撰写此文。这篇论文与《Sharp Minima

06

连载 | 深度学习入门第五讲

1.5 使用梯度下降算法进行学习现在我们有了神经网络的设计，它怎样可以学习识别数字呢?我们需要的第一样东西是一个用来学习的数据集 —— 称为训练数据集。我们将使用 MNIST 数据集，其包含有数以

07

学界 | Facebook 新研究：大批量SGD准确训练ImageNet仅需1小时

选自arXiv 机器之心编译参与：蒋思源由于近来互联网数据越来越大，深度学习模型越来越复杂，执行训练的时间也越来长。因此近日 Facebook 提出了一种将批量大小提高的分布式同步 SGD 训练方法，希望能有助于解决越来越长的训练时间。以下机器之心对该文论进行了部分编译，该论文详细内容请查看论文链接。论文：Accurate, Large Minibatch SGD: Training ImageNet in 1 Hour 论文链接：https://research.fb.com/wp-content

07

《Improving Deep Neural Networks》的理论知识点

从图中可以得知如果是使用小批量梯度下降法，看来是可以接受的，如果是使用批量梯度下降，有些事情是错误的。

01

RTX 2080时代，如何打造属于自己的深度学习机器

作者曾在 2015 年写过一版深度学习硬件推荐的文章，但如今计算机硬件的迭代速度非常快，因此作者在近期将原来的文章进行了大幅改动，写出了第二版深度学习硬件推荐。

03

Training Region-based Object Detectors with Online Hard Example Mining

在基于区域的卷积神经网络的浪潮中，目标检测领域已经取得了显著的进展，但是它们的训练过程仍然包含许多尝试和超参数，这些参数的调优代价很高。我们提出了一种简单而有效的在线难样本挖掘(OHEM)算法，用于训练基于区域的ConvNet检测器。我们的动机和以往一样——检测数据集包含大量简单示例和少量困难示例。自动选择这些困难的例子可以使训练更加有效。OHEM是一个简单直观的算法，它消除了几种常见的启发式和超参数。但更重要的是，它在基准测试(如PASCAL VOC2007和2012)上产生了一致且显著的检测性能提升。在MS COCO数据集上的结果表明，当数据集变得更大、更困难时，它的效率会提高。此外，结合该领域的互补进展，OHEM在PASCAL VOC 2007和2012年的mAP上分别取得了78.9%和76.3%的最新成果。

02

按部就班的吴恩达机器学习网课用于讨论（15）

数据越多，自然训练效果越好，在训练过程中，过拟合与欠拟合的指标通过绘图确定，据此调整超参数。

02

GNN落地不再难，一文总结高效GNN和可扩展图表示学习最新进展

来源：机器之心本文约4200字，建议阅读8分钟剑桥大学在读博士生 Chaitanya K. Joshi 从数据准备、高效架构和学习范式三个方向综述了研究者们在克服这些问题时取得的进展。图神经网络在应用到现实世界时会面临很多挑战，比如内存限制、硬件限制、可靠性限制等。在这篇文章中，剑桥大学在读博士生 Chaitanya K. Joshi 从数据准备、高效架构和学习范式三个方向综述了研究者们在克服这些问题时取得的进展。用于高效和可扩展的图形表示学习的工具箱。本文旨在概述关于高效图神经网络和可扩展图表示学

02

理解梯度下降在机器学习模型优化中的应用

本文介绍了梯度下降算法的起源、批量梯度下降、随机梯度下降和小批量梯度下降，以及它们在机器学习中的重要性。通过这些算法，可以优化模型权系数，从而提高模型的性能。

08

GNN落地不再难，一文总结高效GNN和可扩展图表示学习最新进展

选自Github 作者：Chaitanya K. Joshi 机器之心编译机器之心编辑部图神经网络在应用到现实世界时会面临很多挑战，比如内存限制、硬件限制、可靠性限制等。在这篇文章中，剑桥大学在读博士生 Chaitanya K. Joshi 从数据准备、高效架构和学习范式三个方向综述了研究者们在克服这些问题时取得的进展。用于高效和可扩展的图形表示学习的工具箱。本文旨在概述关于高效图神经网络和可扩展图表示学习的关键思想，并将介绍数据准备、GNN 架构和学习范式方面的关键进展，这些最新进展让图神经网

02

算法金 | 再见！！！梯度下降（多图）

今天把达叔 6 脉神剑给佩奇了，上吴恩达：机器学习的六个核心算法！ ——梯度下降

00

特征嵌入的正则化 SVMax 和 VICReg

在深度网络中权重和激活那个更重要？显然是权重，因为我们可以从权重推导出网络的激活。但是深度网络是非线性嵌入函数；我们只想要这种非线性嵌入。在这种嵌入基础上进行训练并获得结果（例如分类），我们要么需要在分类网络中使用线性分类器，要么需要在输出的特征中计算相似度。但是与权重衰减正则化相比，特征嵌入正则化在论文中却很少被提到和使用。通过权重衰减的正则化可以明显影响网络的性能，尤其是在小数据集上[3]。同样，特征嵌入也可以带来重大影响，例如避免模式崩溃（model collapse）。在本文中，我将介绍两个相关的特征嵌入正则化器：SVMax [1] 和 VICReg [2]。

02

比DGL快14倍：PyTorch图神经网络库PyG上线了

项目链接：https://github.com/rusty1s/pytorch_geometric

03

比DGL快14倍：PyTorch图神经网络库PyG上线了

项目链接：https://github.com/rusty1s/pytorch_geometric

02

当前最佳的YOLOv4是如何炼成的？细数那些小细节

目标检测在近几年开始发展成熟，但即便如此，竞争依旧激烈。如下所示，YOLOv4 宣称已经实现了当前最前沿技术的准确度，同时还能维持较高的处理帧率。使用 Tesla V100 GPU，在 MS COCO 数据集上以接近 65 FPS 的推理速度，YOLOv4 实现了 43.5% AP （65.7% AP₅₀）的准确度。但对于目标检测而言，高准确度早已不是唯一的目标。我们还希望边缘设备也能流畅地运行这些模型。因此，如何使用低成本硬件实时地处理输入视频也成为了一个重要的研究方向。

05

教程 | 神经网络的奥秘之优化器的妙用

之前的文章介绍了，我可以只使用 Numpy 来创建神经网络。这项挑战性工作极大地加深了我对神经网络内部运行流程的理解，还使我意识到影响神经网表现的因素有很多。精选的网络架构、合理的超参数，甚至准确的参数初始化，都是其中一部分。本文将关注能够显著影响学习过程速度与预测准确率的决策──优化策略的选择。本文挑选了一些常用优化器，研究其内在工作机制并进行对比。

02

为什么小批量会可以使模型获得更大的泛化

来源：Deephub Imba本文约2000字，建议阅读5分钟本文为你介绍了如批量大小在机器学习中的重要性。批大小是机器学习中重要的超参数之一。这个超参数定义了在更新内部模型参数之前要处理的样本数量。上图为使用 SGD 测试不同批量大小的示例。批量大小可以决定许多基于深度学习的神经网络的性能。有很多研究都在为学习过程评估最佳批量大小。例如，对于 SGD可以使用批量梯度下降（使用批量中的所有训练样本）或小批量（使用一部分训练数据），甚至在每个样本后更新（随机梯度下降）。这些不同的处理方式可以改变模型训

05

批量梯度下降法（BGD）、随机梯度下降法（SGD）和小批量梯度下降法（MBGD）

在机器学习中，对于很多监督学习模型，需要对原始的模型构建损失函数，接下来便是通过优化算法对损失函数进行优化，以便找到最优的参数。梯度下降法作为机器学习中较常使用的优化算法，在其求解过程中，只需要求解损失函数的一阶导数，计算的代价比较小。基本思想可以理解为：我们从山上的某一点出发，找一个最抖的坡走一步（也就是找梯度方向），到达一个点之后，再找最陡的坡，再走一步，直到不断的走，走到最低点（最小花费函数收敛点）

01

深度学习面试必备的25个问题

答：否则，我们将获得一个由多个线性函数组成的线性函数，那么就成了线性模型。线性模型的参数数量非常少，因此建模的复杂性也会非常有限。

01

GoogLeNetv2 论文研读笔记

当前神经网络层之前的神经网络层的参数变化，引起神经网络每一层输入数据的分布产生了变化，这使得训练一个深度神经网络变得复杂。这样就要求使用更小的学习率，参数初始化也需要更为谨慎的设置。并且由于非线性饱和（注：如sigmoid激活函数的非线性饱和问题），训练一个深度神经网络会非常困难。我们称这个现象为：internal covariate shift。同时利用归一化层输入解决这个问题。我们将归一化层输入作为神经网络的结构，并且对每一个小批量训练数据执行这一操作。Batch Normalization（BN）能使用更高的学习率，并且不需要过多地注重参数初始化问题。BN 的过程与正则化相似，在某些情况下可以去除Dropout

03

一文帮你理解什么是深层置信网络（DBN）

翻译 | 林椿眄编辑 | SuiSui 前言随着机器学习的进步和深度学习的出现，一些工具和图形表示被逐渐用来关联大量的数据。深度置信网络（Deep Belief Networks）本质上是一种具有生成能力的图形表示网络，即它生成当前示例的所有可能值。深度置信网络是概率统计学与机器学习和神经网络的融合，由多个带有数值的层组成，其中层之间存在关系，而数值之间没有。深层置信网络主要目标是帮助系统将数据分类到不同的类别。深度信念网络如何演进？第一代神经网络使用感知器，通过考虑“权重”或预先馈送的目标属

Playing Atari with Deep Reinforcement Learning

本文是对 DQN 原始论文 Playing Atari with Deep Reinforcement Learning 的详细解读。

03

一文帮你理解什么是深层置信网络

翻译 | 林椿眄编辑 |SuiSui 前言随着机器学习的进步和深度学习的出现，一些工具和图形表示被逐渐用来关联大量的数据。深度置信网络（Deep Belief Networks）本质上是一种具有生成能力的图形表示网络，即它生成当前示例的所有可能值。深度置信网络是概率统计学与机器学习和神经网络的融合，由多个带有数值的层组成，其中层之间存在关系，而数值之间没有。深层置信网络主要目标是帮助系统将数据分类到不同的类别。深度信念网络如何演进？第一代神经网络使用感知器，通过考虑“权重”或预先馈送的目标属性

07

机器学习学习笔记（22）深度模型中的优化

用于深度模型训练的优化算法与传统的优化算法在几个方面有所不同。机器学习通常是简接作用的，再打所述机器学习问题中，我们关注某些性能度量P，其定义于测试集上并且可能是不可解的。因此，我们只是间接地优化P，我们希望通过降低代价函数

03

Parrot：用于文本到图像生成的帕累托最优多奖励强化学习框架

最近的工作表明，使用具有质量奖励的强化学习（RL）可以提高文本到图像（T2I）生成中生成图像的质量。然而，多个奖励的简单聚合可能会导致某些指标的过度优化和其他指标的退化，并且手动找到最佳权重具有挑战性。所以非常需要一种有效的策略来联合优化 RL 中的多种奖励以生成 T2I。

01

详述深度学习中优化算法的演变

深度学习典型代表是以神经网络为主的联结式算法，在深度学习问题中，通常会预先定义一个损失函数，并通过相应手段(即一些优化算法)使其损失最小化，以不断更新权值和偏移量，最后训练出一个泛化能力良好的模型。

03

每日一学——最优化（下）

梯度计算计算梯度有两种方法：一个是缓慢的近似方法（数值梯度法），但实现相对简单。另一个方法（分析梯度法）计算迅速，结果精确，但是实现时容易出错，且需要使用微分。现在对两种方法进行介绍：利用有限差值计算梯度上节中的公式已经给出数值计算梯度的方法。下面代码是一个输入为函数f和向量x，计算f的梯度的通用函数，它返回函数f在点x处的梯度： def eval_numerical_gradient(f, x): """ 一个f在x处的数值梯度法的简单实现 - f是只有一个参数的函数 - x是计算梯度

【数据挖掘】神经网络后向传播算法 ( 梯度下降过程 | 梯度方向说明 | 梯度下降原理 | 损失函数 | 损失函数求导 | 批量梯度下降法 | 随机梯度下降法 | 小批量梯度下降法 )

1 . 后向传播算法 : 针对每个数据样本 , 从输入层到输出层传播输入 , 这是向前传播输入 , 然后从输出层向输入层传播误差 , 这是向后传播误差 ;

01

PyTorch 中的多 GPU 训练和梯度累积作为替代方案

在本文[1]中，我们将首先了解数据并行（DP）和分布式数据并行（DDP）算法之间的差异，然后我们将解释什么是梯度累积（GA），最后展示 DDP 和 GA 在 PyTorch 中的实现方式以及它们如何导致相同的结果。

02

超越CLIP的多模态模型，只需不到1%的训练数据！南加大最新研究来了

羿阁发自凹非寺量子位 | 公众号 QbitAI 火爆全网的AI绘画你玩了吗？女娲无限版、DALL·E2、Imagen……这些通过文字生成图像的AI绘画工具，背后的原理都是一个叫“CLIP”的模型，它是AI如何“理解”人类语义这一问题的关键。 CLIP（Contrastive Language–Image Pre-training），是一种基于对比的图片-文本学习的跨模态预训练模型，由OpenAI于去年1月发布。它好用是好用，但一个大问题是数据需求太大：4亿个图像文本对、256个GPU，这对许多公

01

业界 | 深度学习计算哪家强？最新云端&单机GPU横评

选自Medium 作者：Vincent Chu 机器之心编译参与：路雪、李泽南近日，Vincent Chu 在 Medium 上发文介绍自己对新一代 GPU 在各类深度学习任务上的测评结果，作者对比了 Paperspace Volta Tesla V100、Google Cloud P100、Amazon EC2 p3.2xlarge（Tesla V100）等云端计算平台，以及 Nvidia GeForce 1080Ti 单卡的成绩，具体测评结果详见全文。随着机器学习（ML）研究人员和实践者们不断探索

解锁机器学习-梯度下降：从技术到实战的全面指南

梯度下降（Gradient Descent）是一种在机器学习和深度学习中广泛应用的优化算法。该算法的核心思想非常直观：找到一个函数的局部最小值（或最大值）通过不断地沿着该函数的梯度（gradient）方向更新参数。

01

自动数据增强论文及算法解读（附代码）

数据增强是提高图像分类器精度的有效技术。但是当前的数据增强实现是手工设计的。在本论文中，我们提出了AutoAugment来自动搜索改进数据增强策略。我们设计了一个搜索空间，其中一个策略由许多子策略组成，每个小批量的每个图像随机选择一个子策略。子策略由两个操作组成，每个操作都是图像处理功能，例如平移，旋转或剪切，以及应用这些功能的概率。我们使用搜索算法来找到最佳策略，使得神经网络在目标数据集上产生最高的验证准确度。我们的方法在ImageNet上获得了83.5％的top1准确度，比之前83.1％的记录好0.4％。在CIFAR-10上，我们实现了1.5％的错误率，比之前的记录好了0.6％。扩充策略在数据集之间是可以相互转换的。在ImageNet上学到的策略也能在其他数据集上实现显著的提升。

02

GANs是如何创造出高分辨率的图像的

深度卷积生成对抗网络是2020年最精致的神经网络体系结构。生成模型可以追溯到60年代，但是Ian Goodfellow在2014年创造的GAN，使得生成模型跟那个广泛的使用，这对于深度学习的未来有着前所未有的价值。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭