开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

单个预测图像不需要重新缩放吗？

单个预测图像不需要重新缩放。在某些情况下，单个预测图像可能需要重新缩放，具体取决于使用的模型和算法。但是，通常情况下，单个预测图像不需要重新缩放。

预测图像的重新缩放通常是在训练模型时进行的，目的是将输入图像调整为模型所需的固定大小。这是因为大多数深度学习模型对输入图像的大小有特定的要求。在训练过程中，图像被缩放为相同的尺寸，以便模型能够处理它们。

然而，在进行单个图像的预测时，通常不需要重新缩放。预测过程中，模型会根据其输入层的大小来处理图像。如果输入图像的尺寸与模型所需的大小相匹配，那么不需要进行任何缩放操作。

如果输入图像的尺寸与模型所需的大小不匹配，那么可以考虑进行缩放操作。缩放可以通过各种图像处理库和工具来实现，例如OpenCV、PIL等。在缩放过程中，可以选择保持图像的长宽比例，以避免图像形变。

总结起来，单个预测图像不需要重新缩放，除非模型对输入图像的大小有特定要求。如果需要进行缩放，可以使用图像处理库和工具进行操作。

相关搜索:根据原始图像的大小重新缩放预测的矩形框使用libvips重新缩放图像在mnist中重新缩放图像使用单个图像tensorflow、keras进行预测如何使用Keras ImageDataGenerator预测单个图像？如何以正确的方式缩放和预测单个样本移动响应css -图像不能重新缩放使用for循环缩小和重新缩放图像将单个图像缩放到网格方块中？Pygame rotozoom重新缩放超出边界的图像在matplotlib中使用滑块重新缩放图像重新缩放拼接图像中的边界框标注在使用ImageDataGenerator(1./255)训练的模型进行预测之前，是否需要对图像进行重新缩放？在Matlab中重新缩放图像图中的X轴 React Konva，blueimp-load-image上传的图像重新缩放 imageio上的函数imwrite (Python)似乎正在重新缩放图像数据使用非整数因子重新缩放图像的最佳方法是什么？可以在Jupyter Notebook中缩放粘贴的图像吗？你能在Python Tkinter中重新缩放一个PhotoImage吗？想知道如何通过双击和拉伸来缩放图像吗

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

口罩佩戴监测系统

口罩佩戴监测系统通过yolo网络对现场监控画面进行实时监测，比如工厂车间、商场或者食堂后厨人员口罩佩戴情况等。当口罩佩戴监测系统监测到工作人员进入监控画面却没有按照规定戴口罩时，不需要人工干预，系统立即抓拍告警及时提醒后台人员处理违规情况，避免更大损失的发生。YOLO是一个聪明的卷积神经网络(CNN)，用于实时进行目标检测。该算法将单个神经网络应用于完整的图像，然后将图像划分为多个区域，并预测每个区域的边界框和概率，这些边界框是由预测的概率加权的。

02

华盛顿大学 | 模型优化新方法！以任务向量为中心，编辑模型生成预期效果（含源码）

在开发机器学习系统时，提高模型在下游任务上的表现或减少在预训练中学习到的偏见，一种常见的方法是对预训练模型做人为干预引导。为此，本文提出了一种以任务向量为中心来引导神经网络产生预期结果的新范式。

02

ADAM——动脉瘤检测和分割挑战(四)

今天将分享动脉瘤检测和分割的三个步骤级联分割的完整实现过程，为了方便大家学习理解整个流程，将整个流程步骤进行了整理，并给出详细的步骤结果。感兴趣的朋友赶紧动手试一试吧。

03

使用SlimYOLOv3框架实现实时目标检测

人类可以在几毫秒内在我们的视线中挑选出物体。事实上，你现在就环顾四周，你将观察到周围环境并快速检测到存在的物体，并且把目光回到我们这篇文章来。大概需要多长时间？

Facebook 推介 TensorMask：一种新的密集滑动窗口分割技术

近日，Facebook 发布了一项新的研究，该研究探索了实例分割的新方法。与掩模 R-CNN 驱动的标准方法相比，TunSoMeM 为探索分割研究提供了新的方向。本文是有关这项研究的具体内容。

01

「图像处理」U-Net中的重叠-切片

CW，广东深圳人，毕业于中山大学（SYSU）数据科学与计算机学院，毕业后就业于腾讯计算机系统有限公司技术工程与事业群（TEG）从事Devops工作，期间在AI LAB实习过，实操过道路交通元素与医疗病例图像分割、视频实时人脸检测与表情识别、OCR等项目。

00

DiffusionDet：用于对象检测的扩散模型

Shoufa Chen1, Peize Sun1, Yibing Song2, Ping Luo1 1The University of Hong Kong 2Tencent AI Lab {sfchen, pzsun, pluo}@cs.hku.hk yibingsong.cv@gmail.com

02

机器学习模型五花八门不知道怎么选？这份指南告诉你

· 适用于在已有了一些预先定义好的变量并且需要一个简单的预测模型的情况下使用；

02

YOLO论文翻译——中文版

本文介绍了一种用于目标检测的YOLO算法，它是一种端到端的深度学习模型，可以在图像中快速定位和识别目标。YOLO将目标检测任务简化为边界框的回归问题，并使用单个卷积神经网络来预测目标的类别和边界框。与传统的检测算法相比，YOLO具有更高的速度和效率，并且可以处理更复杂的场景和更多的目标。

00

06. OCR学习路径之CRNN文本识别

在了解了如何检测到文本之后，我们需要识别出检测文本内的文字信息。在文本识别完成之后，整个OCR光学字符识别的过程才算基本完成。那么，本次课程主要讲述识别文本的算法。

03

CUDA优化的冷知识16|纹理存储优势（2）

https://docs.nvidia.com/cuda/cuda-c-best-practices-guide/index.html 来阅读原文。

02

CVPR 2019 | 超分辨率的任意放大倍率网络

整数倍率放大：许多传统算法使用了亚像素卷积的方法，但是亚像素卷积只能对整数放大倍率使用。

03

自监督学习的知识点总结

监督学习：机器学习中最常见的方法是监督学习。在监督学习中，我们得到一组标记数据（X，Y），即（特征，标签），我们的任务是学习它们之间的关系。但是这种方法并不总是易于处理，因为-

02

【论文解读】基于图的自监督学习联合嵌入预测架构

本文演示了一种学习高度语义的图像表示的方法，而不依赖于手工制作的数据增强。论文介绍了基于图像的联合嵌入预测架构（I-JEPA），这是一种用于从图像中进行自监督学习的非生成性方法。I-JEPA背后的idea很简单：从单个上下文块中，预测同一图像中不同目标块的表示。指导I-JEPA产生语义表示的核心设计选择是掩膜策略；具体来说，(a)预测图像中的几个目标块，(b)采样足够大规模的样本目标块（占图像的15%-20%），(c)使用足够丰富的（空间分布）上下文块，是至关重要的。根据经验，当与视觉transformer结合时，论文发现I-JEPA具有高度的可缩放性。例如，论文在ImageNet上使用32个A100 GPU在38小时内训练一个ViT-Huge/16，以在需要不同抽象级别的广泛任务中实现强大的下游性能，从线性分类到对象计数和深度预测。

02

CRNN论文翻译——中文版

本文介绍了自然语言处理中的文本分类任务，以及用于文本分类的深度学习模型。文章首先介绍了传统的文本分类方法，然后详细阐述了基于深度学习的文本分类模型，包括卷积神经网络（CNN）、循环神经网络（RNN）、长短时记忆网络（LSTM）、门控循环单元（GRU）和注意力机制（Attention）等。最后，文章对未来的研究方向进行了展望。

08

平息画师怒火：Stable Diffusion学会在绘画中直接「擦除」侵权概念

选自arxiv 机器之心编译编辑：rome rome Stable Diffusion 学会了「偷天换日」的本领。任何一个创作过程，都是始于「模仿」、终于「创造」。对于 AI 来说，这一学习过程也是相同的。近期，开源版本的 Stable Diffusion 文本到图像的扩散模型，使图像生成技术得到极为广泛的应用，但是如何规避色情或风格侵权是需要解决的问题，作者提出 Erased Stable Diffusion（ESD）方法，有效的解决了前面的问题。文本到图像生成模型备受关注，其具备优秀的图像生成质

06

识别自动驾驶的深度

有许多传感器可用于在车辆行驶时捕获信息。捕获的各种测量结果包括速度，位置，深度，热等。这些测量结果被输入到反馈系统中，该系统训练并利用运动模型来遵守车辆。本文重点介绍通常由LiDAR传感器捕获的深度预测。LiDAR传感器使用激光捕获与物体的距离，并使用传感器测量反射光。但是，对于日常驾驶员而言，LiDAR传感器是负担不起的，那么还能如何测量深度？将描述的最新方法是无监督的深度学习方法，该方法使用一帧到下一帧的像素差异或差异来测量深度。

01

CVPR2019——MonoDepth2论文阅读

逐像素的真实尺度深度数据的大量获取，是具有挑战性的任务。为了克服这个限制，自监督学习已经成为一个有希望的替代训练模型，用来执行单目深度估计。本文中，我们提出了一系列的改进手段，用来提升自监督深度学习深度估计方法的精度。

03

最新SOTA！隐式学习场景几何信息进行全局定位

全局视觉定位是指利用单张图像，根据已有的地图，估计相机的绝对姿态（位置和方向）。这种技术可以应用于机器人和增强/虚拟现实等领域。这篇文章的主要贡献是提出了一种利用姿态标签来学习场景的三维几何信息，并利用几何信息来估计相机姿态的方法。具体来说，作者设计了一个学习模型，它可以从图像中预测两种三维几何表示（X, Y, Z坐标），一种是相机坐标系下的，另一种是全局坐标系下的。然后，通过将这两种表示进行刚性对齐，就可以得到与姿态标签匹配的姿态估计。这种方法还可以引入额外的学习约束，比如最小化两种三维表示之间的对齐误差，以及全局三维表示和图像像素之间的重投影误差，从而提高定位精度。在推理阶段，模型可以实时地从单张图像中估计出场景的三维几何信息，并通过对齐得到姿态。作者在三个常用的视觉定位数据集上进行了实验，进行了消融分析，并证明了他们的方法在所有数据集上都超过了现有的回归方法的姿态精度，并且可以实时地从单张图像中估计出场景的三维几何信息，并通过对齐得到姿态。

02

基于多尺度神经网络和特征融合的SOTA单目深度估计

论文: https://arxiv.org/pdf/2009.09934.pdf 代码: https://github.com/abhinavsagar/msnnff

04

多相机视觉系统的坐标系统标定与统一及其应用

随着机器视觉应用的日益广泛，大幅面多相机视觉系统的需求越来越多，主要应用方向为大幅面高精度的定位与测量和场景拼接等。多相机视觉系统的难点在于多相机坐标系的统一. 可以分为两类，一是相机视野间无重叠部分，二是相机视野间有重叠部分。相机间无重叠部分的情况主要用于大幅面多相机高精度的定位和测量，相机间有重叠部分的情况主要用于场景的拼接等。

02

2024年YOLO还可以继续卷 | MedYOLO是怎么从YOLO家族中一步一步走过来的？

在3D医学影像中进行物体定位的标准方法是使用分割模型对感兴趣的目标进行 Voxel 到 Voxel 的标注。虽然这种方法使模型具有很高的准确性，但也存在一些缺点。为医学影像生成 Voxel 级准确的标注是一个耗时的过程，通常需要多个专家来验证标签的质量。由于标注者之间的变异性，器官或病变的医学术准确的分割可能会出现结构边界不确定的问题，这可能会导致附近组织中包含无关信息或排除相关信息。即使有高质量的标签，分割模型在准确标记目标结构边界时可能会遇到困难，通常需要后处理来填充缺失的内部体积并消除伪预测目标。总之，这使得分割模型的训练成本过高，同时可能会限制下游诊断或分类模型的预测能力。

01

Lightmycells2024——明场到荧光成像挑战赛

为了获得荧光显微镜图像，需要用特定的荧光探针和染料对细胞进行手动生化标记处理，既耗时又昂贵。但是，所研究的细胞本身可能会受到荧光显微镜过程的干扰，包括暴露于激发光（光毒性）和探针本身。由于光毒性随着光照而增加，因此会损害长期成像。同样，通过光漂白使荧光团变暗限制了图像的信噪比。此外，添加标记是一种侵入性方法。荧光团可能会阻碍其靶标的分子相互作用，并且蛋白质过度表达会增加其在细胞质中的浓度，从而破坏调节过程。更糟糕的是，荧光团本身可能具有细胞毒性。由于荧光显微镜会引起时间和功能扰动，因此限制实验中使用的荧光探针的数量对于实时显微镜至关重要。相反，明场、相差和 DIC 等无标记透射光显微镜是非侵入性的，光毒性急剧降低，并且在整个采集过程中保持信号质量。这一挑战的生物学目的是从明场图像中恢复计算机荧光图像。

01

ICCV 2023 | COMPASS：任意尺度空间可伸缩性的深度图像压缩

在多媒体系统中，不同的终端设备需要不同分辨率大小和不同质量的图像，但大多数现有的基于神经网络的图像压缩方法必须将同一图像的不同版本单独压缩为多个比特流，从而导致低编码效率。为了解决这个问题，有一些关于可缩放图像压缩的研究，其中图像的各种版本以分层方式的编码到单个比特流中。每个层负责对图像的一个对应版本进行编解码，并且通过不同的预测方法来减少相邻层之间的冗余。

03

何凯明: 扩散模型的解构研究

本研究对去噪扩散模型（DDM）进行了解构，发现其关键组件是分词器，而其他组件并非必要。DDM的表现能力主要来自去噪过程而非扩散过程。研究还发现，通过消除类标签条件化项和KL正则化项，使用补丁式分词器可获得与卷积VAE相当的表现。最后，将现代DDM推向经典DAE，通过消除输入缩放和直接定义噪声调度，可获得更好的结果。

01

特征工程7种常用方法

向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程公众号：datayx 一、特征工程简单说，特征工程是能够将数据像艺术一样展现的技术。因为好的特征工程很好的混合了专业领域知识、直觉和基本的数学能力；本质上说，呈现给算法的数据应该能拥有基本数据的相关结构或属性。当你做特征工程时，其实是将数据属性转换为数据特征的过程，属性代表了数据的所有维度，在数据建模时，如果对原始数据的所有属性进行学习，并不能很好的找到数据的潜在趋势，而通过特征工程对你的数据进行预处理的话，你的算法模型能够减少受到噪声

02

ADAM——动脉瘤检测和分割挑战(一)

今天将分享动脉瘤检测和分割的第一步热力图回归检测的完整实现过程，为了方便大家学习理解整个流程，将整个流程步骤进行了整理，并给出详细的步骤结果。感兴趣的朋友赶紧动手试一试吧。

03

Improved Techniques for Training Single-Image GANs

最近，人们对从单个图像而不是从大型数据集学习生成模型的潜力产生了兴趣。这项任务意义重大，因为它意味着生成模型可以用于无法收集大型数据集的领域。然而，训练一个能够仅从单个样本生成逼真图像的模型是一个难题。在这项工作中，我们进行了大量实验，以了解训练这些方法的挑战，并提出了一些最佳实践，我们发现这些实践使我们能够比以前的工作产生更好的结果。一个关键点是，与之前的单图像生成方法不同，我们以顺序的多阶段方式同时训练多个阶段，使我们能够用较少的阶段来学习提高图像分辨率的模型。与最近的最新基线相比，我们的模型训练速度快了六倍，参数更少，并且可以更好地捕捉图像的全局结构。

02

详解AI加速器：为什么说现在是AI加速器的黄金时代？

选自 Medium 作者：Adi Fuchs 机器之心编译机器之心编辑部在上一篇文章中，前苹果工程师、普林斯顿大学博士 Adi Fuchs 解释了 AI 加速器诞生的动机。在这篇文章中，我们将跟

02

22岁复旦学生拿下世界深度学习竞赛冠军：50层ResNet网络

【新智元导读】拥有世界上最大的开源车对车（V2V）网络的 Nexar 公布了第二届 Nexar 挑战赛的结果。来自复旦大学的Hengduo Li 拿下冠军。 10月29日，Nexar 公布了第二届 Nexar 挑战赛（使用NEXET 数据库实现户外汽车识别）的获奖名单。Nexar公司成立于2015年，使用智能手机和车辆的摄像头和传感器来创建驾驶感知和ADAS警报，以及发生碰撞时记录的证据。 Nexar 通过将智能手机转变为相互连接的 AI “汽车前端摄像头”，构建了世界上最大的开源车对车（V2V）网络。

07

视频编码（3）：H.266 编码性能比 H.265 再提升 49% 的关键丨音视频基础

我们在前文《视频编码（1）》和《视频编码（2）》中探讨了 H.264 视频编码的基本概念、编码工具、编码流程及码流结构等基础知识，以及在 H.264 基础上迭代而生的 H.265 有哪些改进。接下来我们再来聊聊更新一代编码技术 H.266 的改进。

02

[ILSVRC] 基于OverFeat的图像分类、定位、检测引言相关理论计算机视觉三大任务Alexnet图片分类回顾基础学习OverFeat图片分类定位任务检测总结Reference

引言对于分类问题而言，一个常用的增加训练样本的方法是将训练样本随机移动一个小的位移，或者，等价的，在图像中随机取一些大的图像块。然后以这些图像块为输入训练分类模型。在测试阶段，可以采用滑窗的方法对每一个图像块进行分类，然后组合这些分类结果，得到一个置信度更高的类别标签。这种技巧被广泛运用于机器学习算法中，例如：瑞士一个研究组的文章：Multi-column Deep Neural Networks for Image Classiﬁcation. CVPR2012. 　　对于检测和定位问题，最自然（也是

06

详解AI加速器（二）：为什么说现在是AI加速器的黄金时代？

选自 Medium 作者：Adi Fuchs 机器之心编译机器之心编辑部在上一篇文章中，前苹果工程师、普林斯顿大学博士 Adi Fuchs 解释了 AI 加速器诞生的动机。在这篇文章中，我们将跟

02

Meta 自监督学习 I-JEPA 论文笔记

I-JEPA ( Image Joint Embedding Predictive Architecture ) 是一种自监督学习框架，结合了联合嵌入架构 (Joint-Embedding Architecture) 和生成架构 (Generative Architecture) 的特性提出。

01

GLoRA—高效微调模型参数！

近年来，大规模深度神经网络的显著成就彻底改变了人工智能领域，在各种任务和领域展示了前所未有的性能。这些高度复杂的模型，通常具有数百万甚至数十亿个参数，在计算机视觉、自然语言理解和语音识别等领域表现出了卓越的能力。

01

【技术综述】计算机审美，学的怎么样了？

究竟什么是图像美学质量呢？牛津高阶英语词典将美学定义为：“concerned with beauty and art and the understanding of beautiful things, and made in an artistic way and beautiful to look at.”视觉美学质量是视觉感知美的一种度量。图像的视觉美学质量衡量了在人类眼中一幅图像的视觉吸引力。由于视觉美学是一个主观的属性，往往会涉及情感和个人品味，这使得自动评估图像美学质量是一项非常主观的任务。然而，人们往往会达成一种共识，即一些图像在视觉上比其他图像更有吸引力，这是新兴研究领域——可计算美学的原理之一。计算美学探索如何用可计算技术来预测人类对视觉刺激产生的情绪反应，使计算机模仿人类的审美过程，从而用可计算方法来自动预测图像的美学质量。

02

fastPET-LD——快速PET-CT病灶检测

今天将分享PET-CT病灶检测的完整实现过程，为了方便大家学习理解整个流程，将整个流程步骤进行了整理，并给出详细的步骤结果。感兴趣的朋友赶紧动手试一试吧。

06

【业界】Booking.com如何使用Kubernetes进行机器学习

AiTechYun 编辑：nanan 在今年的QCon伦敦会议上，Booking.com的开发者Sahil Dua介绍了他们是如何使用Kubernetes为他们的客户推荐目的地和住宿的机器学习(ML)

03

[计算机视觉论文速递] 2018-04-03

通知：这篇文章有9篇论文速递信息，涉及人脸、目标检测、显著性目标检测和图像分割等方向往期回顾 TensorFlow.js人脸识别—玩转吃豆豆小游戏 [计算机视觉论文速递] 2018-03-31 YOLOv3：你一定不能错过 Face [1]《Learning to Anonymize Faces for Privacy Preserving Action Detection》 Abstract：人们越来越担心计算机视觉设备通过录制不需要的视频会侵犯用户的隐私。一方面，我们希望相机系统/机器人能够通

09

Chronos: 将时间序列作为一种语言进行学习

这是一篇非常有意思的论文，它将时间序列分块并作为语言模型中的一个token来进行学习，并且得到了很好的效果。

01

首发 | 旷视14篇CVPR 2019论文，都有哪些亮点？

回顾 CVPR 2018 ，旷视科技有 8 篇论文被收录，如高效的移动端卷积神经网络 ShuffleNet、语义分割的判别特征网络 DFN、优化解决人群密集遮挡问题的 RepLose、通过角点定位和区域分割优化场景文本检测的一种新型场景文本检测器、率先提出的可复原扭曲的文档图像等等。

02

Cycle-Dehaze: Enhanced CycleGAN for Single Image Dehazing

在这篇文章中，我们提出了一个端到端的网络，称为Cycle-Dehaze，为单一图像去雾问题，它配对的有雾图像和其对应的图像进行训练。也就是说，我们通过以不成对的方式加入干净和模糊的图像来训练网络。此外，所提出的方法不依赖于大气散射模型参数的估计。我们的方法通过结合循环一致性和感知损失来增强CycleGAN方法，以提高纹理信息恢复的质量，并生成视觉上更好的无雾霾图像。典型地，用于去雾的深度学习模型将低分辨率图像作为输入并产生低分辨率输出。然而，在NTIRE 2018单幅图像去雾挑战中，提供了高分辨率图像。因此，我们应用双三次降尺度。从网络获得低分辨率输出后，我们利用拉普拉斯金字塔将输出图像提升到原始分辨率。我们在NYU-Depth、, I-HAZE, and O-HAZE数据集上进行了实验。大量实验表明，该方法从定量和定性两个方面改进了CycleGAN方法。

02

美团视觉GPU推理服务部署架构优化实践

面对在线推理服务使用的GPU资源不断增加、GPU利用率普遍较低的挑战，美团视觉研发团队决定通过模型结构拆分和微服务化进行优化，他们提出了一种通用高效的部署架构，来解决这种常见的性能瓶颈问题。

05

【学习图片】15.图像内容分发网络

你可能已经熟悉内图像内容分发网络（CDN）的核心概念：一个分布但相互连接的服务器网络，可以快速高效地向用户提供资源。当文件上传到CDN提供商时，该文件的副本将在全球CDN网络的其他节点上创建。当用户请求文件时，数据将由地理位置最近的节点发送给该用户，从而减少延迟。CDN的分布式特性还提供了冗余性，以防网络故障或硬件故障，并进行负载平衡以减轻流量峰值。

05

深度学习经典网络解析：8.R-CNN

目标检测（Object Detection) 就是一种基于目标几何和统计特征的图像分割，它将目标的分割和识别合二为一，通俗点说就是给定一张图片要精确的定位到物体所在位置，并完成对物体类别的识别。其准确性和实时性是整个系统的一项重要能力。

03

47年前经典影片另类重制，从宇宙到原子皆是生成

以躺在草坪上的男人为中心，将镜头画面按照 10 倍的比例不断扩展，你将看到一亿光年外的场景。

01

一张照片获得3D人体信息，云从科技提出新型DenseBody框架

多年以来，如何从单一图像估计人体的姿势和形状是多项应用都在研究的问题。研究者提出不同的方法，试图部分或者联合地解决此问题。本文将介绍一种端到端的方法，使用 CNN 直接从单个彩色图像重建完整的 3D 人体几何。

03

2022年AI顶级论文 —生成模型之年（下）

📷 过去十年来，人工智能技术在持续提高和飞速发展，并不断冲击着人类的认知。 2012年，在ImageNet图像识别挑战赛中，一种神经网络模型（AlexNet）首次展现了明显超越传统方法的能力。 2016年，AlphaGo在围棋这一当时人们认为其复杂性很难被人工智能系统模拟的围棋挑战赛中战胜了世界冠军。 2017年，Google的Ashish Vaswani等人提出了 Transformer 深度学习新模型架构，奠定了当前大模型领域主流的算法架构基础。 2018年，谷歌提出了大规模预训练语言模型 BERT

02

光流法与直接法视觉里程计

根据使用的图像信息不同，可分为：稀疏直接法：只处理稀疏角点或关键点稠密直接法：使用所有像素半稠密直接法：使用部分梯度明显的像素

01

Hinton最新研究：神经网络的未来是前向-前向算法

大数据文摘授权转载自AI科技评论作者：李梅、黄楠编辑：陈彩娴过去十年，深度学习取得了惊人的胜利，用大量参数和数据做随机梯度下降的方法已经被证明是有效的。而梯度下降使用的通常是反向传播算法，所以一直以来，大脑是否遵循反向传播、是否有其它方式获得调整连接权重所需的梯度等问题都备受关注。图灵奖得主、深度学习先驱 Geoffrey Hinton 作为反向传播的提出者之一，在近年来已经多次提出，反向传播并不能解释大脑的运作方式。相反，他正在提出一种新的神经网络学习方法——前向-前向算法（Forward‑For

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭