开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

用于比较相同体系结构中的训练损失的指标

在比较相同体系结构中的训练损失时，常用的指标有均方误差（Mean Squared Error，MSE）和交叉熵（Cross Entropy）。

均方误差（MSE）是一种常用的回归问题损失函数，用于衡量预测值与真实值之间的差异。它计算预测值与真实值之间差的平方的平均值。MSE越小，表示预测结果与真实值越接近。在训练神经网络等模型时，通常使用梯度下降等优化算法来最小化MSE。

应用场景：均方误差适用于回归问题，如房价预测、股票价格预测等。

推荐的腾讯云相关产品：腾讯云AI Lab提供了一系列人工智能相关的产品和服务，包括AI推理服务、AI训练平台等，可用于训练和部署模型，进行损失指标的比较。具体产品介绍和链接地址请参考：腾讯云AI Lab

交叉熵（Cross Entropy）是一种常用的分类问题损失函数，用于衡量预测值与真实值之间的差异。它计算预测值与真实值之间的交叉熵，交叉熵越小，表示预测结果与真实值越接近。在训练神经网络等模型时，通常使用梯度下降等优化算法来最小化交叉熵。

应用场景：交叉熵适用于分类问题，如图像分类、文本分类等。

推荐的腾讯云相关产品：腾讯云AI Lab提供了一系列人工智能相关的产品和服务，包括AI推理服务、AI训练平台等，可用于训练和部署模型，进行损失指标的比较。具体产品介绍和链接地址请参考：腾讯云AI Lab

以上是对比较相同体系结构中的训练损失指标的概念、分类、优势、应用场景以及推荐的腾讯云相关产品的回答。

相关搜索:绘制训练运行损失和仅从第n个时期开始的指标配置中的传递损失函数和指标用于训练具有对比损失的排名模型的批量结构？如何编写仅用于正则化损失的自定义指标？GAN模型训练中损失函数的不变多GPU训练中的损失函数(PyTorch)用于三重损失训练的自定义精度函数用于训练模型的Keras F1分数指标 Keras序列模型没有训练(固定在相同的精度和损失上)如何在tensorflow python中打印训练过程中的训练损失机器学习中的“训练损失”是什么意思？为什么训练具有伪Huber损失的Xgboost模型会返回一个恒定的测试指标？用于图像分割CNN的keras中的自定义损失函数的nan损失如何使用特征来评估不用于训练模型的自定义TensorFlow指标为什么我的损失计算正确作为一个指标，而不是作为TensorFlow中的损失？评估在Spacy中训练的NER模型的好指标是什么用于比较相同输入的不同散列的散列算法只比较sql中相同的PlayerId 相同或不同目录树中的不同体系结构？如何将相同的PCA应用于训练和测试集

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

更宽还是更深？Google AI：广度网络和深度网络能学到同样的东西吗？

流行的神经网络，如EfficientNet，ResNet和Transformers都具有可灵活调整深度和宽度的体系结构。但是，除了对准确性的影响外，对于这些架构设计的基本选择如何影响对模型的理解还很有限。

02

图像分割中的深度学习：U-Net 体系结构

原标题 | Deep Learning for Image Segmentation: U-Net Architecture

01

谷歌重磅开源新技术：5行代码打造无限宽神经网络模型，帮助“打开ML黑匣子”

最近的许多研究结果表明，无限宽度的DNN会收敛成一类更为简单的模型，称为高斯过程（Gaussian processes）。

02

一种先分割后分类的两阶段同步端到端缺陷检测方法

论文地址：https://arxiv.org/pdf/2007.07676.pdf

02

广度网络和深度网络学到的东西是一样的吗？

要提高神经网络性能并使其适配可用计算资源，一个常见做法是调整结构的深度和宽度。实际上流行的神经网络系列，包括 EfficientNet、 ResNet 和 Transformers，都是由一组灵活深度和宽度的结构组成。但是除了对准确率的影响之外，目前对于这些结构设计的基本选择如何影响模型的理解是很有限的，例如对其内部表征（internal representations）的影响。

04

使用生成式对抗网络从随机噪声中创建数据

由于最近几周工作紧以及该文涉及机器学习，翻译有点水的厉害。推荐不要在这浪费时间还是直接看英文原文的好。

02

图像分割中的深度学习：U-Net 体系结构

原标题 | Deep Learning for Image Segmentation: U-Net Architecture

01

CVPR2022 | 可精简域适应

深度神经网络通常对离线采集的图像（标记的源数据）进行训练，然后嵌入到边缘设备中，以测试从新场景中采集的图像（未标记的目标数据）。在实践中，这种模式由于域转移而降低了网络性能。近年来，越来越多的研究者对无监督领域适应（UDA）进行了深入研究，以解决这一问题。

03

图像分割中的深度学习：U-Net 体系结构

原标题 | Deep Learning for Image Segmentation: U-Net Architecture

02

Cycle-Dehaze: Enhanced CycleGAN for Single Image Dehazing

在这篇文章中，我们提出了一个端到端的网络，称为Cycle-Dehaze，为单一图像去雾问题，它配对的有雾图像和其对应的图像进行训练。也就是说，我们通过以不成对的方式加入干净和模糊的图像来训练网络。此外，所提出的方法不依赖于大气散射模型参数的估计。我们的方法通过结合循环一致性和感知损失来增强CycleGAN方法，以提高纹理信息恢复的质量，并生成视觉上更好的无雾霾图像。典型地，用于去雾的深度学习模型将低分辨率图像作为输入并产生低分辨率输出。然而，在NTIRE 2018单幅图像去雾挑战中，提供了高分辨率图像。因此，我们应用双三次降尺度。从网络获得低分辨率输出后，我们利用拉普拉斯金字塔将输出图像提升到原始分辨率。我们在NYU-Depth、, I-HAZE, and O-HAZE数据集上进行了实验。大量实验表明，该方法从定量和定性两个方面改进了CycleGAN方法。

02

如何量化医学图像分割中的置信度？

来源：AI公园深度学习爱好者本文约2700字，建议阅读6分钟本文介绍了利用变分推断进行分割置信度的预测。在过去的十年里，深度学习在一系列的应用中取得了巨大的成功。然而，为了验证和可解释性，我们不仅需要模型做出的预测，还需要知道它在做出预测时的置信度。这对于让医学影像学的临床医生接受它是非常重要的。在这篇博客中，我们展示了我们在韦洛尔理工学院进行的研究。我们使用了一个基于变分推理技术的编码解码架构来分割脑肿瘤图像。我们比较了U-Net、V-Net和FCN等不同的主干架构作为编码器的条件分布采样数据。我们

02

基于转移学习的图像识别

算法该如何分辨这只狗可能属于哪个品种？当然小伙伴们可以训练自己的卷积神经网络来对这张图片进行分类，但是通常情况下我们既没有GPU的计算能力，也没有时间去训练自己的神经网络。但是，全世界的各个研究团队（例如牛津，谷歌，微软）都拥有足够的计算能力，时间和金钱，而且以前可能已经解决过一些类似的问题。我们该如何利用他们已经完成的工作呢？现在来让我们了解一个重要的概念——转移学习。

02

又一新框架｜无监督图像转换任务新境界（附论文代码）

2020 IEEE国际计算机视觉与模式识别会议（IEEE Conference on Computer Vision and Pattern Recognition，简称CVPR）公布接收论文结果。清华大学计算机系“类脑计算与认知”团队提交的论文《Reusing Discriminators for Encoding Towards UnsupervisedImage-to-Image Translation》被成功接收。论文第一作者为陈润发，是清华大学计算机系硕士二年级研究生；指导老师为孙富春教授（中国人工智能学会副理事长，清华大学教授，IEEE/CAAI Fellow）等。

03

使用深度学习进行分心驾驶检测

https://github.com/Apoorvajasti/Distracted-Driver-Detection

02

【干货】深度学习中的数学理解— 教你深度学习背后的故事

【导读】如今，深度学习在各项任务中所向披靡，比如图像识别，语音处理和自然语言处理。但是，深度学习的理论探讨却比应用滞后好几个数量级，一方面是做应用马上能见效，然后会有很多人尝试，另一个方面是做理论研究门槛相对比较高。本文是ICCV 2017上《深度学习中的数学理解》（Tutorial on the Mathematics of Deep Learning）教程的论文总结，从网络架构、正则化技术和优化算法三个方面解释深度学习成功背后的数学理论支撑，并详细讲解全局最优性、几何稳定性、学习表征不变性等网络特性的数

07

8 篇论文深入学习深度估计：深度预测；自我运动学习；观看冰雪奇缘了解移动人物深度

原文标题：Research Guide for Depth Estimation with Deep Learning

02

最先进的NAS算法不如随机搜索，瑞士学者研究结果让人吃惊，也令人怀疑

来自瑞士电信和EPFL的研究者提出了一种评价NAS搜索阶段的测试基准。他们发现，最先进的三种NAS算法DARTS、NAO、ENAS往往与随机搜索完全相同，甚至在某些情况下还不如随机搜索。

04

论文笔记系列-Neural Network Search ：A Survey

论文笔记 NAS automl survey review reinforcement learning Bayesian Optimization evolutionary algorithm

03

CVPR 2021 | AttentiveNAS：通过注意力采样改善神经架构搜索

神经结构搜索(NAS)在设计最先进的(SOTA)模型方面表现出了巨大的潜力，既准确又快速。近年来，BigNAS 等两阶段 NAS 将模型训练和搜索过程解耦，取得了良好的搜索效率。两阶段 NA S在训练过程中需要对搜索空间进行采样，这直接影响最终搜索模型的准确性。尽管均匀抽样的广泛应用是为了简化，但它不考虑模型性能的帕累托前沿，而帕累托前沿是搜索过程中的主要关注点，因此错过了进一步提高模型精度的机会。在这项工作中，我们建议关注于采样网络，以提高性能的帕累托。在训练过程中，本文还提出了有效识别帕累托网络的算法。无需额外的再训练或后处理，就可以通过广泛的 FLOPs 同时获得大量的网络。本文发现的模型家族 AttentiveNAS 模型在 ImageNet 上的准确率最高，从77.3%到80.7%，优于包括 BigNAS、Once-for-All networks 和 FBNetV3 在内的 SOTA 模型。并且本文还实现了 ImageNet 的精度为80.1%，只需491 MFLOPs。

02

元学习—Meta Learning的兴起

【导读】元学习描述了训练深度神经网络相关的更高级别的元素。在深度学习文献中，“元学习”一词经常表示神经网络架构的自动化设计，经常引用“ AutoML”，“少量学习”或“神经架构搜索”。OpenAI的魔方机器人手的成功源于诸如“通过梯度下降学习如何通过梯度下降学习”之类的可笑标题的论文，证明了该想法的成熟。元学习是推动深度学习和人工智能技术发展的最有希望的范例。

01

【翻译】Robust Graph Neural Networks 稳健的图神经网络

作为机器学习 (ML) 中的标准，GNN 假设训练样本是随机均匀选择的（即，是独立同分布或“IID”样本）。使用标准学术数据集很容易做到这一点，这些数据集是专门为研究分析而创建的，因此每个节点都已经被标记。

01

基于图像的三维物体重建：在深度学习时代的最新技术和趋势综述之性能比较和未来研究方向

本节讨论一些关键方法的性能，下面将介绍各种性能标准和度量，并讨论和比较一些关键方法的性能。

02

【GAN全局实用手册】谷歌大脑最新研究，Goodfellow力荐

【新智元导读】随着GAN越来越多的应用到实际研究当中，其技术中的缺陷与漏洞也随之出现。从实际角度对GAN的当前状态进行深入挖掘与理解就显得格外重要。来自Google Brain的Karol Kurach等人重现了当前的技术发展水平，探索GAN的景观，并讨论常见的陷阱和可重复性等问题。

00

Uber的综合训练数据将深度学习速度提高了9倍

Uber AI实验室已经开发了一种称为生成教学网络（GTN）的算法，该算法可为神经网络生成综合训练数据，与使用真实数据相比，该方法可使网络的训练速度更快。利用这些综合数据，Uber加快了9倍的神经体系结构搜索（NAS）深度学习优化过程。

02

简单介绍 TF-Ranking

排序是机器学习场景中最常见的问题之一。从搜索到推荐系统，排名模型是许多主流机器学习体系结构的重要组成部分。在机器学习理论中，排序方法通常使用像learning-to-rank(LTR)或machine learning ranking机器学习排序(LTR)这样的术语。尽管具有相关性，但是在大多数机器学习框架中，大规模开发LTR模型仍然是一个挑战。最近，来自谷歌的人工智能(AI)工程师引入了TF-Ranking，这是一个基于TensorFlow的框架，用于构建高度可伸缩的LTR模型。几周前发表的一篇研究论文详细阐述了TF-Ranking背后的原则。

02

Science：有调查有真相！某些AI领域多年无实际进展

5月29日，Science刊登了一篇标题为“人工智能某些领域的核心进展一直停滞不前”的文章，在文章里，作者Matthew Hutson提到：一些多年之前的“老算法”如果经过微调，其性能足以匹敌当前的SOTA。

02

谷歌 | 宽模型和深模型学到的，一样吗？

作者｜Thao Nguyen, AI Resident, Google Research

02

DIMP：学习判别预测模型的跟踪算法

论文地址：https://arxiv.org/pdf/1904.07220v1.pdf

04

基于Siamese网络的多视角三维人脸重建

ICCV2019已经过去一段时间，但比较优秀好的文献我们还是值得慢慢去品，值得深入阅读去体会作者的意图，从中学习精髓，去发现更多的创新点。

00

无需3D运动数据训练，最新人体姿势估计方法达到SOTA | CVPR 2020

人体的运动对于理解人的行为是非常重要的。尽管目前已经在单图像3D姿势和动作估计方面取得了进展，但由于缺少用于训练的真实的3D运动数据，因此现有的基于视频的SOTA方法无法产生准确且自然的运动序列。为了解决这个问题，本文提出了“用于人体姿势和形状估计的视频推理”（VIBE）方法，它利用了现有的大规模运动捕捉数据集（AMASS）以及未配对的2D关键点标注数据。

01

SiMBA：基于Mamba的跨图像和多元时间序列的预测模型

这是3月26日新发的的论文，微软的研究人员简化的基于mamba的体系结构，并且将其同时应用在图像和时间序列中并且取得了良好的成绩。

01

ICCV 2021 | R-MSFM: 用于单目深度估计的循环多尺度特征调制

标题：R-MSFM: Recurrent Multi-Scale Feature Modulation for Monocular Depth Estimating(ICCV-2021)

02

入门必备 | 一文读懂神经架构搜索

近期谷歌大脑团队发布了一项新研究：只靠神经网络架构搜索出的网络，不训练，不调参，就能直接执行任务。

01

入门项目数字手写体识别：使用Keras完成CNN模型搭建

对于图像分类任务而言，卷积神经网络（CNN）是目前最优的网络结构，没有之一。在面部识别、自动驾驶、物体检测等领域，CNN被广泛使用，并都取得了最优性能。对于绝大多数深度学习新手而言，数字手写体识别任务可能是第一个上手的项目，网络上也充斥着各种各样的成熟工具箱的相关代码，新手在利用相关工具箱跑一遍程序后就能立刻得到很好的结果，这时候获得的感受只有一个——深度学习真神奇，却没能真正了解整个算法的具体流程。本文将利用Keras和TensorFlow设计一个简单的二维卷积神经网络（CNN）模型，手把手教你用代码完成MNIST数字识别任务，便于理解深度学习的整个流程。

01

使用激光雷达数据进行自动驾驶汽车的3D对象检测

两者之间的区别在于，在两个阶段的检测器中，第一阶段使用区域提议网络来生成关注区域，第二阶段使用这些关注区域进行对象分类和边界框回归。另一方面，单级检测器使用输入图像直接学习分类概率和边界框坐标。因此，这些架构将对象检测视为简单的回归问题，因此速度更快但准确性较低。

02

计算机网络与网络体系结构

如今，互联网越来越深入人们的生活了，而且，越来越多的终端被接入互联网。比如，手机、冰箱、电视机、汽车，还有工作中的打印机、工作站、PC、服务器等等，通过网络我们可以实现文件的上传和下载，信息的传递和获取，实时设备信息的上报，网上购物，网上订票等等。那么终端之间是如何在互联网络中通信的呢？

02

谷歌推出TF-Ranking：用于排序算法的可扩展TensorFlow库

在诸如此类的应用程序中，研究人员经常使用一组名叫Learning to Rank的有监督机器学习技术。

03

ICLR2020 | 谷歌最新研究：用“复合散度”量化模型合成泛化能力

据官方消息，ICLR 2020会议将取消线下会议，并于4月25日-30日线上举办虚拟会议。本届会议共有 2594篇投稿，其中 687篇论文被接收（48篇oral论文，107篇spotlight论文和531篇poster论文），接收率为26.5%。

02

神经网络架构搜索(NAS)

我们大多数人可能都知道ResNet的成功，它是2015年ILSVRC图像分类、检测和定位的大赢家，也是2015年MS COCO检测和分割的大赢家。它是一个巨大的体系结构，到处都有跳跃连接。当我使用这个

03

麻省理工HAN Lab | ProxylessNAS自动为目标任务和硬件定制高效CNN结构(文末论文及源码)

今天分享的这篇文章主要解决NAS代理机制下无法搜索到全局最优的问题，改进搜索策略，一定程度上解决资源消耗的问题。其主要是基于DARTs改的，那就先谈谈DARTs的一些问题：

02

APQ：联合搜索网络架构、剪枝和量化策略

本文提出APQ，以便在资源受限的硬件上进行有效的深度学习推理。与以前分别搜索神经体系结构，修剪策略和量化策略的方法不同，本文以联合方式优化它们。为了应对它带来的更大的设计空间问题，一种有前途的方法是训练量化感知的准确性预测器，以快速获得量化模型的准确性，并将其提供给搜索引擎以选择最佳拟合。但是，训练此量化感知精度预测器需要收集大量量化的<model，precision>对，这涉及量化感知的微调，因此非常耗时。为了解决这一挑战，本文建议将知识从全精度（即fp32）精度预测器转移到量化感知（即int8）精度预测器，这将大大提高采样效率。此外，为fp32精度预测器收集数据集只需要通过从预训练的 once-for-all 网络中采样就可以评估神经网络，而无需任何训练成本。ImageNet 上的大量实验证明了联合优化方法的好处。与MobileNetV2 + HAQ 相比，APQ 以相同的精度将延迟降低2倍，能耗降低1.3倍。与单独的优化方法（ProxylessNAS + AMC + HAQ ）相比，APQ可提高ImageNet精度2.3％，同时减少GPU数量级和CO2排放量，从而推动了绿色AI在环保方面的前沿。

03

总结神经网络架构搜索(NAS算法)

我们大多数人可能都知道ResNet的成功，它是2015年ILSVRC图像分类、检测和定位的大赢家，也是2015年MS COCO检测和分割的大赢家。它是一个巨大的体系结构，到处都有跳跃连接。当我使用这个

02

深度学习的未来：神经网络架构搜索(NAS)

编译 | sunlei 发布 | ATYUN订阅号我们大多数人可能都知道ResNet的成功，它是2015年ILSVRC图像分类、检测和定位的大赢家，也是2015年MS COCO检测和分割的大赢家。

03

麻省理工 | ProxylessNAS自动为目标任务和硬件定制高效CNN结构(文末论文及源码)

今天分享的这篇文章主要解决NAS代理机制下无法搜索到全局最优的问题，改进搜索策略，一定程度上解决资源消耗的问题。其主要是基于DARTs改的，那就先谈谈DARTs的一些问题：

01

UMCP提出对损失函数进行可视化，以提高神经网络的训练能力

原文来源：arxiv 作者：Hao Li、Zheng Xu、Gavin Taylor、Tom Goldstein 「雷克世界」编译：嗯~阿童木呀、KABUDA 一般来说，我们对于神经网络的训练，往往依赖于找到高度非凸损失函数的“极好”极小值的能力。众所周知，某些网络体系结构的设计（例如，跳过连接）能够产生更容易进行训练的损失函数，且用精心挑选的参数（批量大小，学习速率，优化器）进行训练则能够产生可以进行更好泛化的最小化值。然而，这些差异之所以产生的原因，以及它们对潜在损失情况（loss landsc

09

亲手养成一只自己的动漫主播！单张头像生成动画，可指定姿态或真人视频迁移

有个小哥因为对动漫网红主播太着迷了，于是他用深度神经网络简化了动画生成过程。具体来说，就是将动漫人物的脸部和期望的姿势等图像输入神经网络，从而生成给定姿势的输出图像。

02

Tensorflow入门教程（四十八）——Seg-GLGAN

今天将分享Unet的改进模型Seg-GLGAN，改进模型来自2020年的论文《A CONTEXT BASED DEEP LEARNING APPROACH FORUNBALANCED MEDICAL IMAGE SEGMENTATION》，简单明了给大家分析理解该模型思想。

02

【年度系列】使用Tensorflow预测股票市场变动

我们将使用Tensorflow创建和开发一个简单的模型框架，以及提出一些对初步结果改进的意见。

03

使用GAN绘制像素画，用机器学习的方式协助绘画者更快地完成作品

上面的图片来自Trajes Fatais：Feats of Fate游戏，我作为首席开发者从事该游戏的制作。长话短说，每个精灵要绘制大约一小时，每个角色平均要绘制五百个精灵。在“游戏的机器学习辅助资料生成：像素绘画Sprite表格研究”中，我们探索了Pix2Pix架构来自动生产Sprite的流程，将每个Sprite花费的平均时间减少了15分钟（〜25％）。这是我们首次发表的有关精灵生成的工作，我们希望在将来进一步改进它。

01

Pytorch的十二生肖分类挑战

在贝塔斯曼AI Udacity奖学金中，学者们不仅必须完成AI Udacity课程，而且还相互挑战，以应用在课程中收集和实践的技能和知识。这些挑战之一是中国十二生肖分类挑战。马上就是中国农历新年之际。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭