首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【人工智能】技术总结

可以理解为线性回归的扩展 欠拟合与过拟合 欠拟合:拟合程度不够,模型没有学习到数据的真实变化规律,表现为训练集、测试集下准确率都比较低。...解决方法:增加模型复杂度、增加特征 过拟合:模型过分拟合与训练样本,导致泛化能力不足,表现为在训练集准确率较高、测试集下准确率较低。...聚类问题 1)定义:无监督学习,根据样本的相似度,将其划分放到不同的聚簇,同一个聚簇样本相似度较高,不同的聚簇样本相似度较低 2)样本相似度的度量:距离 欧氏距离 曼哈顿距离 切比雪夫距离 闵氏距离 3...损失函数与梯度下降 1)损失函数:度量真实值、预测值之间的差异,用来评估模型的优劣 均方差:回归问题使用 交叉熵:分类问题使用 2)梯度下降:沿着梯度负方向逐步调整每个模型参数 4....简单的问题选择简单模型,复杂的问题选择复杂模型 如果不确定使用哪个模型,通过实验对比择优选择 在有些情况下,可以采用多个模型配合使用,发挥各自特长 7)什么情况下选择纯图像,什么情况下选择深度学习?

84920

机器学习模型性能的10个指标

对机器学习而言, 也不用言必深度学习与神经网络,关键在于明确问题的边界。 那么在使用ML解决相对简单问题的时候,如何评估一个机器学习模型的性能呢?...通过简单地计算模型正确预测的实例数量与数据集中总实例数量的比例,准确率提供了一个直观的方式来衡量模型的准确性。 然而,准确率作为一个评价指标,在处理不平衡数据集时可能会显得力不从心。...准确率关注模型预测的正确性,而召回率则关注模型是否能够找到所有实际的正样本。然而,过分强调其中一个指标往往会损害另一个指标的性能。...它提供了一个单一的分数,简化了模型性能的评估过程,并且帮助我们更好地理解模型在实际应用中的表现。 5. ROC-AUC ROC-AUC是一种在二进制分类问题中广泛使用的性能度量方法。...交叉熵损失的优势在于它能够很好地衡量模型对于概率分布的预测准确性。当模型的预测概率分布与实际标签分布相近时,交叉熵损失的值较低;反之,当预测概率分布与实际标签分布差异较大时,交叉熵损失的值较高。

3.8K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    用于大规模图像检索的深度哈希网络研究

    哈希算法的核心就是如何获得有效的哈希函数,将图像特征向量映射成为紧凑的二进制码,这样会大大减少图像存储的空间消耗,并且利用汉明距离进行图像检索的时候也会减少计算的复杂度,提升了时间效率。...,然后产生0和1的比特,并将其作为图像的哈希编码。...现代计算机处理二进制比特速度比较快,而哈希算法就是把数据压缩成为二进制码,利用异或操作从而提高了算法的速度。...2.平均准确率(Mean average precision,MAP)通常也叫做均值平均精度。 平均准确率计算过程 深层哈希算法 深层哈希算法利用深度学习算法提取图像特征完成算法任务。...而批量归一化的目标就是就是要保证每一层的数据分布正常,(分布指的是标准正太分布),这样获得的输入值就会落入激活函数的敏感区域,而损失函数会在输入值有很小变化时发生很大改变,解决了梯度消失的问题,也大大减少了训练时间

    90650

    7个用于改进RAG系统的检索指标

    事实上,可以假设任何基于LLM的应用程序都以某种方式使用了RAG。...通过简短的培训和对有限示例集的验证即可完成。然而,为了提高其鲁棒性,必须在一个能够准确反映生产用例的数据集上进行全面测试。RAG管道可能会产生自身的“幻觉”。...在检索和RAG的背景下,它的计算方式如下: 公式: 准确率 = (检索到的相关文档数量 + 未检索到的不相关文档数量) / 知识库中文档总数 虽然准确率是一个简单直观的指标,但它并不是检索任务的主要指标...在拥有大量文档的知识库中,这一点可能会变得具有挑战性。 注意: 与精确率一样,召回率也不考虑检索结果的排序。它可能会产生误导,因为检索知识库中的所有文档会导致完美的召回率值。...准确率和召回率都为中等时,其 f1 分数会高于一个值非常高而另一个值非常低的情况。 该公式的特点是,当精确率或召回率较低时,F1分数会被惩罚;只有当两者都较高时,才能获得较高的F1分数。

    24310

    深度度量学习的这十三年,难道是错付了吗?

    这样便能够确定性能的优化是新算法带来的提升,而不是由额外的参数造成的。但现有的度量学习论文的研究情况却不是如此。 提高准确率最简单的方法之一是优化网络架构,但这些论文却没有保证这项基本参数固定不变。...度量学习中架构的选择是非常重要的。在较小的数据集上的初始的准确率会随着所选择的网络而变化。2017 年一篇被广泛引用的论文用到了 ResNet50,然后声称性能得到了巨大的提升。...更有信息量的准确率度量指标 研究者用 Mean Average Precision at R (MAP@R) 来度量准确度,这一指标综合了平均精度均值和 R 精度的思想。...表 3-5 展示了训练运行的平均准确率,以及在适用时 95% 的置信区间,加粗部分代表了最好的平均准确率。同时也包括了预训练模型的准确率,用 PCA 将模型的嵌入值减少到 512 或 128。 ?...尽管有这些实现缺陷,大多数论文仍旧只是简单地引用这些较低的数字,而不是依靠自己实现损失去获得一个更有意义的基线。

    77120

    如何通过交叉验证改善你的训练数据集?

    你觉得这95%的准确率真的是实至名归吗? 评估的需求 现在我假设你对数据集的预处理做的十分完美,去除了缺失值、处理了类别数据、消除了噪声。...但是仅仅这样做并不是那么的保险,简而言之,你不能用这样得到的准确率作为这个模型最终的评判标准。这个时候问题就来了,你可能想知道——为什么?...精确度基本上就是你说的所有相关的东西,而召回率是所有真正相关的东西。换句话说,召回率也称为模型的灵敏度,而精确度称为正预测值。...就可以获得一个2 x 2的混淆矩阵(因为垃圾邮件分类是二进制分类),并返回一个涵盖上述所有指标的分类报告。 注意: 真实值作为第一个参数传递,预测值是第二个参数。 ?...通常来说,我们取这k个精度的平均值作为最终的结果。

    4.9K20

    机器学习 Fbeta-Measure 指标详解

    在江西VTE风险预测和山东案件自动分发比赛中,笔者见到了F2-Score评估指标,此类指标与以往F1-Score不同,出题方选择使用不同的beta权重来更加侧重Precision或者Recall某一指标...最大化精度将最小化假阳性错误,而最大化召回将最小化假阴性错误。 的F值被计算为的精确度和召回的调和平均,每一种有相同的加权。...它允许使用单个分数同时考虑精度和召回来评估模型,这在描述模型的性能和比较模型时很有帮助。 所述Fbeta是F值增加了β的配置参数的概括。...较小的 Beta 值,例如 0.5,在计算分数时赋予精度更高的权重而较少召回率,而较大的 Beta 值(例如 2.0)赋予精度较低的权重和较高的召回率权重。...beta 值会导致这种情况下的得分较低,因为精确率得分较低且召回率非常好。

    1.9K20

    整合相似度度量:共识标准推动层剪枝技术的三赢解决方案 !

    作者提出了一种新颖的方法,将多个相似度度量合并为一个单一的表达式低重要性层,称为共识标准。 作者的技术实现了一个三赢解决方案:低精度下降、高性能改进和增强对抗攻击的鲁棒性。...在这些度量的基础上,本文的主要贡献是证明将多个相似度度量作为一个单一的修剪标准可以得到更鲁棒和可靠的修剪模型。因此,将多个相似度度量作为一个修剪标准具有几个好处。...以下三方面尤为突出: 低准确率下降:通过集成多个相似度度量,作者的剪枝方法在压缩率较高时仍能保持高准确率。对层重要性的全面评估降低了在干净图像上保持性能时删除关键层的风险。...这些证据强调了剪枝和对抗防御机制是相互独立的,可以结合使用以产生更加鲁棒模型,提高神经网络在实际任务中的安全性和可靠性。共识技术通过结合多个相似度度量来识别和删除低重要性层来促进这一领域的发展。...作者还探索了这些度量的插值版本,平衡了差异在均值或协方差上的惩罚,提供了一种更全面的神经表示视图[25, 19]。

    10710

    高达87.1%准确率!掩码图像建模新框架

    视觉信号是原始的、低层次的,而文本分词是由人类产生的高级概念。那么,对低层次信号的预测是否对高层次的视觉识别任务有用? 视觉信号是连续的,而文本分词是离散的。...因此,即使使用了较低的掩码率(如10%)或没有掩码周围的所有补丁,它也会迫使网络学习相对较长的连接。...对于随机掩码策略,当补丁大小较小(如4或8)时, AvgDist相对较低,且随着掩码率的增加而增长缓慢。另一方面,当补丁尺寸较大时(如64),很小的掩码率(如10%)仍然会产生较大的AvgDist。...中心掩码和块掩码方法产生的AvgDist值与补丁大小为64的同样高。 图3(b)绘制了微调精度和AvgDist测量之间的关系,它遵循山脊形状。...这可能是因为优异的性能很大一部分用于预测头,而不会用于下游任务。复杂的预测头带来较高的训练成本。作者证明了SimMIM的单个线性层头在微调度量下已经显示出具有竞争力甚至是最优的迁移性能。

    79110

    关于机器学习,不可不知的15个概念

    这四个值构成了大多数分类任务评估指标的基础。它们通常在一个叫作混淆矩阵的表格中呈现(如表1-1)。 ▼表1-1 混淆矩阵 准确率 准确率是分类模型的一个评估指标。...例如,如果你的模型预测了100个癌症的发生,但是其中10个是错误的预测,那么你的模型的精度是90%。在假阳性较高的情况下,精度是一个很好的指标。...召回率 召回率是一个很好的指标,可用于假阴性较高的情况。召回率的定义是真阳性数除以真阳性数加上假阴性数的和。 F1度量 F1度量或F1分数是精度和召回率的调和平均值或加权平均值。...它是评估多类别分类器的常用性能指标。在类别分布不均的情况下,这也是一个很好的度量。最好的F1分数是1,而最差的分数是0。一个好的F1度量意味着你有较低的假阴性和较低的假阳性。...例如,如果k=3,k-fold交叉验证将生成3对训练和测试数据集(每一对仅用作一次测试数据集),其中每一对使用2/3作为训练数据,1/3用于测试。

    31920

    续何恺明的MAE后!MSRA提出掩码图像建模新框架:SimMIM

    视觉信号是原始的、低层次的,而文本分词是由人类产生的高级概念。那么,对低层次信号的预测是否对高层次的视觉识别任务有用? 视觉信号是连续的,而文本分词是离散的。...因此,即使使用了较低的掩码率(如10%)或没有掩码周围的所有补丁,它也会迫使网络学习相对较长的连接。...对于随机掩码策略,当补丁大小较小(如4或8)时, AvgDist相对较低,且随着掩码率的增加而增长缓慢。另一方面,当补丁尺寸较大时(如64),很小的掩码率(如10%)仍然会产生较大的AvgDist。...中心掩码和块掩码方法产生的AvgDist值与补丁大小为64的同样高。 图3(b)绘制了微调精度和AvgDist测量之间的关系,它遵循山脊形状。...这可能是因为优异的性能很大一部分用于预测头,而不会用于下游任务。复杂的预测头带来较高的训练成本。作者证明了SimMIM的单个线性层头在微调度量下已经显示出具有竞争力甚至是最优的迁移性能。

    1K20

    入门 | 机器学习模型的衡量不止准确率:还有精度和召回率

    我们使用调和平均而不是简单的算术平均的原因是:调和平均可以惩罚极端情况。一个具有 1.0 的精度,而召回率为 0 的分类器,这两个指标的算术平均是 0.5,但是 F1 score 会是 0。...可视化精度和召回率 我已经向你抛出了几个新术语,接下来我将通过一个例子向你展示它们在实际中是如何使用的。在使用之前,我们要简单地谈一谈精度和召回率的概念。...这个思想是相当简单的:ROC 曲线展示了当改变在模型中识别为正例的阈值时,召回率和精度的关系会如何变化。...结论 我们倾向于使用准确率,因为每个人都知道它意味着什么,而不是因为它是完成任务的最佳工具!...虽然更适合的度量指标 (如召回率和精度) 看起来可能很陌生,但我们已经直观地了解了为什么它们在某些问题 (如不平衡的分类任务) 中有着更好的表现。统计学为我们提供了计算这些指标的形式化定义和方程。

    1.2K50

    分类指标准确率(Precision)和正确率(Accuracy)的区别「建议收藏」

    特效度(specificity)   specificity = TN/N,表示的是所有负例中被分对的比例,衡量了分类器对负例的识别能力;   5)精度(precision)   精度是精确性的度量,表示被分为正例的示例中实际为正例的比例...7)其他评价指标 计算速度:分类器训练和预测需要的时间; 鲁棒性:处理缺失值和异常值的能力; 可扩展性:处理大数据集的能力; 可解释性:分类器的预测标准的可理解性,像决策树产生的规则就是很容易理解的,而神经网络的一堆参数就不好理解...通常,AUC的值介于0.5到1.0之间,AUC越大,诊断准确性越高。在ROC曲线上,最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。...本文将简单介绍其中几个概念。中文中这几个评价指标翻译各有不同,所以一般情况下推荐使用英文。 现在我先假定一个具体场景作为例子。...F1-measure认为精确率和召回率的权重是一样的,但有些场景下,我们可能认为精确率会更加重要,调整参数a,使用Fa-measure可以帮助我们更好的evaluate结果.

    4.5K10

    机器学习中的新数学,加速AI训练离不开数字表示方式和基本计算的变革

    基本理念是这样的:一个 4-bit 数字只能精确表示 16 个值。因此,每个数字都会四舍五入到这 16 个值的其中一个。这种舍入导致的准确率损失被称为量化误差。...该团队对 RISC-V 指令集的扩展包括一个有效的计算版本,它混合了较低和较高精度的数字表示。凭借改进的混合精度数学,他们在训练神经网络所涉及的基本计算中获得了两倍的加速。...降低精度在基本操作期间不仅会因 bit 减少导致精度损失,还会产生连锁反应。...混合精度对于改善上溢、下溢和 swamping 问题具有重要作用,其中使用低精度输入执行计算并产生更高精度的输出,在舍入到较低精度之前完成一批数学运算。...为了获得混合精度的好处,输入 a 和 b 是低精度(例如 8 bits),而 c 和输出 d 是高精度(例如 16 bits)。

    35130

    不再使用人眼评估,你训练的GAN还OK吗?

    将 Inception 分数(IS)[46] 和 Fr´echet Inception 距离(FID)[22] 作为与生成图像视觉质量相关的临时指标。...我们的第二个指标,GAN-test,是在真实图像上训练并在生成图像上评估得到的网络的准确率。该指标与精确率类似,值比较高意味着生成的样本与(未知)自然图像分布近似。...假设这些数据集大小相同,根据这两个数据集中的任意一个训练出来的分类器应该有同样的验证准确率。当数据集足够简单(例如 MNIST[48])时确实是这样(见 5.2 节)。...不幸的是,我们无法确定 GAN 的问题在哪。当 GAN-train 的准确率与验证集的准确率相近时,意味着 GAN 产生的图像质量很高且和训练集一样多样化。...正如我们在 5.3 节中所说的那样,多样性会随着生成图像数量的变化而变化。我们将在本节末尾的评价讨论中对其进行分析。

    89820

    谷歌最新研究:用性能差的模型计算「相似度」反而更准?

    文中同时研究了神经网络超参数对感知分数的影响,如宽度、深度、训练步数、权重衰减、标签平滑和dropout 对于每个超参数,存在一个最优精度,提高精度可以改善感知评分,但这个最优值相当低,并且在超参数扫描中很早就可以达到...结果还是与提前停止的ResNets观察结果相似,精度较低的较窄的ViT比默认宽度表现得更好。...所以想提升感知相似度,那策略就简单了,适当降低准确率即可。...通过缩小ImageNet模型来提高感知评分,表格中的值表示通过在带有默认超参数的模型上缩放给定超参数的模型而获得的改进 根据上述结论,文中提出了一个简单的策略来改善架构的感知评分:缩小模型来降低准确性,...总之,这篇论文探讨了提高分类精度是否会产生更好的感知度量的问题,研究了不同超参数下ResNets和ViTs上精度与感知评分之间的关系,发现感知评分与精度呈现倒U型关系,其中精度与感知评分在一定程度上相关

    29130

    避坑指南:如何选择适当的预测评价指标?| 程序员评测

    1、Bias Bias 的定义为误差的平均值。此处,n 为历史的时刻数,即预测值与实际值的个数。 ? 由于一个正误差可能会抵消掉另一个负的误差,因此预测模型可能会得到很低的 bias,而精度却很低。...由公式可以看出,MAPE 用每个误差值除以实际值,所以会产生倾斜:若某个时刻的实际值很低,而误差很大,就会对 MAPE 的值产生很大影响。...,我们花点时间来了解为什么以中位数作为预测值会得到较好的 MAE,以及用平均数作为预测值会得到较好的 RMSE。...3、MAPE 遗憾的是,MAPE 的导数不具备直接明了的特性。我们可以简单认为,MAPE 会优先给出较低的预测值,因为当实际值比较低时,预测误差会被分配较高的权重。...你也可以通过简单的除法,把原始时间序列分解到较小的时间范围上。这一方法可以帮助你更好地使用 MAE 作为评估指标,同时对峰值做平滑处理。

    4.7K21

    【剑指Offer】机器学习面试题(1)

    偏倚指的是模型预测值与真实值的差异,是由使用的学习算法的某些错误或过于简单的假设造成的误差。它会导致模型欠拟合,很难有高的预测准确率。...REP简单的来说就是对树的每一个结点进行剪枝,如果剪掉某个结点不会降低模型准确率,那么将其剪掉。这种启发式的做法实际上就是为了最大化准确率。 Q17:模型的精度和模型的性能哪个对你更重要?...许多机器学习的模型会有高的精度,但是预测能力也就是泛化能力较低,如何去理解它们呢? 精度只是模型性能的一部分,有可能是会产生误导的那个。...Q20:什么时候你应该使用分类而不是回归? 分类会产生离散的数值,使得数据严格的分为不同类。回归会得到连续的值,使你更好的区分独立点之间的区别。当你需要知道你的数据明确的属于那些类时你可以用分类。...首先你需要将数据分成训练集和测试集,或者使用给交叉验证方法分割。然后你需要选择度量模型表现的metrics,如F1数、准确率、混淆矩阵等。

    61020

    额叶-小脑连接介导认知加工速度

    条件后分析显示,NEU的准确率显著高于COM,t(170)=6.1p而COM和INC的准确率差异不显著,t(170)=0.055,p=0.998...体素的数量从148到155个不等。 3.3 模型比较 表3列出了套索为每组连通性预测器选择的最佳模型的精度度量。方差分析(ANOVA)检验的AIC表明,所有模型均显著优于相应的零模型。...预测较快CS的路径是较高负RMFC→LIPS(Cohen的 ƒ2=0.232,平均连通性=−0.049,β=-0.301,95%CI:[0.086,0.517],p=0.07),较低负RMFC→Mcv6...值得注意的是,对速度的更强预测来自额叶,而不是小脑起源的连接性。LIFJ与RCH6的正连接性较高,RMFC与MCV6的负连接性较低,RMFC与唇部的负连接性较高,导致速度较快。...相比之下,LCH6与LTHAL和LFEF的负连接性较高,MCV6与RCH6的正连接性较低,从而导致较快的速度。

    74010

    面向高维和不平衡数据分类的集成学习研究论文研读笔记「建议收藏」

    数据不平衡的分类困难的本质原因: 1.不恰当的评估标准:传统的分类算法通常在假设类别平​​衡的前提下,采用分类准确率作为评价标准,以平均准确率最大化为目标当类别不平衡时,为达到精度最大化,往往会牺牲少数类的性能...是一种最简单的思路,利用降维技术降低数据数量,再采用集成学习方法提高准确率的本质特征,提高分类的准确率。 2)先对集成构建的个体子集降维,最后集成投票。...降维方法 Filter特征选择方法的评估直接依赖于数据集本身,通常认为相关性较大的特征或特征子集可获得较高的分类准确率。...CSRF算法借鉴了EG2算法的思想,EG2算法是在C4.5的基础上,修改了属性分裂度量,使用信息代价函数(ICF)作为分裂准则,这一准则同时权衡了信息增益和测试代价两方面的信息。...当小类预测不准确时,予以惩罚,减少多样性度量值,使得不能使小类分类正确的基分类器被抛弃,则可增加小类的分类准确率。 为测试此多样性度量的有效性,集成选择的目标函数仅考虑准确率和多样性的简单求和。

    1.4K40
    领券