正确计算等错误率值

是指在计算机科学和统计学中，用于衡量一个算法或模型在预测或分类任务中的准确性和可靠性的指标。它通常用于评估分类器、回归模型、聚类算法等机器学习和数据挖掘任务的性能。

正确计算等错误率值包括以下几个重要指标：

准确率（Accuracy）：准确率是指分类器在所有样本中正确分类的比例。计算公式为：准确率 = (TP + TN) / (TP + TN + FP + FN)，其中TP表示真正例（True Positive），TN表示真负例（True Negative），FP表示假正例（False Positive），FN表示假负例（False Negative）。腾讯云相关产品推荐：腾讯云机器学习平台（https://cloud.tencent.com/product/tiems）。
精确率（Precision）：精确率是指分类器在所有预测为正例的样本中，真正例的比例。计算公式为：精确率 = TP / (TP + FP)。腾讯云相关产品推荐：腾讯云人工智能开放平台（https://cloud.tencent.com/product/ai）。
召回率（Recall）：召回率是指分类器在所有真实正例中，正确预测为正例的比例。计算公式为：召回率 = TP / (TP + FN)。腾讯云相关产品推荐：腾讯云人工智能开放平台（https://cloud.tencent.com/product/ai）。
F1值（F1-Score）：F1值是精确率和召回率的调和平均值，综合考虑了分类器的准确性和召回性能。计算公式为：F1值 = 2 * (精确率 * 召回率) / (精确率 + 召回率)。腾讯云相关产品推荐：腾讯云人工智能开放平台（https://cloud.tencent.com/product/ai）。
错误率（Error Rate）：错误率是指分类器在所有样本中错误分类的比例。计算公式为：错误率 = (FP + FN) / (TP + TN + FP + FN)。腾讯云相关产品推荐：腾讯云机器学习平台（https://cloud.tencent.com/product/tiems）。

这些指标可以帮助开发工程师和数据科学家评估和比较不同算法或模型的性能，选择最适合特定任务的模型，并进行模型的优化和改进。在实际应用中，根据具体的业务需求和数据特点，选择合适的指标进行评估和优化是非常重要的。

JMeter JDBC数据库测试-最大等待(ms)

、

在JDBC连接配置中，最大等待(ms)值的最佳实践是什么？我正在执行两种类型的测试：每个线程有20个循环--以获得最大线程每个线程数的30分钟运行时-以获得响应时间使用Max Wait =10000 an，我可以使用10、20、30、40、60和80线程执行JDBC请求，而不会出错。使用Max Wait = 20000ms，我可以使用100、120、140个线程执行更高的线程，而不会出现错误。这似乎是合乎逻辑的行为。现在提问。我可以根据需要增加最大等待值吗？如何获得更多的测试结果是正确的方法吗？如果某个报告中出现错误，我是否应该停止测试，并且不增加线程的数量？我从10

浏览 6提问于2016-11-06得票数 1

回答已采纳

1回答

如何检查页面等级的收敛性？

、、

我正在编写一个小代码(顺序)来计算一个普通数据集的页面排名(虽然不是完全琐碎的)。阿尔戈是这样的： while ( not converged ) { // Do a bunch of things to calculate PR } 除了“收敛”准则之外，我还清楚地说明了算法。检查算法是否收敛的最佳方法是什么？我是否应该：检查我保存了一次迭代中所有单个节点的PR的副本，并在下一次迭代中检查所有节点的PR值是否相同？对我来说这似乎是非常低效的。这样做对吗？

浏览 2提问于2015-01-29得票数 4

1回答

人工神经网络基准

有没有什么基准可以用来检查ANN的实现是否正确？我想要一些输入和输出数据，以及一些信息，比如：三层前向神经网络的输出在90%的测试数据中应该是正确的。我需要这些信息来确保这种人工神经网络能够处理这样的问题。

浏览 2提问于2010-03-02得票数 5

回答已采纳

1回答

时间序列模型的选择

、

为了预测新的价值，我为时间序列建立了一个模型。选择正确模式的最佳方式是什么？更好的标准是AIC和BIC，还是预测误差之间的比较？在最后一种情况下，我必须在训练和测试中拆分dataset，而在第一种情况下没有必要，这减少了实现的时间。谢谢!

浏览 0提问于2018-04-19得票数 0

回答已采纳

1回答

如果错误计数增加，在grafana中创建警报的查询是什么？

、、、、

将prometheus集成到我的springboot应用程序中，并使用千分尺计算应用程序中出现的异常，然后添加到prometheus，如下所示： public Sample(MeterRegistry registry) { error_count = Counter .builder("error_count") .description("error processing ").register(registry); } testMethod(){

浏览 4提问于2022-10-07得票数 0

1回答

如何从决策树计算错误率？

、、、

有人知道如何计算带有R的决策树的错误率吗？我使用的是rpart()函数。

浏览 0提问于2012-03-12得票数 31

回答已采纳

1回答

在工作区中创建一个度量指标，用于衡量任何页面从上一页面到特定页面的速率？

我们的站点有几个错误页面，包括一个捕获所有错误的页面，其中包含我们无法识别的错误。我正在尝试在工作空间中创建一个度量，该度量将为我提供任何页面都是捕获所有错误页面的前一页面的速率。这是我尝试过的(不起作用)： ((page=catch-all AND previous page exists)[Unique visitors])/(Page exists[Unique Visitors] 它给我99%的错误页面本身和0%的其他页面。我之前有另一个公式可以正确地处理指定的页面，如下所示： ((page=catch-all AND previous page=specific page)[Un

浏览 2提问于2018-11-26得票数 0

1回答

如何说明准确性/不准确性的可信度？

、

假设我有一个由机器自动获取的数据集，该数据集返回以下度量： [111, 121, 114, 154, 149, 150] 然后，我手动检查机器接收到的这些值与真实值的比较情况，并在手动检查时得到以下测量值： [112, 121, 114, 154, 149, 149] 正如您所看到的，数据集在两个地方不同(我在机器看到111的地方测量了112，在机器看到150时，我测量了149 )，这意味着机器是不准确的。有了它，有什么正确的方法来说明和计算我对机器有多精确或不准确有多自信？我显然可以说这是错误的2/6倍(33%的不准确/66%的准确性)，但我不确定是否有更好的方法来表示这一点，特别是用一个

浏览 0提问于2021-09-01得票数 1

1回答

训练一个弱者

、、、、

我正在使用AdaBoost实现一个应用程序来区分一头大象是亚洲的还是非洲的。我的输入数据是： Elephant size: 235 Elephant weight: 3568 Sample weight: 0.1 Elephant type: Asian Elephant size: 321 Elephant weight: 4789 Sample weight: 0.1 Elephant type: African Elephant size: 389 Elephant weight: 5689 Sample weight: 0.1 Elephant type: Afric

浏览 1提问于2012-08-26得票数 3

回答已采纳

1回答

假阳性数布隆过滤器

、、、

我实现了一个带有3个哈希函数的布隆过滤器，现在我应该计算该过滤器中的误报(而不是可能性)的确切数量。有没有一种有效的方法来计算？过滤器中的项数为2亿，位数组大小为4亿

浏览 36提问于2019-11-23得票数 0

2回答

为什么在deepnet R封装的nn.test函数中，错误计数会被除以2？

我不明白为什么在deepnet R包的nn.test函数中error_count的计算会有‘/2’(除以2)，如下所示。 function (nn, x, y, t = 0.5) { y_p <- nn.predict(nn, x) m <- nrow(x) y_p[y_p >= t] <- 1 y_p[y_p < t] <- 0 error_count <- sum(abs(y_p - y))/2 error_count/m } 对我来说，"error_count <- sum(abs(

浏览 0提问于2014-12-17得票数 0

1回答

是否有一种说话人对文本对话的误码率算法？

、

一些语音对文本的服务，如Google语音到文本，通过对话提供说话人的区分，它试图识别和分离单个音频记录上的多个扬声器。这是经常需要的，当多个发言者在会议室共用一个麦克风。是否有算法和实现来计算说话人分离的正确性？这将与一起使用，后者通常用于检验基线转录的正确性。

浏览 2提问于2019-08-27得票数 0

回答已采纳

1回答

ElasticSearch中唯一嵌套文档的计数

、

问题域有许多标记被显示在报亭上。一个令牌只由一个发行人发行，它可以出现在多个信息亭上。kiosk逻辑根据该kiosk上存在的令牌接受/拒绝用户。我们的弹性映射是： "mappings": { "Kiosk": { "dynamic": "strict", "properties": { "kioskId": { "type": "keyword" }, "token

浏览 7提问于2017-06-18得票数 1

回答已采纳

2回答

CRC存储在16位，有一个额外的值表示未初始化的crc值？

出于功能安全的原因，为了保护数据，我需要存储一个crc-16或类似的。数据长度将高达80个字节。我需要使用16位值中的一个值来表示，数据是有意修改的，crc还没有计算出来。据我所知，16位值的每一个值都可能是CRC-16的结果。没有未使用的值可以表示“未初始化”。什么是最好的解决方案？以"0“作为未初始化的值，如果计算传递"0"，则存储"1”。使用较小的CRC，例如CRC-15。有更好的解决方案吗？我使用C和C++，但这不应该起到很大的作用。更新，考虑到rcgldr使用CRC-15的建议:我将计算CRC -15值(为32767.32767)或值65

浏览 1提问于2021-07-09得票数 0

2回答

两个矢量MATLAB的比较

我想得到两个向量的错误率吗？喜欢 # incorrect numbers 6 error rate = ______________________ = ____ # total numbers(size) 15 这里是15数字，9是正确的，x是真正的答案(参考)，y是向量和答案，我想比较它们，得到错误率： x= [1 ,1,1, 1,1, 1,1,1,1,1, 1,-1,-1,-1,-1] y= [-1,1,1,-1,1,-1,1,1,1,1,-1, 1,-1, 1,-1]

浏览 1提问于2011-03-21得票数 1

回答已采纳

1回答

Fast.Ai EarlyStoppingCallback不工作

、、

callbacks = [EarlyStoppingCallback(learn, monitor='error_rate', min_delta=1e-5, patience=5)] learn.fit_one_cycle(30, callbacks=callbacks, max_lr=slice(1e-5,1e-3)) 正如您所看到的，我使用耐心=5和min_delta=1e-5，监视器=‘错误率’。 --我的理解是:如果在被监控的值上的改进小于min_delta，耐心会告诉它等待了多少个时代，在本例中是error_rate。因此，如果我的理解是正确的，那么

浏览 10提问于2019-12-29得票数 0

1回答

C参数不会影响精度[字符串数据的LibSVM]

、、、、

我正在使用支持向量机解决蛋白质分类问题，因此我使用LibSVM处理字符串数据。定义到LibSVM中的字符串核是编辑距离核，它取决于参数gamma。在交叉验证期间，改变C和gamma参数，我在每种方式上都获得了75%的准确率！此外，还改变了训练集模式的数量，我得到了同样的准确率。我使用SCOP数据库。我对这种行为一无所知！

浏览 0提问于2014-06-24得票数 1

1回答

理解在R中使用xgboost执行交叉验证的错误

、

我在R中使用xgboost运行交叉验证。 library(xgboost) data(agaricus.train, package='xgboost') data(agaricus.test, package='xgboost') train <- agaricus.train test <- agaricus.test cv.res <- xgb.cv(data = train$data, label = train$label, nfold = 5, nrounds = 2, objective =

浏览 3提问于2016-06-24得票数 2

回答已采纳

1回答

如何解释无线质量指标？

、

浏览 0提问于2017-03-01得票数 9

1回答

基于MATLAB的通信系统仿真

、

我正在尝试用BERtool绘制这个通信系统的理论误码率曲线和模拟误码率曲线：模拟的曲线在整个范围内都是一条恒定的水平线，因此与理论曲线甚至无法比较。系统的调制方案是8-psk，有什么建议吗？

浏览 8提问于2018-03-22得票数 0

1回答

决策树的预测误差

、、、

我正在使用决策树学习器来构建我的决策树，并在数据集上对其进行测试。我还试图计算我的树的预测错误率，这样我就可以用我的测试和训练集的学习曲线绘制一个图。我做了一个循环，我的算法被应用了n次(n任意)。我的变量internal_nodes存储了生成的内部节点的数量(这将是我在学习曲线图中的横坐标)，我在每次调用时都会返回它。我创建了count_error()来测量预测值和期望值之间的差异。 def count_errors(examples, target, tree): counter = 0 for ex in examples: # examples is a list

浏览 7提问于2018-01-20得票数 0

回答已采纳

1回答

adaboost更新权重β值

、、

Viola人脸检测采用adaboost方法训练强分类器.我对beta param更新策略感到困惑：为什么要选择这样的贝塔值？设置变量beta的目的是增加权重。不如选择：

浏览 2提问于2014-10-23得票数 4

回答已采纳

1回答

K-近邻分类器精度

、

我以MATLAB分类器为例，进行了10倍交叉验证，在计算模型性能的阶段，我迷失了方向，请看下面的代码，并建议我如何正确地获得百分比(%)的分类精度，我没有得到cVError =1-均值(ErrorMat)部分。其次，使用fitcknn和knn.predict函数来训练和测试模型，我需要帮助我如何创建自己的函数来完成相同的任务。谢谢。 indices = crossvalind('kfold',labels,10); confusionMatrix = cell(1,1); errorMat = zeros(1,10); for i = 1:10 test = (indices=

浏览 0提问于2015-01-26得票数 0

回答已采纳

1回答

如何找出文件中所有句子的错误率？

、

微软语音识别实验室给了我这个虚拟代码。我试图找到所有存储在文件中的句子的单词错误率(单独和和)。我已经使用Numpy数组在内存中加载了这些文件，现在我很难找到文件中每个句子的句子错误率。一共有三句话，我想让我的程序遍历每一个句子，并计算单词错误率。我的循环运行了三次，但结果只是为第一句积累起来的。看看我的代码，并指导我哪里出错了。谢谢。提供的代码： def string_edit_distance(ref="ref_data", hyp="hyp_data"): if ref is None or hyp is None: Runt

浏览 0提问于2019-12-30得票数 1

1回答

R中的RecordLinkage包-增加单个链接变量的权重

、、

我正在学习RPubs上的优秀教程，它使用了华丽的RecordLinkage包。我将此应用于我自己的数据，但我将仅使用本教程来解释我的问题。在用于比较的两个数据集中，有许多在链接中使用的公共字段： patents <- patents[,c("seq", "firstname", "lastname", "city", "state", "organization")] nsf <- nsf[, c("InvestigatorId", "FirstName&#

浏览 15提问于2019-03-20得票数 2

1回答

集成分类器错误率的这种表示法是什么意思？

、、

下面是表示集成分类器误差的图片。有人能帮我理解一下符号吗 📷 把(25和i)放在括号里意味着什么?ε^1是第一个分类器的错误，还是上升到幂i的错误率。有人能解释这个公式吗？

浏览 0提问于2022-05-22得票数 1

回答已采纳

1回答

transferFrom不起作用。估计煤气费误差。找不到窃听器

、、、

合同代码后附有解释和要求。除了贸易功能外，一切都正常。 /** *Submitted for verification at Etherscan.io on 2023-05-16 */ // SPDX-License-Identifier: UNLICENSED pragma solidity ^0.8.4; // OpenZeppelin Contracts (last updated v4.6.0) (token/ERC20/IERC20.sol) /** * @dev Interface of the ERC20 standard as defined in the EIP.

浏览 0提问于2023-05-17得票数 0

2回答

如何检测可能的硬件错误？

、、、、

我在惠普展馆dv7笔记本电脑上运行Debian，它时不时会结冰，需要重新启动。有一次，它甚至没有加载操作系统，但使用它的不是我，所以我无法判断显示了什么错误。在以前的Windows 7安装中，它总是无法加载Windows，将用户抛到“尝试修复”屏幕上，这会在几分钟内做一些事情，然后说Windows无法解决问题。这让我认为存在硬件问题，我想知道在/var/log或其他地方是否有什么东西可以提供一些关于正在发生的事情的信息，或者我是否可以运行任何测试，以及我应该寻找什么。我发了 grep -i "error" /var/log 整个输出是这里。我唯一能理解的，我认为可能与问题有

浏览 0提问于2013-04-20得票数 5

2回答

是否可以模拟指定的互联网连接状态("3G"，"H"，...)

、、

我想测试我的应用程序总是在许多可能的互联网连接状态。是否可以在不离开我的位置的情况下模拟指定的互联网连接状态(例如"3G“或"H")？

浏览 0提问于2011-07-21得票数 4

1回答

随机森林中的“方差解释”与XGBoost中的"merror“有什么区别？

、、

我一直在想写在标题上的一个话题。实际上，我尝试了两个库来预测，并得到了一个结果，但我不知道两个分数是否相同。这是一个结果的样本。 XGBoost>> train-merror:0.718701 据我所知，merror是错误的预测分数。因此，真正的预测得分是1 - 0.718701 = 0.281299。这意味着我所建立的模型可以预测出大约28%的正确结果。 Random Forest>> variance explained : 0.301 像上面这样的样本，是否有可能解释RF的预测评分优于XGBoost的结果？事实上，我希望知道variance expl

浏览 2提问于2017-10-20得票数 0

回答已采纳

3回答

Google Drive drive.files.get应用程序接口经常出现HTTP500内部错误

、

我们有一个高度依赖Google Drive的服务(它使用)，我们的服务通过Google Drive收集和文件。检查生产日志，当我们调用Google Drive的drive.files.get应用程序接口端点时，我们发现有许多HTTP500服务器内部错误。错误率约为0.5%。经过调查，我发现最极端的情况是一个小时内连续9个HTTP 500失败。异常如下所示： File "/home/xxxxxx/xxxxxxx/storage.py", line 1185, in get_file gdrive_file = self.client.files().get(fil

浏览 1提问于2012-09-18得票数 12

回答已采纳

3回答

无法理解这行代码np.mean(pred_i != y_test)

、、

在一个教程中遇到了我不能理解的这行代码： np.mean(pred_i != y_test) 完成for循环： error_rate = [] for i in range(1,40): knn = KNeighborsClassifier(n_neighbors=i) knn.fit(X_train,y_train) pred_i = knn.predict(X_test) error_rate.append(np.mean(pred_i != y_test)) print(np.mean(pred_i != y_test))

浏览 35提问于2019-02-02得票数 0

2回答

kNN与Logistic回归

、、、

你好，我把这个问题设为任选作业，并想征求一些意见。假设一个人取一个数据集，将其分成训练和测试数据集，然后尝试两种不同的分类过程。首先采用logistic回归方法，对训练数据和测试数据的误差率分别为20%和30%。接下来，他们使用1近邻，平均错误率(在测试和训练数据集上的平均错误率)为18%。根据这些数字，你更喜欢哪种方法用于分类目的(新的观测)？为什么？我倾向于说kNN，因为它是一种相当灵活的方法，平均提供了一个较低的错误。但这听起来不够正式，可能是一个有缺陷的、天真的结论。有意见吗？

浏览 0提问于2019-10-12得票数 0

6回答

Python中的相等错误率

、、、

谁能告诉我如何在python中从ROC曲线计算等错误率(EER)？在scikit learn中，有计算roc曲线和auc的方法，但没有找到计算EER的方法。 from sklearn.metrics import roc_curve, auc 解析器：我想我实现了我自己。 ROC EER的思想是连接(1,0)和(0,1)的直线与roc曲线的交点。它是它唯一相交的点。对于具有a=1和b=1的直线，方程将是x+y =1 (x/a +y/b =1.0)。因此，交点将是真阳性率(tpr)和假阳性率(fpr)的值，它们满足以下等式： x + y - 1.0 = 0.0 从而将该方法实现为：

浏览 4提问于2015-02-05得票数 16

1回答

如何在不改变p值调整方法的情况下，按组分离密文显示(CLD)？

、、

问题我想从一个三因素的实验中绘制出估计的边际均值，字母表示显着不同的手段，调整为多个比较。我目前的工作流程是用lmer()对模型进行拟合，用emmeans()计算估计的边际均值，然后用cld()实现紧凑的字母显示算法。我的问题是，当你在同一个图上绘制所有的三路交互时，图太忙了。所以我想把这个图分开，为每个子图生成不同的字母集，从"a“开始。问题是，当我在by中使用cld中的参数来分割它时，它会对每个by组中的多个比较进行单独的校正。因为现在每个组中的测试减少了，这就导致了一个不那么保守的修正。但是，如果我试图在没有cld()组的情况下手动拆分by的输出，我将不得不为每个子图手动重新

浏览 6提问于2022-02-02得票数 1

回答已采纳

1回答

自动编码器的损耗没有减少(并且开始很高)

、、

我有以下函数，它应该自动编码我的数据。我的数据可以看作是长100宽2的图像，它有两个通道(100，2，2)。 def construct_ae(input_shape): encoder_input = tf.placeholder(tf.float32, input_shape, name='x') with tf.variable_scope("encoder"): flattened = tf.layers.flatten(encoder_input) e_fc_1 = tf.layers.dense(fl

浏览 2提问于2018-07-08得票数 8

1回答

RandomForest不计算OOB误差

、

我是随机森林模型领域的新手，并试图解释几个RF模型的输出。所使用的数据集相当大(大约5,000行及以上，5个预测变量，都是数字的)，而模型(使用R包randomForest和RandomForestSRC进行比较和更好的绘图)似乎运行得很好，而且我得到了大约40%的解释%var，因为某种原因，我似乎无法计算OOB错误。它应该一起出现在RF摘要中的混淆矩阵中，但我所得到的只是例如：我目前使用randomForest包运行的代码是： rf3 <-randomForest(fishing_hours ~ . , data = data_fish, ntree = 1000, imp

浏览 0提问于2018-04-26得票数 1

回答已采纳

4回答

集合相交基数的快速近似算法

、、、、

我有一个池集(大小为n)，所有的集合都不适合RAM。我只能容纳一小部分，比方说，1-5%的所有设备进入RAM. 该问题是给定的查询集Q，需要返回与Q相交最大基数最大的上k集。假设q来自相同的集合池。对Q. K是小的，有几百，而n在数亿。地区元素在所有集合中的总数也是数亿。有很多概率数据结构，KMV，MinHash及其变体，我应该使用哪一个？我可以为我的任务修改HyperLogLog吗？哪一种结构可以组合成某种指标？我做了一些实验，用布卢姆滤镜来表示布卢姆。由于集合大小变化很大，我不得不使用非常大的bloomfiltes，这是低效的(bloomfi

浏览 4提问于2016-06-04得票数 8

回答已采纳

1回答

NewRelic中是否有非关键警报报告功能？

我们的应用程序与许多第三方服务进行了通信。我们经常在这些服务中遇到一些网络和其他问题，所以我们想知道这些问题。理想情况下，我们希望在应用程序的每个关键部分中设置一些NewRelic Ruby代码，以便在这些错误发生时通知我们。如果我们能够接收到电子邮件通知(一些服务被关闭，一些服务确实返回错误，因为我们发送了一些无效的数据等等)，这将特别有帮助。对于Android应用程序，我们使用Crashlytics作为崩溃报告工具，它支持非致命的例外：。我们希望为我们的应用程序提供完全相同的功能，如果我们能够使用NewRelic实现这一点，那就太好了。我将非常感谢您对此特性是否存在于NewRelic

浏览 2提问于2014-11-05得票数 0

回答已采纳

1回答

一点点失败意味着什么？

、

我的神经网络有22个输入值5184个值(两个数字值，图像转换成字节)，我试图设置两个输出神经元的值0或1，例如： <input data line with 5184 values> 0 1 <input data line with 5184 values> 1 0 <input data line with 5184 values> . . . 根据培训结果： Epochs 1. Current error: 0.3750000000. Bit fail 33. 这是什么故障？失败位数；指的是输出神经元的数量，其差异大于位失败限

浏览 2提问于2014-11-08得票数 14

1回答

resilience4j基于时间的断路器作为基于计数的断路器

、、

我正在尝试用这种配置测试一个基于时间的断路器： failureRateThreshold : 50 slidingWindowSize : 2 slidingWindowType : TIME_BASED minimumNumberOfCalls : 100 我原以为它会在经过2秒作为slidingWindowSize=2时触发失败率计算，但当调用次数超过100 (minimumNumberOfCalls)时，它就会触发失败率计算。即使2秒后没

浏览 3提问于2021-05-26得票数 0

1回答

resilience4j弹簧启动2

、

尝试一个简单的Spring 2 + Resilience4j项目。但面临的问题是，断路器总是关闭，，尽管主机应用程序是关闭的。服务类 @Autowired private RestTemplate restTemplate; @Bean public RestTemplate restTemplate() { return new RestTemplate(); } @CircuitBreaker(name = "mainService", fallbackMethod="testFallBack") public ResponseEntity&

浏览 1提问于2020-05-07得票数 1

回答已采纳

2回答

条形码精度

、

在书中(例如：“移动设备条形码”，)，文件(如：“条形码的错误率可能比一般认为的要低”，)或关于条形码的准确性或误差率的信息是给出的。给定的数字对于例如Code39，从1错误在170万，超过1错误在300万到1错误在450万。这些数字从何而来，如何计算(例如，对于Code39)？在Code39在的定义中，我也找不到有用的信息。

浏览 5提问于2020-06-20得票数 2

回答已采纳

2回答

用于训练基于随机森林的二进制分类器的正负训练示例的正确比率

、

我意识到相关问题建议正面和负面训练示例的比例为1:1，这对罗基奥算法有利。然而，这个问题与相关问题的不同之处在于，它涉及一个随机森林模型，而且还在以下两个方面。 1)我有大量的训练数据要处理，使用更多训练示例的主要瓶颈是训练迭代时间。也就是说，我不喜欢花超过一晚的时间来训练一个排名者，因为我想快速迭代。 2)在实践中，分类器可能会看到每4个负样本对应1个正样本。在这种情况下，我应该使用更多的负面示例而不是正面示例进行训练，还是仍然使用相同数量的正面示例和负面示例？

浏览 1提问于2013-07-28得票数 6

2回答

为什么我的JMeter测试运行有不同数量的样本

、、

我有一个JMeter测试，当我运行这个测试时。该测试主要包括GET请求。在这里，我运行了两次测试： Waiting for possible Shutdown/StopTestNow/Heapdump message on port 4445 summary + 1 in 00:00:06 = 0.2/s Avg: 4601 Min: 4601 Max: 4601 Err: 0 (0.00%) Active: 750 Started: 750 Finished: 0 summary + 18 in 00:00:25 = 0.7/s Avg:

浏览 0提问于2017-09-19得票数 0

回答已采纳

1回答

我能断言，在大多数情况下，高质量的will会更好吗？

、、

我有一个应用的覆盆子Pi，需要确定哪些可用的Wi接入点使用，与他们的统计数据收集由iwlib事先。 iwlib或iwlist对于每个Wi接入点有三个指标：“质量”、“信号级别”和“噪音级别”。通过说Wi接入点是“好的”，我指的是传输的高成功率。我的问题是:假设一个“质量”较高的接入点比一个“质量”较低的接入点更好，安全吗？

浏览 0提问于2014-09-08得票数 2

2回答

如何在Python中有效地计算非常大的数据集的基数？

、、、、

我一直在使用一些非常非常大的数据集，通常是数十亿个元素，这些数据都保存在云中，并定期转储到文件中，对于我的一项任务，我会尝试计算这些数据集的基数。对于某些上下文，每个条目都包含一个IP和一些其他属性，用于标识一个人，并以base64编码，条目大小为20字节。通过删除某些字段来减小项目的大小是不可能的。下面是将我的dataset模拟为内存中版本的东西(感谢用于字符串生成的 )： import base64, os dataset_size = 10000000000 # that's 10 billion, be careful if you run it ! big_datase

浏览 27提问于2012-04-16得票数 16

回答已采纳

1回答

R中的xgboost :对XGb.cv的early_stopping_rounds的容忍度是多少？

、、

在xgb.cv函数(来自库xgboost)中，其中一个选项是early_stopping_rounds。此选项的说明为： If NULL, the early stopping function is not triggered. If set to an integer k, training with a validation set will stop if the performance doesn't improve for k rounds. Setting this parameter engages the cb.early.stop callback. “如果k轮次的

浏览 18提问于2020-08-13得票数 2

1回答

如何使用任何t-test在数据集上的分类器之间进行比较？

、、、

我想使用任何t检验来比较数据集上的分类器之间的差异。我的问题是，我应该使用什么来进行这种比较。例如。分类器1我将构建用于准确性、精确度、召回率、...etc的列；分类器2也是如此。然后应用任何t检验。这合乎逻辑吗？如果不是，我怎么做这个比较呢？哪种工具可以进行这种比较？提前感谢

浏览 1提问于2014-04-01得票数 1

2回答

分类(LDA)功能实现了什么？

、、、、

我正在研究机器学习，并使用LDA作为起点。我正在遵循MatLab自己的关于LDA分类()的教程。他们使用的是渔民数据集，该数据集已经在Matlab中可用，可以简单地装载。在本教程中，他们使用这一行进行分类： ldaClass = classify(meas(:,1:2),meas(:,1:2),species); 我知道：分类器根据训练数据和标签(第二和第三参数)训练分类器，并将分类器应用于测试数据(第一参数)，ldaClass根据使用训练数据点和标签训练的分类器给出为测试数据点选择的类。那么，提供给分类器训练的相同数据也被用于测试？我对监督学习的理解是，一旦一个系统被训练了一

浏览 0提问于2014-07-17得票数 1

回答已采纳