在列车数据上运行模型后，如何对测试数据应用逻辑回归

、

我一直在尝试学习机器学习，但不知道如何将算法应用于测试数据。在这个例子中，我一直在尝试将用于训练数据的逻辑回归模型应用于一组新的测试数据。这两个数据集位于两个不同的csv文件中: titanic_train.csv和titanic_test.csv。我可以将该模型应用于训练数据，但不能将其应用于测试数据。我使用Anaconda的Jupiter笔记本和python 3运行</

浏览 22提问于2019-05-07得票数 1

2回答

不平衡分类:过采样与缩放特征的顺序？

、、

当使用不平衡的数据集(例如，欺诈检测)执行分类(例如，逻辑回归)时，是最好在过度采样少数类之前对特征进行缩放/zscore/标准化，还是在缩放特征之前平衡类？其次，这些步骤的顺序是否会影响最终如何解释特性(当使用所有数据scaled+balanced来训练最终模型时)？下面是一个例子：使用所有培训(不平衡)数据计算平均值/std

浏览 0提问于2018-01-21得票数 7

1回答

RANSAC回归模型的检验

、、、

我将建立一个模型(例如多元线性回归)来预测我所在城市的公寓成本。首先，我必须在训练数据中找出异常值。对于这个任务，RANSAC回归算法看起来很有吸引力，因为它不仅允许检测异常值，而且还允许构建模型本身。有一件事让我感到困惑，那就是如何测试受过训练的模型。检验模型是否具有良好预测能力的标准方法是对列车数据和测试数据进行分割，并在测试数据上应用经过训

浏览 0提问于2023-03-11得票数 0

1回答

如何收集测试数据？

、

我现在正在学习线性回归。我使用R在一组火车模型上建立线性模型，并尝试根据测试数据预测()数据。PS:我是用自学的方法学习数据科学的，所以我的知识缺乏结构。我可能在一个地方知道一些事情，而在另一个地

浏览 0提问于2015-06-28得票数 0

1回答

如何评估均方误差(MSE)是否合理？

、、、

我正在使用scikit学习创建回归模型。现在我想知道如何评估均方误差是合理的还是坏的？这不是编程问题，但我想知道如何评估价值。我不确定我的方式是否正确。

浏览 0提问于2018-05-06得票数 2

回答已采纳

1回答

我应该上采样和下采样数据，还是只上采样不平衡的类

、、

我有一个高度不平衡的二进制(是/否)分类数据集。数据集当前有appx 0.008% 'yes‘。我遇到了两种方法来处理这种不平衡。在对变量运行MinMaxScaler之后，执行以下步骤oversample = SMOTE(sampling_strategyundersample)]x_scaled_s, y_s = pi

浏览 3提问于2020-05-14得票数 0

3回答

机器学习:基于测试数据的训练模型

我想知道一个模型是否也是从测试数据中训练自己，同时对它进行多次评估，从而导致了一个过度拟合的场景。通常，我们将训练数据分成train-test分割，我注意到有些人将它分成3组数据-- train、test和eval。eval是对模型的最终评价。我可能错了，但我的观点是，如果上面提到的场景不是真的，那么就不需要eval数据集。需要澄清一下。

浏览 5提问于2018-01-03得票数 1

回答已采纳

2回答

在Keras中，x_train和x_test有什么区别？

、、

在本教程(以及Keras的官方文档中)中，MNIST数据集的加载方式如下：然而，没有解释为什么我们有两个元组的数据。

浏览 0提问于2017-09-29得票数 13

回答已采纳

2回答

测试数据中没有目标响应变量

、

我有两个数据集，它们是训练和测试集。训练数据有一个目标变量，但是测试集没有。我应该做些什么来解决测试集的问题？

浏览 0提问于2021-08-10得票数 0

3回答

测试数据的MAE是否总是高于训练数据的MAE？

、、

在卡格尔课程页上，下面的图表显示测试数据的MAE总是高于训练数据的MAE。为什么是这种情况？它是否仅限于DecisionTreeRegressor模型？或者图是错的，在实际测试中，MAE可以低于训练的MAE吗？ 📷

浏览 0提问于2019-12-26得票数 1

回答已采纳

1回答

当测试和训练数据集来自不同的来源时，为什么测试精度保持不变，并且在二进制分类中没有增加？

、、、、

我有两个不同来源的训练数据集和测试数据集。我的意思是，它们来自两个不同的实验，但它们的结果是相同的生物图像。我想做二进制分类使用深CNN和我有以下的测试精度和训练精度的结果。蓝线显示列车精度，红线在近250个历次后显示测试精度。为什么测试的准确性几乎是恒定的，而不是提高？这是因为、Test、和列车数据集来自不同的发行版吗？编辑:在我添加了辍学层，回归项和平均减法之后，我仍然得到了一些奇怪的结果，从一开始就说模型

浏览 0提问于2017-01-29得票数 3

2回答

在预测时间序列时，如何将测试数据纳入训练后的模型中？

、、

在构建分类或回归模型时，通常将数据拆分为火车数据集和测试数据集。测试数据是整个数据的随机选择子集。一旦完成了培训，就会丢弃测试数据，并将构建的模型应用于新的未知数据。但是在时间序列的情况下，这是行不通的:您不能只是随机地为测试数据集选择数据的任何子集，因为数据是有序的。测试数据集必须由数据的

浏览 0提问于2017-12-12得票数 4

1回答

规范培训和测试数据分离前后的时间序列数据？

我在时间序列数据上使用了一个分类模型，在将数据分解为训练和测试之前，我对数据进行规范化。现在，我知道训练数据和测试数据应该分开处理，以防止数据泄漏。在这里，规范化步骤的正确顺序是什么？我是否应该分别应用步骤1、2、3来训练和测试使用滑动窗口分割数据后的数据？我在这里使用一个滑动窗口来比较每一个小时(测试)和它之前的24小时数据(火车)。这是我目前

浏览 0提问于2020-07-04得票数 1

回答已采纳

1回答

模型:在培训和部署期间

、

众所周知，在模型训练期间，我们坚持测试集。然而，我实际上在部署过程中发现，如果在整个数据集(train+test)上使用新的模型序列，实际上在预测真正的“未见”数据方面也会产生相当好的结果。我正在寻找对这种方法的评论。有什么问题吗？特别是，在这种方法中，我将对整个数据集应用任何类型的转换，例如标准化/规范化/分类编码。对部署来说不是更好吗？(

浏览 0提问于2022-04-06得票数 0

回答已采纳

1回答

多项式回归图不正确显示

、

我使用sklearn运行了这段多项式回归代码，但我的图解与我所期望的不一样。正如你所看到的，，我没有得到一条平滑的线，但是它是从一个点跳到另一个点。

浏览 1提问于2020-04-14得票数 1

回答已采纳

1回答

如何才能使岭回归包含整个数据集？

、、

我正在尝试对一组数据进行岭回归。我的完整数据集voters有49978个观察值，我的训练数据有39983个观察值。我使用训练数据构建了岭回归模型，并在测试数据上对其进行了测试，现在正在尝试将该模型应用于整个选民数据集。问题是，当我对整个数据集运行预测时，它只返回39983个元素(即，仅与测试数据</em

浏览 0提问于2020-12-11得票数 0

1回答

显示测试数据的模型摘要(R闪亮应用程序)

、

我对R是个新手。我创建了一个简单的线性回归模型，并使用现在，我已经创建了一个闪亮的R应用程序，用户可以上传一个文件(测试数据)，我希望我保存的模型加载并运行测试数据。然后，我想展示模型的总结。$modelSummary <- renderPrint({ model <- load(file = "Sim

浏览 1提问于2018-10-13得票数 0

回答已采纳

2回答

通过预测()或通过fit()验证？

、、、、

有几种可能性可以用来评估一个模型： (...)

浏览 0提问于2019-10-17得票数 0

2回答

Python中的一种热编码

、、

我对一个热门编码有疑问：导入测试数据集后，如果我对其进行热编码，编码将与训练数据集的编码相同还是不同。如果是这样，我如何解决这个问题？

浏览 3提问于2018-07-10得票数 1

2回答

机器学习中的预测函数是否理解分类数据？

、、、、

据我所知，在进行特征工程之前，必须将数据集分成训练数据和测试数据，以避免分析中的偏差。我还了解到，机器学习模型除了数字数据之外不理解数据，因此需要编码，这是特征工程的一部分。我的问题是，我是单独编码测试数据，还是预测函数理解分类数据。

浏览 0提问于2019-11-06得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

不平衡分类:过采样与缩放特征的顺序？

RANSAC回归模型的检验

如何收集测试数据？

如何评估均方误差(MSE)是否合理？

我应该上采样和下采样数据，还是只上采样不平衡的类

机器学习:基于测试数据的训练模型

在Keras中，x_train和x_test有什么区别？

测试数据中没有目标响应变量

测试数据的MAE是否总是高于训练数据的MAE？

当测试和训练数据集来自不同的来源时，为什么测试精度保持不变，并且在二进制分类中没有增加？

在预测时间序列时，如何将测试数据纳入训练后的模型中？

规范培训和测试数据分离前后的时间序列数据？

模型:在培训和部署期间

多项式回归图不正确显示

如何才能使岭回归包含整个数据集？

显示测试数据的模型摘要(R闪亮应用程序)

通过预测()或通过fit()验证？

Python中的一种热编码

机器学习中的预测函数是否理解分类数据？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐