如何循环获取最小RMSE值，并在每列中使用"apply“进行预测

循环获取最小RMSE值并在每列中使用"apply"进行预测的步骤如下：

首先，确保已经导入所需的库和数据集。
将数据集分为特征变量（X）和目标变量（y）。
创建一个空列表来存储每列的最小RMSE值。
使用循环遍历数据集的每一列。
在循环中，将当前列作为目标变量（y）并将其他列作为特征变量（X）。
将数据集拆分为训练集和测试集，一般采用70%的数据作为训练集，30%的数据作为测试集。
使用适当的机器学习模型（如线性回归、决策树、随机森林等）拟合训练集数据。
使用训练好的模型预测测试集的目标变量。
计算预测结果和实际结果之间的均方根误差（RMSE）。
将RMSE值添加到步骤3中创建的列表中。
完成循环后，找到列表中最小的RMSE值。
找到对应的列索引，该索引即为具有最小RMSE值的列。
将该列作为目标变量（y）并将其他列作为特征变量（X）。
使用完整的数据集拟合模型。
使用apply函数在每列中进行预测。

以下是一个示例代码：

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# 导入数据集
data = pd.read_csv("data.csv")

# 分割特征变量和目标变量
X = data.drop("target", axis=1)
y = data["target"]

# 创建空列表来存储RMSE值
rmse_values = []

# 循环遍历每一列
for col in X.columns:
    # 将当前列作为目标变量，其他列作为特征变量
    X_train, X_test, y_train, y_test = train_test_split(X.drop(col, axis=1), y, test_size=0.3, random_state=42)
    
    # 使用线性回归模型拟合训练集数据
    model = LinearRegression()
    model.fit(X_train, y_train)
    
    # 在测试集上进行预测
    y_pred = model.predict(X_test)
    
    # 计算均方根误差（RMSE）
    rmse = np.sqrt(mean_squared_error(y_test, y_pred))
    
    # 将RMSE值添加到列表中
    rmse_values.append(rmse)

# 找到最小RMSE值的列索引
min_rmse_index = np.argmin(rmse_values)

# 使用完整数据集拟合模型
X_train, X_test, y_train, y_test = train_test_split(X.drop(X.columns[min_rmse_index], axis=1), y, test_size=0.3, random_state=42)
model = LinearRegression()
model.fit(X_train, y_train)

# 使用apply函数在每列中进行预测
predicted_values = X.apply(lambda x: model.predict(np.array(x).reshape(1, -1))[0], axis=0)

上述代码仅为示例，实际应用中可能需要根据数据集和具体需求进行调整和优化。

如何循环获取最小RMSE值，并在每列中使用"apply“进行预测

谁能给我一些指导，告诉我如何使用for循环来查找最小RMSE值，并在每一列中使用"apply function“进行预测？这是数据集。R中进行预测。我计划使用"Holt“来预测未来的值。Holt中的一个变量是输入beta。我不知道

浏览 18提问于2020-04-24得票数 1

回答已采纳

1回答

使用一定范围的数据帧行计算MSE、RMSE，直到数据帧结束。

、、、、

我有一个数据帧df，它有两个列True和Prediction，而数据帧有1000行。我想要计算MSE和RMSE使用函数从学习mean_squared_error(y_test, y_pred)。但我希望继续以这样的模式计算它们，即第一个MSE将在True和prediction列值的前20行上计算。然后，下一个MSE将位于来自True和Prediction列的21-40行值上。因此，我想计算一组MSE和RMSE，从总共1000行中连续<

浏览 16提问于2022-04-02得票数 1

回答已采纳

2回答

在R编程中如何对数据集进行规范化？

、

我在R中实现了下面的代码来标准化我的数据帧，但是我得到了下面的错误 clean_data[(clean_data[,i]),i] <-(clean_data[,i]

浏览 0提问于2017-07-09得票数 1

1回答

使用app脚本将Google中的.csv文件输入传递给预测API

、

如何使用app脚本在Google中传递来自.csv文件的输入，以便我可以使用预测API进行批量预测(>10,000)？我使用Google资源管理器创建并训练了我的预测模型。它包含许多输入行--我希望为每一行做一个预测。将

浏览 3提问于2012-07-30得票数 0

2回答

如果数据集中的一些实际值为0，如何计算MAPE？

、、、、

假设我有实际数据：25.950我使用XGboost的预测值是： 25.4还是基于MSE、MAE、RMSE、MAPE等预测误差技术来评估差异更好？既然我读到MAPE是最被广泛接受的，那么在我上面的实际情况

浏览 890提问于2019-10-26得票数 1

2回答

如何计算R中的均方偏差？

、

最后，在我接下来的过程中，您必须计算这三个点之间的标准差，并将其乘以第95百分位数置信区间的1.96因子(这样就得到了该方法的检测极限)。因为在最后，我必须使用这个检测限制来过滤我的数据，我想比较哪一个是我的情况下最好的方法，就像他们一样。我已经尝试过使用rmse包的Metrics函数，但问题是它只需要两个值:一个实际

浏览 0提问于2019-11-22得票数 1

1回答

指数平滑法得到预测的RMSE

、

在使用R对时间序列进行指数平滑时，我以为例。按顺序(Y)错误:在'orderVector1‘中未实现的类型'list’ 如何纠正它们，并得到<em

浏览 0提问于2018-09-13得票数 0

回答已采纳

1回答

在R中建立预测误差最小的ARIMA模型

、、、、

我使用auto.arima()函数建立ARIMA模型，然后计算预测精度： library(fpp2) ARIMAf <- forecast(ARIMA, h = 12) ME RMSE-16.986385 23.931703 18.527682 -3.9334909 4.18

浏览 24提问于2020-01-26得票数 1

回答已采纳

1回答

R:如何使用for循环计算和排序两个变量

、、

我想执行一个IDW交叉验证，并找出哪个“电源”-value给最小的RMSE。为此，我希望将"power“和" RMSE "-values存储在一个列表中，并按最小的RMSE对它们进行排序。[[paste0(i,"P")]] <- krige.cv(zinc ~ 1, meuse, nfold = nrow(meuse),set = list(idp = i))现在，我尝试使用for-

浏览 2提问于2016-08-23得票数 0

回答已采纳

1回答

R中与glmnet和LOOCV相关的小问题

、、、、

我试图拟合一个正则化模型(LASSO，Ridge，ElasticNet)，使用与cv.glmnet和glmnet的交叉验证分离。 }代码只给了我一个预测值！而R-平方有NA值！此外，我也不确定我是否正确地使用了一个与cv.glmnet和glmnet分开的交叉验证。任何帮助的想法

浏览 0提问于2019-07-13得票数 0

4回答

在Ti球中的所有列上找到最小值的最佳方法是什么？

、

假设我有一只老虎，比如 x = c("a", "b", "c"), z = c("g", "h", "i")我想找出所有列中所有值的最小值[i]], ...) : only defined on a data frame with all nume

浏览 11提问于2022-07-29得票数 1

2回答

R-有没有一个内置的函数(或者仅仅是一种聪明的方式)来从数据帧中检索具有最小值的行？

、、

我有一个函数，它生成一个类似于此的数据帧(不过，稍微大一点)，并根据时间序列拟合各种模型的精度：ses -3.289695e-01 250.34678 168.55694 -18.313167 49.35868 1.2903880 我想检索绝对值最小的行我尝试过使用abs()和pmin()，但它返回的向量中每列的<em

浏览 1提问于2015-01-29得票数 0

2回答

如何对所有值而不仅仅是重复值进行多列排序- python

、、

我有一个熊猫dataframe，我需要(根据ascending)将值按两列排序，输出是这两列的“中间地带”。下面是一个例子。当我使用sort_values时，它会根据第一列进行排序，而第二列只考虑重复的值。但是，我需要得到两个列的值都较低的行(这是输出下面的第三个列)。test = pd.DataFrame({'file':[1,2,3,4,5,6], 'rm

浏览 7提问于2022-04-23得票数 -1

回答已采纳

3回答

(早期停止循环，最好的和最后的迭代)

、、、

下面是一个关于xgboost早期停止循环参数的问题，以及它是如何在拟合结束时给出最佳迭代的。验证错误至少需要减少每一轮"early_stopping_rounds“才能继续训练。要求至少有一项是正确的。如果不止一个，就用最后一个。返回上次迭代中的模型(不是最好的)。它说，要想在预测时访问最好的预测，可以使用ntree_limit参数调用预测，并在fit结束时给出bst.best_ntree_limit。在这里，或对此

浏览 1提问于2018-11-26得票数 13

回答已采纳

1回答

尝试将公式应用于R中的每一列，如何将数据馈送到公式？

、、、

因此，我尝试将指数平滑模型应用于名为“城市”的数据框架中的每一列。我已经使用apply来标识数据框，按列进行，并且我想运行模型。但是，当我尝试这样做时，它告诉我需要为指数平滑模型指定数据...我认为我已经通过将其放入apply循环来指定数据。apply(x=cities,2,FUN=HoltWinters(x=x,gamma=FALSE)) 此外，最终我想使用forecast.predict开发的H

浏览 1提问于2012-08-02得票数 3

回答已采纳

1回答

函数中的Mean_squared_error输出包括数据类型和“0”

、、

我想在一个函数中计算fb预测的测试统计数据，因为我想在使用fb-prophet cross_validation获得df_cv后，对不同预测和截止点的测试统计数据进行平均。然后我计算所有这些值的平均值。问题是，我的函数不仅返回我要查找的值，还返回0以及dtype的信息。我仍然可以用返回值进行计算，但是当我想要绘制等等时，这是非常不方便的。如何从输出中剔除这些不必要的值？[perf_measure]

浏览 24提问于2019-10-14得票数 0

回答已采纳

1回答

在R中测量大量时间序列的最佳预测方法

、、、、

我正在努力解决R中的一个问题，我想用不同的方法评估许多时间序列的最佳预测度量，例如ME, RMSE, MAE, etc.测量的数据存储在一个列表中，该列表保存了这些数据帧：ME, RMSE, MAE...为了评估最好的方法，我考虑将不同方法的所有值相加，并将它们除以residuen_overall的长度。例如两个(ME)的长度：residuen_overall[[1]] # ME RMSE M

浏览 2提问于2016-08-14得票数 1

回答已采纳

1回答

数据帧上每n个数字列的第n行元素的多个统计信息

、、

我需要一行中的每7个元素作为第一列和；对于第二列和，对于第三列最小，对于第四列最大值，并从数据框架的第3列到第48列(这里的dataset )获取进程，该数据集实际上有50列和84行。我希望得到一个数据框架，其中包含12行和48列，其中每个行元素都是统计数据(按重复顺序依次排列:和、和、最小)，每个元素在84行中的每个元素都是这

浏览 0提问于2019-05-04得票数 0

回答已采纳

3回答

如何在不使用for循环的情况下对R中的矩阵中的每一列执行多个操作？

、、

a b c dt 2 4 5 6v 9 2 3 4x 3 2 0 9z 8 3 4 5 如何自动提取矩阵每一列的范围、均值、标准差、中值、最大值和最小值，而不使用R中的for循环？是否可以使用apply/sapply/lapply?？

浏览 3提问于2016-04-08得票数 0

2回答

按顺序计算每行的RMSE，每次使用下一行(Pandas)

、、

我有y_true值和y_predicted值的数据帧。我需要按顺序计算每一行的RMSE，每次都使用下一行。可以用row+1来描述它。之后，将结果存储在新的列RMSE中。这是数据帧。代码将获取y_true = 105, y_pred = 195的第一行并计算均方根(我使用from sklearn.metrics import mean_squared_error)，这将是90.0，并将其放在新列<

浏览 30提问于2021-11-10得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何循环获取最小RMSE值，并在每列中使用"apply“进行预测

相关·内容

如何循环获取最小RMSE值，并在每列中使用"apply“进行预测

使用一定范围的数据帧行计算MSE、RMSE，直到数据帧结束。

在R编程中如何对数据集进行规范化？

使用app脚本将Google中的.csv文件输入传递给预测API

如果数据集中的一些实际值为0，如何计算MAPE？

如何计算R中的均方偏差？

指数平滑法得到预测的RMSE

在R中建立预测误差最小的ARIMA模型

R:如何使用for循环计算和排序两个变量

R中与glmnet和LOOCV相关的小问题

在Ti球中的所有列上找到最小值的最佳方法是什么？

R-有没有一个内置的函数(或者仅仅是一种聪明的方式)来从数据帧中检索具有最小值的行？

如何对所有值而不仅仅是重复值进行多列排序- python

(早期停止循环，最好的和最后的迭代)

尝试将公式应用于R中的每一列，如何将数据馈送到公式？

函数中的Mean_squared_error输出包括数据类型和“0”

在R中测量大量时间序列的最佳预测方法

数据帧上每n个数字列的第n行元素的多个统计信息

如何在不使用for循环的情况下对R中的矩阵中的每一列执行多个操作？

按顺序计算每行的RMSE，每次使用下一行(Pandas)

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐