首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python中的多元线性回归?

在Python中,进行多元线性回归通常使用scikit-learn

  1. 首先,安装所需库:
代码语言:javascript
复制
pip install numpy pandas scikit-learn
  1. 构建数据集。在这个例子中,我们将使用有两个特征的虚构数据集。可以使用pandas库创建DataFrame。
代码语言:javascript
复制
import numpy as np
import pandas as pd

# 生成虚拟数据
data = {
    '特征1': np.random.rand(100),
    '特征2': np.random.rand(100),
    '目标变量': np.random.rand(100)
}

dataset = pd.DataFrame(data)
  1. 将数据集划分为训练集和测试集。我们将使用train_test_split函数实现这一点。
代码语言:javascript
复制
from sklearn.model_selection import train_test_split

X = dataset[['特征1', '特征2']]  # 特征
y = dataset['目标变量']  # 目标变量

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
  1. 训练多元线性回归模型。
代码语言:javascript
复制
from sklearn.linear_model import LinearRegression

regressor = LinearRegression()
regressor.fit(X_train, y_train)
  1. 对测试集进行预测。
代码语言:javascript
复制
y_pred = regressor.predict(X_test)
  1. 评估模型性能。我们可以使用mean_squared_errorR^2分数来评估模型的性能。
代码语言:javascript
复制
from sklearn.metrics import mean_squared_error, r2_score

mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print("均方误差 (MSE):", mse)
print("R^2 分数:", r2)

现在,您已经成功地使用Python进行了多元线性回归分析。可以根据需要调整特征和数据集以适应您的实际问题。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

领券