原始数据 –> 数据特征工程(训练数据和测试数据) –> 选择合适的算法进行学习 –> 建立模型 –> 模型评估(测试数据) –> 判断模型是否合格 –> 模型应用(一般以API的形式提供)
P(A,B)
P(A|B)
P(A1, A2|B) = P(A1|B)P(A2|B)
方法: decision_path:返回决策树的路径
调参数:k-近邻的超参数K
class sklearn.ensemble.RandomForestClassifier(n_estimators=10, criterion='gini', max_depth=None, bootstrap=True, random_state=None)
通过一个或者多个自变量与因变量之间进行建模的回归分析。其中可以为一个或多个自变量之间的线性组合(线性回归的一种)
一元线性回归:涉及到的变量只有一个
多元线性回归:涉及到的变量两个或多个
通用公式:
,其中,为矩阵:,
一个通过属性的线性组合来进行预测的函数:
w为权重,b为偏置项,可以理解为:w0 x 1