20分钟
scikit-learn API
- 属性:
.n_features_
:一个整数,给出了特征的数量.classes_
:一个形状为(n_classes,)
的numpy array
, 给出了样本的标签。(仅仅在分类问题中有效).n_classes_
:一个整数,给出了类别的数量。(仅仅在分类问题中有效).best_score_
:一个字典或者None
,给出了训练完毕模型的最好的score
.best_iteration_
:一个字典或者None
。当early_stopping_round
参数设定时,它给出了训练完毕模型的最好的迭代步。.objective_
:一个字符串或者可调用对象,给出了训练模型的目标函数.booster_
:一个Booster
对象,给出了底层的Booster
对象。.evals_result_
:一个字典或者None
。当early_stopping_round
参数设定时,它给出了模型的evaluation results
。.feature_importances_
: 一个形状为(n_features,)
的numpy array
,给出了特征的重要性(值越大,则对于的特征越重要)。
2. 方法:
.apply(X,num_iteration=0)
: 预测每个样本在每个树的哪个叶节点上。- 参数:
X
: 一个array-like
对象,或者一个sparse matrix
, 其形状为(n_samples,n_features)
,表示测试样本集num_iteration
: 一个整数,指示在预测时,使用多少个子树。默认为0
,表示使用所有的子树。
- 返回值:一个
array-like
对象,形状为(n_samples,n_trees)
。 它给出了每个样本在每个子树的哪个节点上。
- 参数:
.fit()
: 训练模型。 .fit(X, y, sample_weight=None, init_score=None, group=None, eval_set=None, eval_names=None, eval_sample_weight=None, eval_init_score=None, eval_group=None, eval_metric=None, early_stopping_rounds=None, verbose=True, feature_name='auto', categorical_feature='auto', callbacks=None) 参数:X
: 一个array-like
对象,或者一个sparse matrix
, 其形状为(n_samples,n_features)
,表示训练样本集y
: 一个array-like
对象,形状为(n_samples,)
,给出了标签值。sample_weight
:一个形状为(n_samples,)
的array-like
对象,或者为None
。给出了每个训练样本的权重。默认为None
init_score
: 一个形状为(n_samples,)
的array-like
对象,或者为None
。给出了每个训练样本的init score
。默认为None
group
: 一个形状为(n_samples,)
的array-like
对象,或者为None
。给出了每个训练样本的分组。默认为None
eval_set
:一个元素为(X,y)
的列表,或者None
。 给出了验证集,用于早停。默认为None
。 其中X,y
的类型与参数X,y
相同。eval_names
:一个字符串的列表,或者None
。给出了每个验证集的名字。默认为None
。eval_sample_weight
:一个array-like
的列表,或者None
。 给出了每个验证集中,每个样本的权重。默认为None
。eval_init_score
:一个array-like
的列表,或者None
。 给出了每个验证集中,每个样本的init score
。默认为None
。eval_group
:一个array-like
的列表,或者None
。 给出了每个验证集中,每个样本的分组。默认为None
。eval_metric
:一个字符串、字符串列表、可调用对象、或者None
。 给出了验证的metric
。默认为None
。early_stopping_rounds
:一个整数或者None
,默认为None
。参考lightgbm.train()
verbose
: 一个布尔值。如果为True
,并且至少有一个验证集,则输出evaluation
信息。feature_name
:一个字符串列表、或者'auto'
。参考lightgbm.train()
categorical_feature
:一个字符串列表、整数、或者'auto'
。参考lightgbm.train()
callbacks
:一个可调用对象的列表或者为None
。参考lightgbm.train()
返回值:
self
,即当前LGBMModel
对象自己.predict(X,raw_score=False,num_iteration=0)
: 执行预测。 参数:X
: 一个array-like
对象,或者一个sparse matrix
, 其形状为(n_samples,n_features)
,表示测试样本集。 注意:如果是numpy array
或者pandas dataframe
时,要求数据的列必须与训练时的列顺序一致。raw_score
:一个布尔值,指示是否输出raw score
。 默认为False
num_iteration
:一个整数,指示在预测时,使用多少个子树。默认为0
,表示使用所有的子树。
返回值:一个形状为
(n_samples,)
或者形状为(n_samples,n_classed)
的array-like
对象,表示预测结果
学员评价