课程评价 (0)

请对课程作出评价:
0/300

学员评价

暂无精选评价
20分钟

scikit-learn API

  1. 属性:
    • .n_features_:一个整数,给出了特征的数量
    • .classes_:一个形状为(n_classes,)numpy array, 给出了样本的标签。(仅仅在分类问题中有效)
    • .n_classes_:一个整数,给出了类别的数量。(仅仅在分类问题中有效)
    • .best_score_:一个字典或者None,给出了训练完毕模型的最好的score
    • .best_iteration_:一个字典或者None。当early_stopping_round 参数设定时,它给出了训练完毕模型的最好的迭代步。
    • .objective_:一个字符串或者可调用对象,给出了训练模型的目标函数
    • .booster_:一个Booster对象,给出了底层的Booster 对象。
    • .evals_result_:一个字典或者None。当early_stopping_round 参数设定时,它给出了模型的evaluation results
    • .feature_importances_: 一个形状为(n_features,)numpy array,给出了特征的重要性(值越大,则对于的特征越重要)。

2. 方法:

  • .apply(X,num_iteration=0): 预测每个样本在每个树的哪个叶节点上。
    • 参数:
      • X: 一个array-like 对象,或者一个sparse matrix, 其形状为(n_samples,n_features) ,表示测试样本集
      • num_iteration: 一个整数,指示在预测时,使用多少个子树。默认为0,表示使用所有的子树。
    • 返回值:一个array-like对象,形状为(n_samples,n_trees)。 它给出了每个样本在每个子树的哪个节点上。
  • .fit(): 训练模型。 .fit(X, y, sample_weight=None, init_score=None, group=None, eval_set=None,    eval_names=None, eval_sample_weight=None, eval_init_score=None,    eval_group=None, eval_metric=None, early_stopping_rounds=None, verbose=True,    feature_name='auto', categorical_feature='auto', callbacks=None) 参数:
    • X: 一个array-like 对象,或者一个sparse matrix, 其形状为(n_samples,n_features) ,表示训练样本集
    • y: 一个array-like对象,形状为(n_samples,),给出了标签值。
    • sample_weight:一个形状为(n_samples,)array-like 对象,或者为None。给出了每个训练样本的权重。默认为None
    • init_score: 一个形状为(n_samples,)array-like 对象,或者为None。给出了每个训练样本的init score 。默认为None
    • group: 一个形状为(n_samples,)array-like 对象,或者为None。给出了每个训练样本的分组。默认为None
    • eval_set:一个元素为(X,y) 的列表,或者None。 给出了验证集,用于早停。默认为None。 其中X,y 的类型与参数X,y 相同。
    • eval_names:一个字符串的列表,或者None。给出了每个验证集的名字。默认为None
    • eval_sample_weight:一个array-like 的列表,或者None。 给出了每个验证集中,每个样本的权重。默认为None
    • eval_init_score:一个array-like 的列表,或者None。 给出了每个验证集中,每个样本的init score。默认为None
    • eval_group:一个array-like 的列表,或者None。 给出了每个验证集中,每个样本的分组。默认为None
    • eval_metric:一个字符串、字符串列表、可调用对象、或者None。 给出了验证的metric。默认为None
    • early_stopping_rounds:一个整数或者None,默认为None。参考lightgbm.train()
    • verbose: 一个布尔值。如果为True,并且至少有一个验证集,则输出evaluation 信息。
    • feature_name:一个字符串列表、或者'auto'。参考lightgbm.train()
    • categorical_feature:一个字符串列表、整数、或者'auto'。参考lightgbm.train()
    • callbacks:一个可调用对象的列表或者为None 。参考lightgbm.train()

    返回值:self,即当前LGBMModel 对象自己

  • .predict(X,raw_score=False,num_iteration=0): 执行预测。 参数:
    • X: 一个array-like 对象,或者一个sparse matrix, 其形状为(n_samples,n_features) ,表示测试样本集。 注意:如果是numpy array 或者 pandas dataframe 时,要求数据的列必须与训练时的列顺序一致。
    • raw_score:一个布尔值,指示是否输出raw score。 默认为False
    • num_iteration:一个整数,指示在预测时,使用多少个子树。默认为0,表示使用所有的子树。

    返回值:一个形状为(n_samples,) 或者形状为(n_samples,n_classed)array-like 对象,表示预测结果