首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >我运行GBT在火花ML为CTR预测。由于MaxBin参数,我得到了异常

我运行GBT在火花ML为CTR预测。由于MaxBin参数,我得到了异常
EN

Stack Overflow用户
提问于 2016-08-22 07:29:10
回答 1查看 827关注 0票数 0

例外细节:

  • 线程“主”java.lang.IllegalArgumentException中的异常:需求失败: DecisionTree要求maxBins (= 32)至少与每个分类特性中的值数目一样大,但是分类功能4139有16094个值。考虑删除具有大量值的此功能和其他分类功能,或添加更多的培训示例。org.apache.spark.mllib.tree.impl.DecisionTreeMetadata$.buildMetadata(DecisionTreeMetadata.scala:133),org.apache.spark.mllib.tree.RandomForest.run(RandomForest.scala:137),org.apache.spark.mllib.tree.DecisionTree.run(DecisionTree.scala:60),org.apache.spark.mllib.tree.GradientBoostedTrees$.org$apache$spark$mllib$tree$GradientBoostedTrees$$boost(GradientBoostedTrees.scala:208),scala.Predef$.require(Predef.scala:233)
代码语言:javascript
运行
复制
GBTClassifier gbt = new GBTClassifier().setLabelCol("indexedclick").setFeaturesCol("features_index").setMaxIter(20).**setMaxBins(16094)**.setMaxDepth(30).setMinInfoGain(0.0001).setStepSize(0.00001).setSeed(200).setLossType("logistic").setSubsamplingRate(0.2);

我想知道什么应该是正确的最大bin大小,因为即使我设置了大的MaxBin值,也会导致同样的异常。

你的小小帮助将是非常感谢的。

EN

回答 1

Stack Overflow用户

发布于 2016-09-12 16:22:48

您能否将最大的回收箱设置为比最大分类功能中的条目数多一个,在本例中将其设置为16095。即setMaxBins(16095)

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39073602

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档