我有一个名为"test“的表,其中两列如下所示:12 a87 b
35我想知道的是,每个“组”有多少不同的标识符。例如,使用上面的表,组"c“将有2个标识符,相同的标识符可以在每个组中出现不止一次;对于组c,35出现两次,但我希望它只显示一次。much larger and there would be hundreds of more grouping in
根据此处的讨论,confused about random_state in decision tree of scikit learn 由于我将random_state设置为1,因此我确实具有一致的指标,因为我每次都生成相同的树。但是,当random_state设置为default -- > none时,每次生成的不同树都有不同的性能指标,有些比另一些好,有些则更差。那么我们如何获得可能的最