在numpy中,可以使用numpy.digitize()函数对数值数据进行分类。该函数将数值数据分成多个离散的区间,并返回每个数据所属的区间索引。
具体步骤如下:
import numpy as np
arr = np.array([1.2, 2.4, 3.6, 4.8, 5.0])
bins = np.array([0, 2, 4, 6])
categories = np.digitize(arr, bins)
print(categories)
输出结果为:[1 2 3 3 3]
,表示第一个数值1.2属于第一个区间,第二个数值2.4属于第二个区间,以此类推。
numpy.digitize()函数的参数说明:
right
指定区间边界的包含方式,默认为True,表示右闭合区间,即包含边界值;设置为False表示左闭合区间,不包含边界值。numpy.digitize()函数的返回值是一个与原数组形状相同的数组,其中每个元素表示对应元素所属的区间索引。
应用场景:
推荐的腾讯云相关产品和产品介绍链接地址:
企业创新在线学堂
DBTalk
T-Day
Elastic 中国开发者大会
领取专属 10元无门槛券
手把手带您无忧上云