腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
pd.cut
进行
二
值
化
、
我希望将它们
二
进制化成两个:0表示“无病”,1-4表示“有病”binarize_outcome['Outcome']=
pd.cut
(outcome_variable['Outcome'],
浏览 10
提问于2021-03-10
得票数 0
回答已采纳
1
回答
熊猫交叉表用于Pandas剪裁时:输出交叉表的行名不匹配
、
、
、
我有一些带有
二
进制(0和1)标签的数据。在对新字段执行
pd.cut
之前,我
使用
continuous_value对一个特性
进行
离散
化
。continuous_value为非阴性.118个数据点有continuous_value = 0,所以最小的bin边是-1,包括这些.在这个最小的例子中,数据被切割成两个回收箱:(-1到0),它只包括那些
值
为bins=[-1,0,5000000] input_df['discrete_value']=
pd.cut
(in
浏览 3
提问于2018-07-17
得票数 1
回答已采纳
1
回答
熊猫类寻价值箱
、
我想对数组
进行
离散
化
:我
使用
的是are pandas.cutimport pandas as pdfactor =
pd.cut
(arr, 2) 如何获得任意
值
的因子bin (即2.5位于第一个bin中)?
浏览 2
提问于2017-03-12
得票数 0
回答已采纳
1
回答
用熊猫索引间隔数据
、
、
我想选择熊猫数据中某个特定百分位数以上的变量的
值
。我尝试过用
pd.cut
来
使用
二
进制数据,但是结果是熊猫间隔(我想是无序的),我不知道如何选择
值
。np.random.randint(0,100,size=150), columns=['whatever'])df['bin']=
pd.cut
(df.iloc[:,0],df_bins) 如何根据列bin的
值
浏览 0
提问于2018-04-20
得票数 1
回答已采纳
1
回答
pd.cut
的令人困惑的结果
、
、
、
我需要从具有最小
值
0和最大
值
1990161的序列
值
创建范围。 我在考虑创建5个长度相等的范围,所以应用了"
pd.cut
“,得到了这个结果。
pd.cut
(df['v'], 5)[(-1990.161, 398032.2], (796064.4,“make从实际
值
开始的范围,所以最小的范围应该从0开始。第
二
,上述代码只是添加了标签,而不是调整范围的边
浏览 24
提问于2019-06-07
得票数 1
1
回答
用于分类的最小方差的Python - bin大小
、
、
我想将我的特征' age‘从一个连续变量更改为
二
进制分类的年龄范围的分类变量,如下所示:然而,我希望以最优的方式对其
进行
拆分,以便能够最有效地对数据
进行
分类。也就是说,年龄范围内的类的
浏览 4
提问于2017-06-30
得票数 1
回答已采纳
1
回答
根据其他表中的
值
向数据添加波段
、
我一直在尝试
使用
cut函数,但我似乎无法从表2中的Min_Distance和Max_Distance中读取数据。
pd.cut
(Distance.Distance, bins=Bands.Bins, labels=False) 如有任何帮助或建议,将不胜感激。 谢谢。
浏览 12
提问于2019-07-02
得票数 0
回答已采纳
1
回答
在matplotlib中取平方桶的平均值
、
、
我现在有一个散点图,里面有3组数据,一个x坐标,y坐标,每个x,y都有一个
值
,这些都是一维的数值数组。
浏览 2
提问于2017-06-07
得票数 3
1
回答
使用
pd.cut
- pandas对列
值
进行
分组
、
、
return 50 return 10 df['Score'] = df['Age'].apply(AgeScoring) 我的问题是如何通过
使用
pd.cut
来实现这一点
浏览 22
提问于2020-09-03
得票数 0
回答已采纳
1
回答
熊猫如何在没有绝对价值范围的情况下
进行
包装和分组
、
、
、
我有大量的纬度和经度
值
,我想把它们放在一起,以便在热图上显示它们(ipyleaflet似乎只允许热图中的2000点左右,而且当
使用
大数据时,这也会更有效)。我实际上是在
使用
vaex,但是用pandas来回答也很好。 pandas
pd.cut
函数在绑定方面似乎很有用,但是它生成一个分类列(category dtype),它看起来像bin中所有
值
的列表。(dft['latitude'], bins=3, labels=False).astype(str) + "_"
浏览 5
提问于2021-03-24
得票数 1
回答已采纳
1
回答
如何在离散
化
方法中
进行
绑定,并将其标记为高、低--我已经这样做了--下面的方法对于绑定和标记itt有什么捷径吗?
、
虹膜数据集#我们
使用
离散
化
,因为它将连续数据转换为DICRETE数据#我们对每一列数据‘Sepal.Length’=
pd.cut
( data'Sepal.LengthSepal.Length‘..min(),DATA’Sepal.Length‘..mean(),data’Sepal.Length‘..max()),标签= "low",“high” 数据‘Sepal.Width’=
pd.cut
Sepal.Width‘..min(),data’Sepal.Wi
浏览 1
提问于2022-08-09
得票数 1
回答已采纳
1
回答
具有聚合功能的pd.merge_asof
、
、
给定一个开始时间为新时间段(新工作班次)的数据帧,将截至下一时间段(工作班次)的所有销售额相加。 import pandas as pddf_sales = pd.DataFrame({'time':[2,6,7,9,15], 'soldCount':[1,2,3,4,5]}) # This is the wanted
浏览 15
提问于2021-04-18
得票数 2
回答已采纳
1
回答
Pandas中的自定义范围框(间隔始终从零开始)
、
我
使用
: bins =
pd.cut
(data['R10rank'], list(np.arange(0.0, 1.1, 0.1)))(0.7, 0.8] 493 -2.745312(0.9, 1.0] 374 -6.364374 下一步,我希望看到的是在不同的
值
间隔内聚合统计数据的存储箱像这样: <0.1<0.5
浏览 17
提问于2019-06-11
得票数 0
1
回答
绘制具有求和
值
而不是计数的
二
维直方图
、
我有一个数据集: x,y坐标,每个x,y都有一个
值
。我想绘制一个
二
维直方图,用色标显示每个bin中的
值
的总和。matplotlib hexbin是直接的。我能做这些。
浏览 1
提问于2017-03-09
得票数 0
1
回答
熊猫回收量减少
、
、
当
使用
pd.cut
(df['series'], 100)时,我得到了33个唯一的回收箱。>>> 30>>> 100 这里是我描述的数据,没有缺少
值
。
浏览 1
提问于2021-05-01
得票数 1
回答已采纳
1
回答
基于条件的变量分组
、
、
、
、
一些同事告诉我要避免在数据帧中
使用
循环。我还附上了一张关于我的散点图的图片,它可以帮助你可视
化
我的数据。提前谢谢你!
浏览 3
提问于2019-11-14
得票数 0
回答已采纳
1
回答
大熊猫双标值的选择
、
、
我有一个数据框架,只有几个列具有绑定
值
。这些被绑定的
值
是
使用
pd.cut
() option.The数据类型为列提供的;group_transactionobject如上所示,有两个列已经绑定了
值
,为了方便起见,我将它们转换为字符串。此
值
存在于数据框架中,如下所示:这个代码给出了第一行,如下所示; group_c
浏览 0
提问于2019-05-11
得票数 2
回答已采纳
1
回答
如何创建具有索引中的
值
范围和帧中的标头和
值
的枢轴表?
、
、
这是我的输入数据 和我想要的输出0-50 56 22 56101-150 52 27 89
浏览 1
提问于2020-08-26
得票数 0
1
回答
dask map_partitions(
pd.cut
,回收箱)真的会对整个数据
进行
操作吗?
、
、
、
我需要在dataframe上
使用
pd.cut
。似乎map_partitions一次只将一个分区传递给函数。但是,
pd.cut
需要访问整个df列才能创建回收箱。所以,我的问题是:在这种情况下,map_partitions是真的对整个数据
进行
操作,还是
使用
这种方法会得到不正确的结果?
浏览 2
提问于2021-06-01
得票数 1
回答已采纳
1
回答
python将数据划分为间隔
、
、
02 0.9815;2022-11-04 0.9984;6346行×1列df1=
pd.cut
浏览 1
提问于2022-11-07
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用MICE进行缺失值的填充处理
使用FME进行属性挂接之(二)
使用Python实现二值图像中心线提取
使用Templ进行Go模板化
使用Puppeteer进行自动化测试
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券