腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
确定
对
数据
进行
入库
的
最优
箱
、
、
、
、
我有X,Y
数据
,我想根据X值把它们放在一起。但是,我想根据得到
的
bin间隔和每个bin
的
平均Y来
确定
满足条件
的
X bin
的
最佳数量。例如,如果我有 X=[2,3,4,5,6,7,8,9,10] Y=[120,140,143,124,150,140,180,190,200] 我想
确定
满足此条件
的
最佳X bin数:Y bin/(X bin
的
8*宽度)
的
平均值应大于20,但应尽可能接近20。.我目前正在使用: b
浏览 18
提问于2020-07-27
得票数 0
1
回答
大熊猫如何从聚合中按类别定位?
、
我有一些
数据
已经
入库
,然后按
入库
分组,使用.count
对
每个
入库
中
的
条目
进行
计数,并查询每个
入库
的
样本数量import numpy as np valid_bins = df.groupby("bin")[["A"]].count().query("A > 310")
浏览 1
提问于2018-01-08
得票数 1
回答已采纳
4
回答
数据
直方图优化
的
联宽优化
、
我希望从给定
的
数据
集生成
数据
直方图。我读过关于构造直方图
的
不同选项,我最感兴趣
的
是一种基于 该方法采用估计法
确定
最优
仓宽和
最优
分布,因为样本
数据
在分布上会发生变化,而且很难预先
确定
垃圾
箱
的
数量和宽度。有人能推荐一个
浏览 2
提问于2013-01-31
得票数 3
回答已采纳
2
回答
如何在R中绘制预先
入库
的
直方图
、
、
、
对于一个相当大
的
数据
集,我有一个预先
入库
的
频率表。即,
箱
的
单个列向量和与这些
箱
相关联
的
计数
的
单个列向量。我希望R通过
对
现有计数
进行
进一步
的
分类和求和来绘制此
数据
的
直方图。例如,如果在预二进制
数据
中,我有类似于(0.01,5000),(0.02,231),(0.03,948)
的
数据
,其中第一个数
浏览 1
提问于2010-09-25
得票数 10
1
回答
什么时候应该在
数据
处理中使用
数据
入库
?
、
、
、
、
在
数据
预处理中,
数据
入库
是一种将特征
的
连续值转换为分类值
的
技术。例如,有时,
数据
集中
的
age要素
的
值被替换为以下间隔之一: [10,20),[30,40].什么时候是使用
数据
入库
的
最佳时机?它是(总是)在预测系统中导致更好
的
结果,还是可以作为试错工作?
浏览 32
提问于2020-12-28
得票数 0
回答已采纳
1
回答
入库
逻辑中
的
Panda.qcut
、
我正在尝试用不同
的
方法对连续变量
进行
分类。我使用了两个方法- bin_sequence和entropy_based_binning方法qcut。为了测试,我创建了一个具有100个值
的
数据
。我将前50条记录
的
值设置为1,接下来
的
几条记录设置为2,几条记录
的
值设置为5,12,然后随机设置几个数字,从而使
数据
倾斜。 当我试图用数量=6
的
bins运行它时,它只用qcut方法创建了3个bins。从pandas文档中还不清楚它是如何处理倾斜<em
浏览 25
提问于2020-09-09
得票数 0
1
回答
Seaborn.Distplot生成了一个直方图和一条带有不同x轴
的
KDE线--它们是如何在图中合并
的
?
、
、
我使用this从Seaborn.Distplot中提取绘图
数据
。令人惊讶
的
是,直方图和KDE都返回不同
的
x轴值。首先,实用
的
问题是,这两个x轴是如何组合在同一个图中
的
?第二,理论上,问题是为什么垃圾
箱
不匹配-两个密度不应该用相同
的
底层垃圾
箱
创建吗?
浏览 29
提问于2020-06-12
得票数 0
回答已采纳
1
回答
变量与R
的
独立性的卡方检验
、
我必须用R
对
两个物理变量
进行
卡方检验,我正在尝试:Library('gplots')pp<-
浏览 0
提问于2012-03-03
得票数 3
回答已采纳
1
回答
Python/matplotlib在直方图中显示置信度
、
、
、
、
这就是我
的
问题。我有一些
数据
,我把它们放
入库
中,得到一个“数字化”
的
pdf,这很好。现在,我想找到一种方法,通过
对
bin组
进行
不同
的
着色来表示不同
的
置信区间。特别是,从包含我想要找到
的
最高计数
的
垃圾
箱
开始,将所有面积总和小于.6
的
最高垃圾
箱
着色为红色。然后,总是通过递减计数来挑选新
的
垃圾桶,我想给那些将我
的
红色区域增加到橙色.8
浏览 0
提问于2011-06-02
得票数 3
回答已采纳
1
回答
WEKA交叉验证离散化
、
、
我试图通过应用无监督
的
离散化滤波器来提高我
的
WEKA模型
的
准确性。我需要决定回收
箱
的
数量,以及是否应该使用等频率
的
装夹。通常情况下,我会使用一个训练集来优化这一点。但是,在使用交叉验证时,如何
确定
装箱
的
大小以及是否应该使用等频率
的
绑定?我最初
的
想法是在多次交叉验证测试中利用分类器
的
精度结果来找到
最优
的
垃圾
箱
尺寸。然而,尽管使用交叉验证,使用同样<
浏览 1
提问于2015-08-03
得票数 1
回答已采纳
1
回答
通过替换迭代更大
的
Bin大小
的
随机样本,bin列和聚合
数据
、
、
、
", "l", "m", "p", "q", "s", "t", "u", "v","x", "z"), c("1", "2", "3", "4", "5", "6")) 我希望
对
列
进行
分组或bin,然后聚合每个
浏览 36
提问于2019-09-24
得票数 0
回答已采纳
4
回答
在numpy中打包多维数组
、
、
我有一个4Dnumpy数组(这些是成堆
的
成像
数据
),我想沿着除一个轴之外
的
所有轴执行平均
入库
。从say开始 x=np.random.random((3,100,100,100)) 我想要对轴1,2,3应用
箱
大小为10
的
箱
,并平均每个
箱
中
的
值。预期结果将是形状数组(3,10,10,10) 我
对
np.reshape
的
研究是这样
的
: result=x.reshape(3,-1,10,10
浏览 46
提问于2021-05-05
得票数 3
回答已采纳
2
回答
使用
入库
列
的
平均值
对
新列
进行
入库
和命名
我有一个
数据
集,其中列名是数字,行名是样例名(见下文)。599.828" "B" 0 0 0 0 0 1 0 3 "D" 3 0 0 0 3 1 0 0 "599.785&q
浏览 9
提问于2013-07-12
得票数 1
1
回答
焦点和上下文图
的
数据
分组- d3.js
、
我有一个使用d3.js开发
的
焦点和上下文条形图,它工作得很好,但当我缩小区域时,我想显示该图
的
分组值。如下面的屏幕截图所示,其中有两个值为1
的
条形图,但当我缩小显示它一个月
的
数据
时,它只显示一个值为1
的
条形图。 this.rende
浏览 8
提问于2014-02-28
得票数 2
1
回答
有效聚类算法
、
、
我需要帮助(最好是一个完整
的
算法,但任何提示或参考将不胜感激),有以下算法问题: 假设我们在一个数字轴上有以下点:1,11
浏览 4
提问于2017-11-16
得票数 2
回答已采纳
1
回答
在给定一些
数据
的
情况下有多少个箱子
、
、
、
、
我必须使用直方图绘制一些
数据
。我
的
数据
在0,1之间,在任何特定
的
点上都没有很大
的
集中度。 样本数和桶数(等长)之间
的
比例是多少?
浏览 2
提问于2012-08-21
得票数 2
回答已采纳
1
回答
用最少
的
移动次数最小化装满球
的
桶
的
最大重量
的
算法
、
我想重复这个过程,直到我已经实现了最平衡
的
配置重量桶,采取最少
的
步骤。 贪婪之树:从零开始,
浏览 2
提问于2019-03-14
得票数 0
回答已采纳
1
回答
如何
进行
相对于项目位置
的
锈蚀链接搜索?
、
我正在创建一个C库
的
锈蚀包装器。我将C库放在lib目录中,并使用build.rs告诉编译器在哪里可以找到要链接
的
库:当我构建库时,这很好,但是依赖于包装库
的
下游库会导致编译失败:在编译客户端库时,这不是指向repository\checked_out_project\lib,而是在本地查找,因为在依赖
浏览 5
提问于2017-01-29
得票数 5
回答已采纳
1
回答
代数:如何使用对数/指数拟合重新缩放
数据
、
、
、
我需要对
数据
进行
重新排序,但我终生无法弄清楚如何做到这一点。(Int ((1- (([TD] - min)/( max - min)))*20))+1目前它被拆分成均匀大小
的
存储
箱
,你能重新调整使存储
箱
沿着对数比例或其他指数曲线分解-请参见图表以查看基本
浏览 3
提问于2018-04-21
得票数 0
1
回答
Jenks自然破碎法中
最优
聚类数的
确定
、
我正在使用R中
的
Jenks Natural Break
对
由60000个
数据
点组成
的
大型
数据
集
进行
聚类。通常,k-means使用弯头方法。如何在Jenks上应用弯曲法来
确定
no。
最优
集群?
浏览 30
提问于2020-11-05
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python数据分析中如何对符合条件的数据进行标注
如何对单元格中的数据进行强制换行
关于对旅游饭店进行大数据统计的通知
如何对单元格中的数据进行强制换行
《使用一种新的算法对肝脏数据进行分类》
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券