腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
4
回答
尝试
获取
R
中
数据
帧
中
每
列
的
频率
计数
和
百分比
、
、
、
、
我有如下
数据
: pat# sex race group bmi 2 M Asian 2 8 25 M Asian 1 17 27 F Black 3 26 我想要得到每个变量
的
频率
和
每个变量
的
百分比
% % % Asian frequency %
浏览 28
提问于2021-08-02
得票数 1
回答已采纳
4
回答
R
中
数据
帧
中
列
中
零
的
计数
,并以
百分比
表示
我希望
计数
R
数据
帧
中
每
列
中
的
零数,并将其表示为
百分比
。是否应将此
百分比
添加到原始
数据
帧
的
最后一行?示例y <- c(3, 0, 9, 12, 15)希望查看
每
<e
浏览 1
提问于2013-09-23
得票数 4
回答已采纳
1
回答
R
-汇总
每
列
的
因子级别
计数
、
、
、
、
我有一个
数据
帧
,其中包含许多
列
,这些
列
都编码为因子变量。
每
一
列
都是基于只有两个选项
的
问题: 1=yes
和
2=no,或者缺少。
每
一行都是一个参与者。,其中每个问题作为行,以及每个因素出现
的
变量
频率
的
计数
。这也允许我使用dplyrs mutate函数,并计算
百分比
等。我想要一个包含
计数
数据
的
<em
浏览 27
提问于2021-09-15
得票数 0
2
回答
pyspark
数据
帧
中所有
列
的
总
计数
为零
、
、
我需要找出pyspark dataframe中所有
列
中
0
的
百分比
。如何在
数据
帧
中找到
每
一
列
的
零
计数
? 附言:我
尝试
过将
数据
帧
转换为pandas
数据
帧
,并使用了value_counts。但是,对于大型
数据
集来说,推断它
的
观察值是不可能
的
。
浏览 0
提问于2018-08-20
得票数 4
1
回答
R
计算
数据
帧
中
的
百分比
值
、
、
我今天
的
问题指的是我正在
R
上工作
的
一个
数据
帧
。
数据
帧
的
头部如下:String(唯一),Integer N0-23问题是,我不需要字符串在某个特定时刻<e
浏览 1
提问于2012-09-25
得票数 2
回答已采纳
1
回答
显示
频率
(%)并在条形图上
计数
、
、
我有一个有三
列
的
数据
框架: df <- data.frame( as.factor(c("Good","Bad")),n= c(700,300),freq = c(70,30))我使用以下代码创建基于因子变量
频率
的
条形图:
浏览 4
提问于2015-10-07
得票数 1
回答已采纳
1
回答
关联规则
中
的
支持结果小于5%。
、
、
我正面临一个协会规则
的
问题。我有一个由事务ID
和
ProductID组成
的
数据
集,我编辑了变量,并将TransactionID角色更改为"ID“,将productID角色更改为”目标“,最小支持%设置为5%。但是当我管理这个协会
的
时候,我得到
的
支持率还不到5%。可能出什么事了?
浏览 3
提问于2015-06-10
得票数 1
回答已采纳
1
回答
如何提高迭代
的
性能
、
我有一个巨大
的
数据
集,我需要计算
每
一行
的
重复项
的
数量。例如:在特定行
中
,我有客户X。我需要创建一个新
列
,该
列
将显示客户X在
数据
集中注册
的
次数。我做了一个关于这方面的代码,但性能非常差。我将花费大约3天
的
时间,直到
数据
集完成。有人能帮助提高这个计算
的
性能吗?下面是我
的
想法
的
一个例子: #importing resources im
浏览 12
提问于2020-07-29
得票数 1
1
回答
如何最好地将两个
数据
集
的
分类值
的
频率
与Pandas进行比较?
、
、
、
我试图比较两组
数据
,每组
数据
都使用Pandas
和
Matplotlib列出
的
分类变量。我希望通过对每个
数据
集使用value_counts()方法来
获取
并以某种方式存储每个变量
的
值
频率
,以便以后比较这两个变量在这些
频率
上
的
显著差异。到目前为止,我只使用一个函数将
数据
帧
中
每
一
列
的
值
和
计数</
浏览 7
提问于2022-10-23
得票数 0
1
回答
R
中
的
Countif函数(excel)
、
、
、
我有一个
数据
集"a“,它
的
列
"id”大约有23,000行,这在这个
数据
帧
中
是唯一
的
。我想要计算这些唯一值在另外两个
数据
集"b“
和
"c”
中
的
出现
频率
。"id“是
数据
帧
"b”
中
的
第45
列
。这段代码适用于b
中
的</
浏览 1
提问于2016-04-29
得票数 0
1
回答
熊猫连续统计类别
频率
、
我在这里看到
的
问题都是关于groupby
和
按列
计数
的
。如果我有一个看起来像这样
的
数据
帧
:0 Apple 0.3 Pear 0.4 Apple 我想计算这些特定
列
的
类别
频率
: a、c、e为
每
一行,并为最频繁
的
类别创建一
列
。在本例
中
,它将是<em
浏览 17
提问于2020-02-06
得票数 0
回答已采纳
1
回答
R
studio
中
的
频率
/
计数
变量
、
、
在SPSS
中
,我有一个包含三个变量
的
数据
集:保险(分类,4级);npo_violation (分类,2级)
和
频率
(规模,这表示例如,医疗补助违反非营利组织
的
频率
)。example dataset in SPSS 我正在
尝试
将这个带有
频率
计数
变量
的
数据
集带到
r
-studio
中
,这样我就可以根据组合
的
百分比
制作分组
浏览 28
提问于2020-06-11
得票数 1
回答已采纳
1
回答
Pyspark dataframe:交叉表或其他方法将行标记为新
列
、
、
我有一个pyspark
数据
帧
,如下图所示:例如,我有四
列
:年份、单词、
计数
、
频率
。这一年是从2000年到2015年。我可以对(pyspark) dataframe进行一些操作,这样我就可以得到如下图所示
的
结果:新
的
数据
框
列
应该是: word、frequency_2000、frequency_2001、frequency
每
一年
中
每个单词
的
频率
浏览 35
提问于2018-12-11
得票数 3
1
回答
在
R
- Text分析
中
合并
数据
框
、
、
我正在对20个新闻组
数据
集进行一些文本分析,其中一部分依赖于根据所述文章
中
的
单词对不同文章进行分类。我目前所能做
的
就是解析一篇文章,然后编译关于它
的
统
计数据
。我可以在每篇文章
中
单独做这件事,但将文章组合在一起似乎是我
的
缺点。在
R
中
,我希望能够做
的
事情如下:
获取
两个(理想情况下是任意数量)已解析
和
词干提取
的
单词
的
频率</
浏览 1
提问于2013-07-03
得票数 0
回答已采纳
2
回答
二进制信号
频率
和
持续时间
的
计算
、
、
、
、
我试图分析一些120赫兹采集
的
信号
数据
。我有Excel
和
SPSS (以及MATLAB,但我不太熟悉它)。我已经在网上搜索了大约一个半小时,似乎找不到我要找
的
东西,尽管我知道应该比较简单。我有一个0
和
1
的
列表。我想计算每个信号
的
持续时间,然后绘制出信号
的
频率
分布(即,一个直方图描述信号
的
百分比
@1/10秒,
百分比
的
信号@2/10秒,@3/
浏览 2
提问于2014-09-25
得票数 1
回答已采纳
1
回答
在spark/scala
中
寻找计算
数据
帧
频率
分布
的
方法
、
我想使用spark
和
scala计算
数据
帧
的
频率
分布(返回
每
列
中最常见
的
元素以及它出现
的
次数)。我
尝试
过使用DataFrameStatFunctions库,但在我只过滤了数字类型
列
的
数据
帧
之后,我无法应用该库
中
的
任何函数。创建UDF
的
最佳方式是什么?
浏览 0
提问于2016-07-02
得票数 2
2
回答
快速计算差值字数
数据
帧
、
一段时间以来,我一直在为以下问题而挣扎: 我想计算两个
数据
帧
之间
的
字数差异(特征出现
的
频率
)。
数据
帧
包含两
列
:特征(单词)
和
频率
。我想用df A en df B实现以下结果:来自df A
的
所有特征/单词
和
A
的
频率
减去B
的
频率
。但是,当A
中
的
特征没有出现在B
中
浏览 12
提问于2018-09-05
得票数 0
回答已采纳
1
回答
使用lapply对多个
数据
帧
中
的
单个
列
中
的
值进行
计数
、
、
、
、
我正在
尝试
计算
数据
帧
的
单个
列
中
特定值出现
的
百分比
。我使用以下代码加载单个
数据
帧
,并计算sinlge
列
"Counter“
中
每个值
的
总
计数
。然后,我将其除以该
数据
帧
中
存在
的
行数,以获得
百分比
。Counter)/length(test$Coun
浏览 22
提问于2021-06-01
得票数 0
回答已采纳
1
回答
附加多个
计数
器()对象并转换为
数据
帧
、
、
我希望在多个.txt文件中找到保留单词列表
的
单词
频率
,作为一个熊猫
数据
框架。我使用
的
是collections.Counter()对象,如果某个单词没有出现在文本
中
,那么该单词(key)
的
值在Counter()
中
为零。理想情况下,结果是一个
数据
帧
,其中
每
一行对应于每个.txt文件,
列
标题对应保留字,
列
i
列
j
中
的
条目对应于i- .t
浏览 2
提问于2018-10-10
得票数 0
回答已采纳
1
回答
使用分面在geom_bar
中
的
列上方添加
百分比
、
我有一个包含多
列
的
数据
集。我使用简单
的
条形图直观地总结了几个柱状图。(value))) + facet_wrap(~ key, scales = "free_x", as.table = TRUE) + xlab("") 现在,我想在4
列
中
的
每
一
列
上添加
百分比
,说明
每
列表示
数据
帧
中行
的
浏览 52
提问于2020-04-21
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pandas系列学习(五):数据连接
无序成组设计的行×列表资料的卡方检验之SPSS,SAS,STATA实现
SPSS分析技术:加权个案;让频数记录数据也能用SPSS做列联表分析
研发实战:用Unity Profiler捕获剖析Oculus Quest性能数据
Excel 插件点几下,就能算出各数值占 Excel 分类总和的比重
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券