尝试获取R中数据帧中每列的频率计数和百分比

、、、、

我有如下数据： pat# sex race group bmi 2 M Asian 2 8 25 M Asian 1 17 27 F Black 3 26 我想要得到每个变量的频率和每个变量的百分比% % % Asian frequency %

浏览 28提问于2021-08-02得票数 1

回答已采纳

4回答

R中数据帧中列中零的计数，并以百分比表示

我希望计数R数据帧中每列中的零数，并将其表示为百分比。是否应将此百分比添加到原始数据帧的最后一行？示例y <- c(3, 0, 9, 12, 15)希望查看每<e

浏览 1提问于2013-09-23得票数 4

回答已采纳

1回答

R-汇总每列的因子级别计数

、、、、

我有一个数据帧，其中包含许多列，这些列都编码为因子变量。每一列都是基于只有两个选项的问题: 1=yes和2=no，或者缺少。每一行都是一个参与者。，其中每个问题作为行，以及每个因素出现的变量频率的计数。这也允许我使用dplyrs mutate函数，并计算百分比等。我想要一个包含计数数据的<em

浏览 27提问于2021-09-15得票数 0

2回答

pyspark数据帧中所有列的总计数为零

、、

我需要找出pyspark dataframe中所有列中0的百分比。如何在数据帧中找到每一列的零计数？附言:我尝试过将数据帧转换为pandas数据帧，并使用了value_counts。但是，对于大型数据集来说，推断它的观察值是不可能的。

浏览 0提问于2018-08-20得票数 4

1回答

R计算数据帧中的百分比值

、、

我今天的问题指的是我正在R上工作的一个数据帧。数据帧的头部如下:String(唯一)，Integer N0-23问题是，我不需要字符串在某个特定时刻<e

浏览 1提问于2012-09-25得票数 2

回答已采纳

1回答

显示频率(%)并在条形图上计数

、、

我有一个有三列的数据框架： df <- data.frame( as.factor(c("Good"，"Bad"))，n= c(700,300)，freq = c(70，30))我使用以下代码创建基于因子变量频率的条形图：

浏览 4提问于2015-10-07得票数 1

回答已采纳

1回答

关联规则中的支持结果小于5%。

、、

我正面临一个协会规则的问题。我有一个由事务ID和ProductID组成的数据集，我编辑了变量，并将TransactionID角色更改为"ID“，将productID角色更改为”目标“，最小支持%设置为5%。但是当我管理这个协会的时候，我得到的支持率还不到5%。可能出什么事了？

浏览 3提问于2015-06-10得票数 1

回答已采纳

1回答

如何提高迭代的性能

、

我有一个巨大的数据集，我需要计算每一行的重复项的数量。例如:在特定行中，我有客户X。我需要创建一个新列，该列将显示客户X在数据集中注册的次数。我做了一个关于这方面的代码，但性能非常差。我将花费大约3天的时间，直到数据集完成。有人能帮助提高这个计算的性能吗？下面是我的想法的一个例子： #importing resources im

浏览 12提问于2020-07-29得票数 1

1回答

如何最好地将两个数据集的分类值的频率与Pandas进行比较？

、、、

我试图比较两组数据，每组数据都使用Pandas和Matplotlib列出的分类变量。我希望通过对每个数据集使用value_counts()方法来获取并以某种方式存储每个变量的值频率，以便以后比较这两个变量在这些频率上的显著差异。到目前为止，我只使用一个函数将数据帧中每一列的值和计数</

浏览 7提问于2022-10-23得票数 0

1回答

R中的Countif函数(excel)

、、、

我有一个数据集"a“，它的列"id”大约有23,000行，这在这个数据帧中是唯一的。我想要计算这些唯一值在另外两个数据集"b“和"c”中的出现频率。"id“是数据帧"b”中的第45列。这段代码适用于b中的</

浏览 1提问于2016-04-29得票数 0

1回答

熊猫连续统计类别频率

、

我在这里看到的问题都是关于groupby和按列计数的。如果我有一个看起来像这样的数据帧：0 Apple 0.3 Pear 0.4 Apple 我想计算这些特定列的类别频率: a、c、e为每一行，并为最频繁的类别创建一列。在本例中，它将是<em

浏览 17提问于2020-02-06得票数 0

回答已采纳

1回答

R studio中的频率/计数变量

、、

在SPSS中，我有一个包含三个变量的数据集:保险(分类，4级)；npo_violation (分类，2级)和频率(规模，这表示例如，医疗补助违反非营利组织的频率)。example dataset in SPSS 我正在尝试将这个带有频率计数变量的数据集带到r-studio中，这样我就可以根据组合的百分比制作分组

浏览 28提问于2020-06-11得票数 1

回答已采纳

1回答

Pyspark dataframe:交叉表或其他方法将行标记为新列

、、

我有一个pyspark数据帧，如下图所示：例如，我有四列:年份、单词、计数、频率。这一年是从2000年到2015年。我可以对(pyspark) dataframe进行一些操作，这样我就可以得到如下图所示的结果：新的数据框列应该是: word、frequency_2000、frequency_2001、frequency每一年中每个单词的频率

浏览 35提问于2018-12-11得票数 3

1回答

在R- Text分析中合并数据框

、、

我正在对20个新闻组数据集进行一些文本分析，其中一部分依赖于根据所述文章中的单词对不同文章进行分类。我目前所能做的就是解析一篇文章，然后编译关于它的统计数据。我可以在每篇文章中单独做这件事，但将文章组合在一起似乎是我的缺点。在R中，我希望能够做的事情如下：获取两个(理想情况下是任意数量)已解析和词干提取的单词的频率</

浏览 1提问于2013-07-03得票数 0

回答已采纳

2回答

二进制信号频率和持续时间的计算

、、、、

我试图分析一些120赫兹采集的信号数据。我有Excel和SPSS (以及MATLAB，但我不太熟悉它)。我已经在网上搜索了大约一个半小时，似乎找不到我要找的东西，尽管我知道应该比较简单。我有一个0和1的列表。我想计算每个信号的持续时间，然后绘制出信号的频率分布(即，一个直方图描述信号的百分比@1/10秒，百分比的信号@2/10秒，@3/

浏览 2提问于2014-09-25得票数 1

回答已采纳

1回答

在spark/scala中寻找计算数据帧频率分布的方法

、

我想使用spark和scala计算数据帧的频率分布(返回每列中最常见的元素以及它出现的次数)。我尝试过使用DataFrameStatFunctions库，但在我只过滤了数字类型列的数据帧之后，我无法应用该库中的任何函数。创建UDF的最佳方式是什么？

浏览 0提问于2016-07-02得票数 2

2回答

快速计算差值字数数据帧

、

一段时间以来，我一直在为以下问题而挣扎：我想计算两个数据帧之间的字数差异(特征出现的频率)。数据帧包含两列:特征(单词)和频率。我想用df A en df B实现以下结果:来自df A的所有特征/单词和A的频率减去B的频率。但是，当A中的特征没有出现在B中

浏览 12提问于2018-09-05得票数 0

回答已采纳

1回答

使用lapply对多个数据帧中的单个列中的值进行计数

、、、、

我正在尝试计算数据帧的单个列中特定值出现的百分比。我使用以下代码加载单个数据帧，并计算sinlge列"Counter“中每个值的总计数。然后，我将其除以该数据帧中存在的行数，以获得百分比。Counter)/length(test$Coun

浏览 22提问于2021-06-01得票数 0

回答已采纳

1回答

附加多个计数器()对象并转换为数据帧

、、

我希望在多个.txt文件中找到保留单词列表的单词频率，作为一个熊猫数据框架。我使用的是collections.Counter()对象，如果某个单词没有出现在文本中，那么该单词(key)的值在Counter()中为零。理想情况下，结果是一个数据帧，其中每一行对应于每个.txt文件，列标题对应保留字，列i列j中的条目对应于i- .t

浏览 2提问于2018-10-10得票数 0

回答已采纳

1回答

使用分面在geom_bar中的列上方添加百分比

、

我有一个包含多列的数据集。我使用简单的条形图直观地总结了几个柱状图。(value))) + facet_wrap(~ key, scales = "free_x", as.table = TRUE) + xlab("") 现在，我想在4列中的每一列上添加百分比，说明每列表示数据帧中行的

浏览 52提问于2020-04-21得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

R中数据帧中列中零的计数，并以百分比表示

R-汇总每列的因子级别计数

pyspark数据帧中所有列的总计数为零

R计算数据帧中的百分比值

显示频率(%)并在条形图上计数

关联规则中的支持结果小于5%。

如何提高迭代的性能

如何最好地将两个数据集的分类值的频率与Pandas进行比较？

R中的Countif函数(excel)

熊猫连续统计类别频率

R studio中的频率/计数变量

Pyspark dataframe:交叉表或其他方法将行标记为新列

在R- Text分析中合并数据框

二进制信号频率和持续时间的计算

在spark/scala中寻找计算数据帧频率分布的方法

快速计算差值字数数据帧

使用lapply对多个数据帧中的单个列中的值进行计数

附加多个计数器()对象并转换为数据帧

使用分面在geom_bar中的列上方添加百分比

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐