有没有办法在R中的数据帧中只保留重复的行？

在R中，可以使用函数duplicated()来判断数据框中的重复行。为了只保留重复行，可以使用该函数的结果作为索引，将其传递给数据框，从而筛选出重复的行。

以下是一个示例代码：

# 创建一个示例数据框
df <- data.frame(
  ID = c(1, 2, 3, 4, 2, 3, 5),
  Name = c("John", "Jane", "Tom", "Alice", "Jane", "Tom", "Bob")
)

# 判断重复行
duplicated_rows <- duplicated(df)

# 保留重复的行
duplicate_df <- df[duplicated_rows, ]

这里，duplicated()函数返回一个逻辑向量，表示数据框中每一行是否是重复行。然后，通过将该逻辑向量传递给数据框df作为索引，可以筛选出重复的行并存储在duplicate_df中。

对于该问题，推荐使用腾讯云的云计算服务，腾讯云提供了丰富的云产品和解决方案，可以满足各种云计算需求。您可以访问腾讯云官方网站（https://cloud.tencent.com/）了解更多关于腾讯云的信息。

有没有办法在R中的数据帧中只保留重复的行？

我有一个包含91个变量的数据帧。我试图只提取行中每个单个值都与另一个值重复的行。我可以使用unique函数或distinct函数来查看有233行是重复的。我想用这233条记录创建一个数据帧。我看到的关于类似问题的大多数答案都集中在通过某种ID变量查找重复值，但是我的<

浏览 16提问于2021-10-25得票数 1

回答已采纳

2回答

Pandas通过为数据帧之间的每个重复行仅删除一行来合并两个数据帧

、、

我有两个数据帧，我正在合并它。在合并时，它应该删除重复项。但是对于帧1中的一个重复行，它应该只删除帧2中的一个重复行，即使有两个这样的行，如下面的df1： colA colB colC 1 1 2 1 2

浏览 32提问于2021-01-23得票数 1

回答已采纳

1回答

如何删除python数据报中的重复行并分配给新数据报，但保留原始原始数据帧

、、

我是python的新手，在编写python代码时犯了一个错误，就像我对SAS一样。有没有办法从数据帧中删除基于一组关键字的重复行，并将其分配给新的数据报，同时保留原始原始数据帧

浏览 15提问于2020-08-03得票数 0

1回答

如何从文本语料库中切分特定词周围的X个词

、

我正在分析我上传到R的演讲。我的数据帧包括每个演讲的一行，其中包含元数据和演讲的整个文本。但是-我不想只分析整个演讲，还想找到一种方法来分析特定单词周围的文本块。例如，引用“RED”前后的50个单词...有没有办法创建一个新的数据帧--每一行都是分段的文本

浏览 10提问于2016-08-20得票数 1

5回答

基于规则合并R中的两行数据

、

Page Path Page Title Byline Pageviews668当我有这些类型的重复页面路径时，我想合并相同的</em

浏览 5提问于2016-05-31得票数 3

回答已采纳

2回答

Spark数据帧上的多个联接重复记录

、、、

我正在尝试对两个Spark数据帧进行两次连接，之后我希望保留第二个数据帧中的条目，并且只保留第一个数据帧中匹配的结果。到目前为止，我得到的是： val join1 = blacklist.where($"RULE_TYPE".equalTo("S")).join(data,$"DEVICE

浏览 0提问于2018-06-13得票数 0

2回答

从numpy数组中删除pandas中的特定行

、

我有一个数千行长的数据帧，看起来像这样： ID Email Address2 ... ... 4 ... ..我想做的是删除重复的ID，这样每个人只有一个ID。我不能使用drop_duplicates()，因为大多数人没有ID，这也会丢弃他们(不好！) 有没有办法删除特定的行并且只保留

浏览 16提问于2018-12-21得票数 1

回答已采纳

3回答

在熊猫中，除了一个例外，如何使用drop_duplicates？

、、、、

在Python3和pandas中，我需要通过重复列中的值来消除数据帧中的重复行。为此，我使用了： consolidado = df_processos.drop_duplicates(['numero_unico'], keep='last') "numero_unico“列的字符串格式为因此，上面的命令只

浏览 32提问于2019-10-10得票数 1

回答已采纳

5回答

删除特定列中具有特定值的重复行

、

我有一个数据框架，我希望删除除一列以外的所有列中重复的行，并选择保留不确定值的行。在上面的示例中，除了col3之外，所有列都重复第3行和第4行，所以我只想保留一行。复杂的步骤是我想保留第4行而不是第3行，因为col3中的

浏览 2提问于2020-03-27得票数 3

回答已采纳

2回答

合并成一行后，合并重复行并删除所有重复行

、、、

我有一个具有多个重复I的pandas数据帧，如下所示：ENE80R NN YENE80R Y N N我想要实现的是： id col

浏览 20提问于2018-01-08得票数 0

回答已采纳

1回答

如何删除pandas数据帧中的多个(~5000)列？

、、

我有一个有5632列的数据帧，我只想保留其中的500列。我还将列名(我希望保留的列名)放在一个数据帧中，并将这些列名作为行索引。有没有办法做到这一点？

浏览 17提问于2019-03-25得票数 0

1回答

如何在保留最新版本的同时从火花数据框架中删除重复项？

、

我想删除基于数据帧的两列的重复，保留最新的(我有时间戳列)。最好的办法是什么？请注意，副本可能分布在分区之间。我是否可以删除保留上一张记录的副本而不进行洗牌？我在处理1 TB的数据。我想通过这两列对数据框架进行分区，这样所有重复的记录都将被“一致散列”到同一个分区中<

浏览 0提问于2019-04-12得票数 7

回答已采纳

2回答

如何检查python中是否有重复的键行，以及如何选择python中数值列值最大的行

、、、、

我有以下数据集： ? 我需要丢弃有重复键值的行，并只保留具有最大年龄的数据帧中的单行值。以下是所需的输出： ? 我希望问题陈述被很好地定义了。

浏览 33提问于2020-07-08得票数 0

回答已采纳

4回答

根据第二列条件删除重复项

我试图根据不同列上的最大值从数据帧中删除重复行。因此，对于数据框架： a 2

浏览 1提问于2014-09-21得票数 15

回答已采纳

1回答

根据列表中给定的优先级保留重复行

、、、、

我有一个数据帧 df = pd.DataFrame([["A","Q",98,56],["C","S",18,45], ["B","T",79,54], ["A","P",98,56],["C","R,"c2"]) 我有一份清单 Priority = ["P","R",&quo

浏览 15提问于2021-03-30得票数 1

回答已采纳

1回答

通过pandas保留Excel下拉列表

、、

我有一个excel文件，其中的标题有下拉列表，可用于根据特定的列值选择行( where语句所做的正是如此)。我将这个文件导入到pandas中并执行一些操作。假设我删除基于"emp_id“列的重复值” data = data.drop_duplicates(['emp_id']) 然后我把这个数据帧保存到excel中， data.to_excel("new_data.xlsx&q

浏览 135提问于2020-01-15得票数 2

回答已采纳

1回答

我进行了一项小型的试点研究，目前我正在分析我的反应时间数据。在我的数据中，我正在查看列的反应时(RT) --一些行只有一个单数值，如下面的0.8414999999999964 其他人有类似于此1.01130000119143、1.368999999999999998或0.7324999999999875,1.1204999999999927,1.3931000000238214的倍数。是否有一种方法可以将最终值<em

浏览 3提问于2022-09-29得票数 -1

1回答

如何删除一行中的重复值？

、

我有一个有数千行的数据帧；在每一行中，一些值是重复的。我希望删除这些重复项，只保留唯一的值。为了说明这一点，以下是原始数据：0 A B A2 E

浏览 0提问于2018-05-24得票数 2

1回答

仅取R中数据框所有列的重复in的最大值

、、、

我有24525行22列的数据帧。最后一列是ID列，其他列是数字列。唯一ID数为18414，部分ID重复次数超过2次。有谁知道完成这项任务的方法吗？

浏览 0提问于2021-01-13得票数 0

1回答

Python Pandas数据帧-如何缩短帧

、、

我有一个有一百万个条目的数据帧。python程序正在搜索特定的条目，并将这些条目冒泡到框架的顶部。然后，我想将仅包含感兴趣的条目的帧写入csv文件。有没有办法缩短帧的长度，使其现在只包含感兴趣的条目，而不是保留1m行的长度？示例-假设有100个条目是感兴趣的。它们现在是帧的前

浏览 0提问于2020-10-12得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

有没有办法在R中的数据帧中只保留重复的行？

相关·内容

有没有办法在R中的数据帧中只保留重复的行？

Pandas通过为数据帧之间的每个重复行仅删除一行来合并两个数据帧

如何删除python数据报中的重复行并分配给新数据报，但保留原始原始数据帧

如何从文本语料库中切分特定词周围的X个词

基于规则合并R中的两行数据

Spark数据帧上的多个联接重复记录

从numpy数组中删除pandas中的特定行

在熊猫中，除了一个例外，如何使用drop_duplicates？

删除特定列中具有特定值的重复行

合并成一行后，合并重复行并删除所有重复行

如何删除pandas数据帧中的多个(~5000)列？

如何在保留最新版本的同时从火花数据框架中删除重复项？

如何检查python中是否有重复的键行，以及如何选择python中数值列值最大的行

根据第二列条件删除重复项

根据列表中给定的优先级保留重复行

通过pandas保留Excel下拉列表

有没有办法在R中的数据中只保留行中的最后一个值？

如何删除一行中的重复值？

仅取R中数据框所有列的重复in的最大值

Python Pandas数据帧-如何缩短帧

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐