如何在r中随机保留其中一个重复行(不是第一个重复行)

在R中随机保留其中一个重复行（不是第一个重复行），可以通过以下步骤实现：

基础概念：
- 重复行：在数据集中，多行具有完全相同的值。
- 随机保留：从多个重复行中随机选择一行保留。

相关优势：
- 数据清洗：在数据分析前，去除重复行可以减少数据冗余，提高分析效率。
- 数据多样性：在某些情况下，保留一个随机重复行可以增加数据的多样性。
类型：
- 完全重复行：所有列的值都相同。
- 部分重复行：部分列的值相同。
应用场景：
- 数据预处理：在数据分析前进行数据清洗。
- 数据采样：在机器学习模型训练前进行数据采样。
遇到的问题及解决方法：
- 问题：如何随机保留一个重复行而不是第一个重复行？
- 原因：默认情况下，R的duplicated函数会标记第一个出现的重复行为FALSE，其余为TRUE。
- 解决方法：

# 示例数据
df <- data.frame(
  id = c(1, 2, 2, 3, 3, 3, 4, 4, 4, 4),
  value = c("a", "b", "b", "c", "c", "c", "d", "d", "d", "d")
)

# 找出所有重复行
duplicates <- df[df$duplicated(df), ]

# 随机选择一行保留
random_row <- duplicates[sample(nrow(duplicates), 1), ]

# 将随机选择的行标记为不重复
df[df$duplicated(df), ] <- NA
df <- df[!is.na(df$id), ]
df <- rbind(df, random_row)

# 查看结果
print(df)

参考链接：
- R语言duplicated函数
- R语言sample函数

通过上述步骤，你可以在R中随机保留一个重复行（不是第一个重复行）。这种方法适用于数据清洗和数据采样的场景，确保数据的多样性和减少冗余。

如何在dataframe中随机删除重复值

、、、

假设我有这样的数据： A B C D E 0 5 0 16 32 48 1 5 1 17 33 49 2 5 2 18 34 50 3 5 3 19 35 51 4 5 4 20 36 52 5 4 5 21 37 53 6 4 6 22 38 54 7 3 7 23 39 55 8 3 8 24 40 56 9 3 9 25 41 57 10 3 10 26 42 58 11 2 11 27

浏览 4提问于2022-06-21得票数 0

回答已采纳

1回答

如何使用列表抽象数据类型表示滞后的Fibonacci生成器？

、、、

伪随机数生成器是没有参数的函数，当重复调用时，返回的值序列似乎是随机的，并且分布在{0，…，N1}范围内，其中N通常是2^k，k是计算机字中的位数(例如，2^32或2^64 )。范围{0，…，N1}的滞后Fibonacci生成器返回值xn = (xn-r +xn-s) mod N，其中r和s是算法的整数常数(0 <r< s)，初始“种子”值x0、x1、…、xs-1是以其他方式确定的。建议使用r=5和s= 17的值，因为它们会导致很长一段时间内不重复值的序列。解释如何使用列表抽象数据类型来表示滞后的Fibonacci生成器。什么样的表述是最合适的？

浏览 3提问于2014-01-31得票数 1

2回答

如何在r中随机保留其中一个重复行(不是第一个重复行)

、、、、

我有一个包含许多重复行的大型数据集。我想删除重复的行，只保留唯一的行。但是我不想保留第一个重复的行，在dplyr::distinct()中就是这样。我想要的是，例如，如果有三行具有相似的答案，我希望r随机保留其中的一行(并不总是第一个重复的行)。例如，如果我的数据框看起来像这样： ID<-c(1:10) age<-c(18,18,19,19,19,20,20,20,21,21) Answer1<-c("yes", "yes", "no", "no", "no", "no", &

浏览 151提问于2021-02-10得票数 1

回答已采纳

2回答

如何在Notepad++的代码块中过滤重复出现的数字？

在Notepad++中，我有一个包含各种内容的文档，但有一行代码不断重复出现： <ID>6354654</ID> <ID>4252352</ID> (注意代码块中的数字是如何不同的) 我试图从其余代码中过滤掉这些"ID“代码块，包括其中的随机数。附加问题:有没有人知道是否可以只过滤掉ID代码块中的数字？

浏览 33提问于2020-11-23得票数 0

2回答

如何在问答演播室(Java)中创建一个随机答案？

、、、

我正在尝试做一个小测验应用，有一个随机标志和随机4个答案，其中之一应该是一个正确的答案和随机3。现在我只能随机回答，但有时我有相同的答案好几次。失败的随机3种不同的答案，不会重复自己，并添加到正确的答案。 package com.example.guesstheflag; import androidx.appcompat.app.AppCompatActivity; ListView listView; ImageView imageView; @Override protected void onCreate(Bundle savedInsta

浏览 5提问于2022-06-29得票数 0

回答已采纳

2回答

使用实体框架4.5 mvc4选择无重复的随机行

、

我已经尝试了下面的代码，我需要随机行，没有重复，基于名称字段。 List = db.Logos.Where(a => a.LogoName != "empty.png").OrderBy(r => Guid.NewGuid()) .GroupBy(a => a.LogoName) .Select(g => g.FirstOrDefault()).Take(8).ToList()；但是我没有随机得到，但是我已经尝试了另一种代码，它正在正确地移动，但是重复的代码不能应用，下面的代码 List =(在db.Logos中c.LogoName != &

浏览 0提问于2013-08-16得票数 1

3回答

用附加随机数替换随机生成矩阵中的值

我正在使用一个矩阵，其中我需要用新的随机生成的数字替换编码为1的值起始点是这样的矩阵 set.seed(38921) p <- matrix(nrow = 10, ncol = 25) for(i in 1:10){ p[i, seq(1, floor(runif(1, min = 1, max = 25)), 1)] = 1 } 在得到的p矩阵中，我需要将每一行的值1替换为一个随机生成的介于1和25之间的整数，其中数字不能重复。例如，在矩阵的第一行，应该有6个随机抽取的1到25之间的数字，其中没有一个数字是重复的，还有19个NA列。在第二行，应该有12个随机抽取的数字，介于1和

浏览 2提问于2019-01-26得票数 3

1回答

从Pandas中的dataframe随机选择唯一行

、、

假设我有一个表单的数据，其中rn是行索引 A1 | A2 | A3 ----------------- r1 x | 0 | t r2 y | 1 | u r3 z | 1 | v r4 x | 2 | w r5 z | 2 | v r6 x | 2 | w 如果我想对这个数据进行子集，使列A2只具有唯一的值，我将使用df.drop_duplicates('A2')。但是，这将只保留唯一值的第一行，并删除其余的行。在本例中，子集中只有r2

浏览 4提问于2017-11-13得票数 6

回答已采纳

7回答

如何在python中将集合转换为整型？

、

我想生成一个随机的4位数，其中没有一个数字是重复的。 import random sets = random.sample(range(0,9), 4) 这会生成一个随机的4位数组，但我希望它是一个整数。我该怎么做？

浏览 1提问于2017-04-12得票数 1

3回答

如何在JavaScript中生成随机词？

、

可能重复：好的，这里有三个变量，每个变量是石头，纸或剪刀。使用JavaScript，我如何随机生成其中的一个单词？到目前为止是这样的： <!DOCTYPE html> <html> <body> <button type="button" onclick="myFunction()"> Click me</button> <script> function myFunction() {

浏览 4提问于2012-11-05得票数 8

回答已采纳

4回答

对于列表中的每个元素，选择该元素和3个随机的非重复元素。

、、、

我有一个202号整数的列表.201。我需要迭代这个列表，对于每个元素，我需要选择4个元素，其中一个是当前元素，其余3个是随机的、非重复的元素。例如, 在第一次迭代中，我需要生成0，r1，r2，r3，其中r1，r2，r3是1-201之间不同的随机数；在第二次迭代中，我需要生成1，r1，r2，r3，其中r1，r2，r3是0，2-201之间的不同随机数；在第三次迭代中，我需要生成2，r1，r2，r3，其中r1，r2，r3是0-1，3-201之间的不同随机数；我知道如何做到这一点，但这需要太多的时间和空间，因为我将在一个android应用程序的主线程中这样做，我可能应该做一些更有效率的事情。

浏览 3提问于2017-09-07得票数 2

回答已采纳

2回答

如何使用c#从数据表中随机获取唯一的记录？

、、、、

每一个人，我正在开发一个小应用程序，所有问题都是随机出现的。我使用了默认的random方法来获取随机数据，但它给出了两次重复的行。所以我需要的是将不同的行放入数据表中。我正在使用以下方法来获取rendom记录... Random rDom = new Random(); dtRandom = dt.Clone(); int rw = 0; for (int ctr = 1; ctr <= dt.Rows.Count; ctr++) { rw = rDom.Next(1, dt.Rows.Count); dtRandom.ImportRow(d

浏览 0提问于2013-01-31得票数 0

回答已采纳

1回答

如何快速识别python数据rows中可能翻转列的重复行

、、

我有一张有三根柱子的桌子，其中两根可以翻转： row A B Time 001 C1 DQ 300 002 C1 EG 355 003 DQ C1 300 004 DQ EG 400 005 IX Q2 410 006 Q2 IX 410 我想先识别重复的行，然后再随机保留一个重复的条目。对于第一次测试，第001 / 003行显然是一对，005 / 006行也是。然而，为了避免偏见，我希望保留第001行或第003行的概率为50%，在第二对中也是如此。我的直觉是逐行循环并创建AB行，按照时间和随机变量排序，然后选择AB <&g

浏览 4提问于2021-12-21得票数 0

回答已采纳

1回答

仅基于R中的一列删除重复行

、、

我在R中有一个包含1000+行的数据帧。其中一列是eventID，还有一些重复的列。我想删除行，以便所有事件I都是唯一的。例如，如果有3行事件ID = 78，我想删除其中的2行，但我不关心是哪2行。我不想考虑任何其他的专栏。

浏览 0提问于2020-10-17得票数 0

4回答

如何在以同一单词开头的连续行之间添加字符串？

、、

我有一个文本文件，其中包含以'WordNode‘和'gloss word’开头的互换行，但有时会有以'gloss word‘开头的重复行： WordNode"a'inai" gloss word "repose" WordNode "akti" gloss word "running" gloss word "turned on" gloss word "active" WordNode "aitco" gloss word "Armenia

浏览 24提问于2017-05-16得票数 0

回答已采纳

2回答

在java中从特定的随机文件行中扫描？

、

我有一个.txt文件，它按组列出整数，如下所示： 20 15 10 1 2 7,8,9,22,23 11,12,13,9,14 我想随机读取其中一个组，并将该组的整数存储到一个数组中。我该怎么做呢？每个组有一行由逗号分隔的五个整数。我能想到这样做的唯一方法是在way循环中增加一个变量，给出行数，然后从随机选择的行中读取，但我不确定它如何随机读取其中的一行。下面是我可以想出的代码来解释我的想法： int line = 0; Scanner filescan = new Scanner (new File("Coords.txt")); while (filescan.hasNex

浏览 1提问于2013-12-01得票数 1

回答已采纳

4回答

在Python中比较列表列表中的元素

、、、、

我正在尝试通过删除现有列表列表中具有重复值的行来创建新的列表列表。 fir = [['a35',1],['a35',2],['3r',6],['3r',8],[5,9]] sec = [] for row in fir: if sec is None: sec.append(row) elif row[0] not in sec: sec.append(row) print(sec) 预期输出：['a35'，1，'3r'，6，5，9] 实际输出：[

浏览 1提问于2017-01-20得票数 0

2回答

在搜索目录时更改查找深度

我想找到所有包含.txt文件的目录。但我需要打印一个级别的输出。例如，我使用find递归地搜索当前目录中的.txt文件。然后只显示包含此类文件的目录。 find . -name "*.txt" -printf '%h\n' 输出(例如) ./out/data ./out/data ./output/data 因此，我想改进find的使用，以便：不显示重复的.txt文件(我认为发生这种情况是因为其中有2个文件) 我只想打印第一层，即只有./out/和./output/

浏览 0提问于2017-01-06得票数 2

回答已采纳

7回答

如何从shell中的文本文件中选取随机的唯一行？

、、

我有一个未知行数的文本文件。我需要随机获取其中的一些行，但我不希望有任何重复的风险。我试过这个： jot -r 3 1 `wc -l<input.txt` | while read n; do awk -v n=$n 'NR==n' input.txt done 但这很难看，而且不能防止重复。我还尝试了这个： awk -vmax=3 'rand() > 0.5 {print;count++} count>max {exit}' input.txt 但这显然也不是正确的方法，因为我甚至不能保证获得max行。我被卡住了。我该怎么做呢？

浏览 1提问于2012-04-12得票数 10

回答已采纳

2回答

不带for循环的MATLAB 2D随机数

、、

我想做一个随机排列的二维数组，其中每一行可能包含在前一行中生成的数字。但是在同一行中不能有相同的数字。有没有办法在不使用for循环的情况下执行以下代码？ a = (1:100); b = zeros(size(a,2), 4); for i = 1:size(a, 2) r = randperm(size(a, 2),4); b(i,:) = r; end

浏览 0提问于2015-01-13得票数 1

2回答

PHP或shell:如何在没有背靠背重复的情况下随机化列表？

、、

我是用Linux BASH shell编写的，但是如果有更好的PHP解决方案，那就更好了。我需要从12个元素的数组中产生一个随机选择。这是我到目前为止一直在做的事情： # Display/return my_array that's been randomly selected: # Random 0 to 11: r=$(( $RANDOM % 12 )) echo ${my_array[$r]} 每次调用时，它都会随机选择一个元素。然而，它经常“随机”地选择一行中的同一元素，有时会多次。如何在BASH shell或PHP中实现这一点，以便进行随机选择，而不是重复上一个选择？谢谢!

浏览 4提问于2013-05-10得票数 2

回答已采纳

2回答

根据R中的每一步，从不同长度的行/值列表中随机抽取一行

、、、

我有一个列表，其中每一行都是几个物种的不同寄存器(可能会在列表中重复)。这些物种中的每一个都属于给定的数据库(在同一数据集中没有重复的物种)。我需要随机抽样不同的寄存器(行)，但是我希望样本的数量随“步骤”的数目而改变。在可复制的例子(以下)中，我想：步骤1：1个随机样本(行)，步骤2：来自不同数据集的2个随机样本(行) ..。步骤11：来自不同数据集的11个随机样本(行)。 #Example: x1 <- matrix(rnorm(200), nrow= 100, ncol=2) x2 <- c(replicate(5, "AA"),replicate(

浏览 4提问于2022-08-30得票数 0

回答已采纳

2回答

随机丢弃重复

、

在Pandas中，我们可以使用dataframe.drop_duplicates()删除重复数据，默认情况下保留重复数据的第一行。如果是keep_last = True，则保留最后一行。我们如何保持随机行，并使用熊猫drop_duplicate删除重复行？

浏览 3提问于2014-04-04得票数 5

回答已采纳

3回答

如何使用sed将第一个空格替换为空字符串

、、、、

我在将空格分隔的文本文件加载到表中时遇到问题。这个文本文件中的数据是由teragen生成的，因此，它只是一个虚拟数据，其中只有2列，并且第一列包含随机的特殊字符串的值。示例： ~~~{ZRGHS| ~~~{qahVN) 我遇到了一个问题，因为其中一些值中有一个空格作为随机ASCII字符，这导致它认为有3列，而我的表有2列，所以它们被拒绝了。因此，我想要做的是只从这些被拒绝的行中删除第一个空格，这将需要在每一行上重复多次，然后尝试重新加载它们。sed是最好的方式，还是像tr这样的其他方式更合适？谢谢!

浏览 0提问于2014-01-08得票数 5

2回答

如何在Java中随机打印向量的内容？

、、

在Java中，我需要以随机顺序打印向量的内容，而不需要重复。到目前为止，我有这样的看法： for(int p = 0; p < v.size(); p++) { boolean print = true; int n = Math.abs(r.nextInt() % v.size()); Vector<Integer> printed = new Vector<Integer>(); if(printed.contains(n)) print = false;

浏览 2提问于2014-05-06得票数 0

回答已采纳

2回答

从Notepad++中删除重复行

、、

我正在寻找一种从我的Notepad++文件中删除重复行的方法。每行都不是精确的重复。情况就是这样。我有一个大写公司名称的大文件和概率值(每一个用一个制表符分隔)。所以格式是这样的： ATT .7213 SAMSUNG .01294 SAMSUNG .90222 因此，我需要删除其中的一行，因为第一列中有一个匹配行。我并没有一个真正的偏好，我需要删除的，只要我结束在最后一行。我尝试在TextFX中使用唯一的排序，但是它要查找的是整个行的副本，而不仅仅是第一列。如果有人能提供一个方便的解决方案来解决这个问题，我将非常感激。使用awk、sed或cut的Bash脚本答案也是可以接受的，也可

浏览 3提问于2014-02-06得票数 0

回答已采纳

2回答

MSSQL在大数据中随机选择

、、

我有一个有超过100万条记录的表，我想从这个表中选择随机行，但不是在所有记录中--只从匹配某些条件的结果中选择随机行。性能是非常重要的，所以我不能使用按NEWID排序，然后选择第一项。表的结构是这样的： ID BIGINT Title NVARCHAR(100) Level INT Point INT 现在，我写了一个查询，比如： with tmp_one as ( SELECT R.Id as RID FROM [User] as U

浏览 0提问于2014-10-27得票数 0

1回答

SQL查询-删除重复项

、、、、

浏览 17提问于2021-06-11得票数 0

1回答

如何在Visual Studio中获得没有重复模式的随机数？

我试图生成3个随机数，它们从一个列表(strLabel)中挑选一个随机字符串，但我总是得到相同的组合。有没有办法阻止它重复相同的数字？ Random r = new Random(); int iSelect3 = r.Next(0, 35); textBox3.Text = strLabel3[iSelect3]; 我想使用一些“更随机”的东西，因为我总是得到相同的数字组合，谢谢！

浏览 1提问于2017-02-19得票数 1

2回答

使用keep dense_rank查找单个值

、、

我的查询类似于： select name, color, min(age) keep (dense_rank first order by priority asc) as age from myTable group by name, color 据我所知，秩和dense_rank将在分区中返回“重复”值。在我的例子中，如果在两个年龄之间共享一个优先级。那么，这条线将做什么： min(age) keep (dense_rank first order by priority asc) as age 它会为给定的名称、颜色选择优先级最小的行并返回相应的年龄吗？如

浏览 10提问于2015-02-18得票数 2

回答已采纳

1回答

不重复的数字

、

我使用混沌函数在matlab中创建一个随机数矩阵(2d)，并使用这些数字作为索引。我希望这两个数字的组合是不重复的。 a=[25,45; 25,30; 30,45; 25,45] 预期结果： b=[25,45;25,30;30,45] 我怎样才能用MATLAB做到这一点呢？

浏览 0提问于2013-07-17得票数 0

回答已采纳

1回答

从多元t分布生成随机变量

我想从R中的多元t分布中生成随机变量，我使用的是mvtnorm包，它有命令rmvt从多元t分布生成随机变量。现在我的问题是函数的语法以及能够操纵它来做我想做的事情。该函数需要以下内容 rmvt(n, sigma = diag(2), df = 1, delta = rep(0, nrow(sigma)), type = c("shifted", "Kshirsagar"), ...) 其中sigma是一个相关矩阵。现在，我遇到的问题是，如何从具有均值m和协方差矩阵S的多元t分布中取样，下面是适当的语法吗？ rmvt(1,S,df=n) + m 或 rm

浏览 4提问于2013-08-09得票数 2

回答已采纳

1回答

密码算法的随机性测试

、

我对算法的随机性很陌生，我猜这是一个基本的层次问题。任何密码算法的输出都是重复的，i.e.let，例如34和D8是两个连续字节，它们是随机重复的。我得到了一个加密的文件，它在第5行有34 D8，在第903行有相同的序列，在1002有相同的序列。文件共有1500行。这也适用于其他字节序列。是否有任何安全的门槛，在其中不应该有任何重复？我一般要求它有任何好的加密算法(AES 256，AES 128，Triple DES等)。

浏览 0提问于2019-08-20得票数 3

1回答

根据Python中的多个交叉条件删除重复项

、、

考虑到一些相当复杂的代码，我想从dataframe中删除副本。考虑一下数据 df = pd.DataFrame({'id' : [1, 1, 1, 1, 2, 2, 2, 3, 3], 'dup' : [1, 2, 2, 2, 3, 4, 4, 5, 5], 'a' : [False, True, False, True, False, True, False, False, False], 'b' : [False,

浏览 3提问于2017-09-15得票数 0

回答已采纳

1回答

大文件索引的数据结构

、、、、

我需要为一个非常大的(50GB+) ASCII文本文件建立一个索引，这将使我能够提供对文件的快速随机读取访问(获取第n行，在第n行中获取nth单词)。我决定使用List<List<long>> map，其中map[i][j]元素是文件中ith行的jth字的位置。我将依次构建索引，即读取整个文件并使用map.Add(new List<long>()) (新行)和map[i].Add(position) (新单词)填充索引。然后我将使用map[i][j]检索特定的单词位置。我看到的唯一问题是，我无法预测行/字的总数，因此在每一个List重新分配时都会遇到O(

浏览 3提问于2013-03-17得票数 9

1回答

如何在MySQL中随机连接表？

、、

我有两张桌子(TableA和TableB) TableA有10行，TableB有50行。我希望TableA中的每一行都能随机加入X的TableB行数。例如，如果TableA有行(a,b,c)，TableB有行(p,q,r,s,t,u)和X=2，那么预期的结果是： a-p a-u b-r b-t c-s c-q 这种加入应该是随机的。

浏览 2提问于2015-01-28得票数 1

回答已采纳

3回答

如何在数组中随机选取随机数量的项

、

我想在输入元素数组中随机选取随机数量的输入。如果我使用下面的方法，我可以得到一个随机的项目 jQuery.jQueryRandom = 0; jQuery.extend(jQuery.expr[":"], { random: function(a, i, m, r) { if (i == 0) { jQuery.jQueryRandom = Math.floor(Math.random() * r.length); }; return i == jQuery.jQueryRandom; } }); $("input:r

浏览 0提问于2011-11-29得票数 4

回答已采纳

2回答

如何在尝试执行Get请求时包括\r\n？

、、

我试图请求的服务器之一在字符串中有\r\n。当您尝试通过浏览器或工具(如Postman )获取请求时，这些新行是明显可见的。但是，当我尝试通过代码编程获取字符串时，我看不到\r\n。为什么这样或者甚至可以检索\r\n？ public async Task<TResponse> GetAsync(string uri) { var httpClient = new HttpClient(); var content = await httpClient.GetStringAsync(uri); return JsonConvert.DeserializeObj

浏览 5提问于2020-07-13得票数 0

回答已采纳

1回答

如何在大熊猫中找到复制品？

、

我有一个大约52000行的数据框，其中有一些重复项，当我使用 df_drop_duplicates() 我丢失了大约1000行，但我不想删除这些行，我想知道哪些是重复行

浏览 0提问于2016-01-15得票数 2

回答已采纳

2回答

如何生成一个带有随机字符的重复主题的序列

、、

我试图生成一个特定字母的序列，其中包含一个重复的主题，其中散布着随机的字母。例如: ABXXXXXXXABXXXXXXXABXXXXXXX，其中X= A、B、C或D，随机选择。我还需要指定序列的总长度，更改重复的字母，以及它们这样做的频率(例如，使BC每5个字符重复一次)。遗憾的是，我只能生成定义长度的随机序列，其中包含选择的字符： set.seed(42) x <- sample(letters[c(1, 2, 3, 4)], size=200, replace = TRUE)

浏览 25提问于2019-04-15得票数 4

回答已采纳

1回答

利用R中的自定义函数每次生成不同的随机数

我试着用Lehmar随机数发生器产生不同的均匀数。我相信我已经这样做了，但是每次执行这个函数时，我在生成不同的数字时都会遇到问题。下面是我要做的代码，我会进一步解释它下面的问题。 MODULUS <- 2147483647 MULTIPLIER <- 48271 put_Seed <- function(x) { x <- (if ( x > 0) { x%%MODULUS

浏览 2提问于2014-02-14得票数 0

回答已采纳

6回答

R中不替换的整数随机对的生成

、

我想画不需要替换的随机整数对(换句话说，我不想要任何重复的整数对)。这个概念听起来很简单，但我想不出一个快速而简单的解决方案。例如，想象一下，我希望使用整数1:4序列来生成随机整数对，以填充该整数对的元素。此外，假设我想要生成5个随机对，而不需要替换。我想要产生这样的东西..。 [,1] [,2] [1,] 1 2 [2,] 2 1 [3,] 3 3 [4,] 1 4 [5,] 4 3 在上面的例子中，没有重复的对(即行)。然而，在上述矩阵的每一列中都有重复的整数。因此，使用sample()为每一列分别生成随机数是行不通的

浏览 9提问于2015-04-17得票数 13

回答已采纳

1回答

如何在不重复整数的情况下随机创建ID列？

、、、

假设我有一个名为sourcetable的表，其中包含colA、colB、colC。我只想创建一个id列，其中包含不重复的、唯一的和随机的整数。如何在netezza SQL或proc SQL (SAS)中创建它？

浏览 20提问于2019-03-14得票数 0

2回答

显示意外逻辑行为的Javascript代码

、

我的程序正在做出反应，表现出意想不到的行为。期望selectQuestion():的行为随机选择一类问题，并检查所需的难度。搜索问题列表，在potentialQuestions列表中添加符合最近未被播放的标准的任何内容。如果没有符合随机选择标准的问题，请重复上述步骤，直到找到问题为止。 selectQuestion():的实际行为 selectQuestion()将选择recentQuestions[]中的问题，而不是随机选择一个新的类别。附加信息： dda[]是一个对象数组，每个对象都有一个category和一个difficulty。 question[]是一个对象数组，每个对象都有

浏览 2提问于2013-04-05得票数 0

回答已采纳

3回答

如何在SQL查询中标记重复项

、

我有一个SQL查询，它查看出生日期、姓氏和名字的soundex来识别重复项。下面的查询找到了大约8,000行(我假设这意味着大约有8,000条重复记录)。 select dob,last_name,soundex(first_name),count(*) from clients group by dob,last_name,soundex(first_name) having count(*) >1 几乎所有结果的计数都为2，少数结果计数为3，其中很明显，记录在合并的两个数据库之一中存在两次。我需要采取的下一步是使用复制标志来标记其中一行，这并不重要，并且使用相反的行键来标记每行。有

浏览 0提问于2011-01-24得票数 5

回答已采纳

2回答

MYSQL随机选择候选行，但只选择一次。

、、、、

我的数据库中有一个表，其中有3列：id、name、category_id，它们有100万行。用户在应用程序中选择一个category_id，然后数据库必须返回12行，其中包含所选的category_id。然后，在下一个api调用中，数据库必须返回下12行，这些行具有所选的category_id等等。我的问题是如何随机返回行，如何避免在下一个api调用中返回重复行。

浏览 3提问于2020-04-13得票数 1

回答已采纳

4回答

如何在python中随机打印列表中的元素？

、、

我有一份名单，我想按随机顺序打印。下面是我到目前为止编写的代码： import random words=["python","java","constant","immutable"] for i in words: print(i, end=" ") input("") #stops window closing 我尝试过各种各样的方法随机打印出来，比如创建一个变量，只随机选择其中一个，然后随机删除。然后，我将重复这个步骤，直到它们都被删除，并且在另一个变量中。然后，我会把变量放在一个列

浏览 0提问于2013-07-26得票数 2

回答已采纳

1回答

根据单列查找所有唯一行，并排除所有重复行

我有两个要求在单列中查找所有重复的值查找与第一个问题相反的所有唯一行，这甚至不应该包括来自重复行的单个对。我从过去的两周开始学习。看YouTube视频，指的是Stackoverflow和其他网站，所以不多。请参考任何材料或课程。所以回答我在这里发现的第一个问题() # All duplicated elements mtcars %>% filter(carb %in% unique(.[["carb"]][duplicated(.[["carb"]])])) 所以我想和这个相反谢谢我有非技术背景。我在这里经历了几个问题和答

浏览 0提问于2019-07-16得票数 0

回答已采纳

3回答

如何在R中的向量中仅删除重复值的一个实例？

、

让我们考虑一个数值向量"x“。有些值可能是重复的。我需要逐个删除最大值，直到x为空。问题是，如果我使用： x <- x[x != max(x)] 它会删除等于最大值的所有重复项。我只想删除其中一个重复项。所以到目前为止，我是这样做的： max.x <- x[x == max(x)] max.x <- max.x[1:length(max.x) - 1] x <- c(x[x != max(x)], max.x) 但这远远不是计算效率，而且我在R方面也不够好，无法找到正确的方法来做到这一点。有没有人有更好的把戏？谢谢

浏览 1提问于2011-11-12得票数 3

回答已采纳

2回答

从两个文本文件(并行语料库)中随机抽取N行

、、、、

我一次又一次地面临着从两个文件(即从并行语料库中抽取特定数量的行(例如N)的问题，即句子是根据行号对齐的)，一致性。对于从事(神经)机器翻译研究的人来说，这是一个常见且频繁的任务。我想知道一种快速而有效的方法，从并行语料库中，可能从命令行中抽取(即选择) N行。例如，如果我们想以一致的方式从两个文件中选择4行，我们可以在行号3、12、17、23上对行进行采样。这应该给我们这两个文件的这些行。另外，如果这个参数N是任意的，那么我们就可以随意修改它了。此外，应对这些行进行抽样，不重复。而且，需要采样的所需行数N将始终小于两个文件中的总行数，在这两个文件中，两个文件的总行数总是相等的。一旦我

浏览 0提问于2018-02-28得票数 2

回答已采纳