在O(N)中无需替换的样本k随机排列

云计算领域知识

在云计算领域，有许多与编程、软件开发、网络通信、音视频处理、存储、物联网、移动开发、区块链、元宇宙等相关的专业知识。以下是一些建议的腾讯云相关产品和产品介绍链接地址：

腾讯云云服务器
- 产品名称：腾讯云云服务器
- 产品介绍：腾讯云云服务器提供弹性、可扩展的虚拟计算资源，适用于各种应用场景，如Web应用、小程序、数据分析等。
- 访问链接：https://cloud.tencent.com/product/cvm
腾讯云对象存储
- 产品名称：腾讯云对象存储
- 产品介绍：腾讯云对象存储提供高可用、高可扩展、低成本的存储服务，适用于各种数据存储需求，如图片、视频、文档等。
- 访问链接：https://cloud.tencent.com/product/cos
腾讯云音视频
- 产品名称：腾讯云音视频
- 产品介绍：腾讯云音视频提供一站式音视频解决方案，包括直播、点播、短视频、实时音视频等，适用于各种应用场景。
- 访问链接：https://cloud.tencent.com/product/videostudio
腾讯云数据库
- 产品名称：腾讯云数据库
- 产品介绍：腾讯云数据库提供多种类型的数据库产品，如关系型数据库、NoSQL数据库、数据仓库等，支持数据备份、数据迁移等。
- 访问链接：https://cloud.tencent.com/product/database
腾讯云服务器
- 产品名称：腾讯云服务器
- 产品介绍：腾讯云服务器提供弹性、可扩展的虚拟计算资源，适用于各种应用场景，如Web应用、小程序、数据分析等。
- 访问链接：https://cloud.tencent.com/product/cvm
腾讯云AI
- 产品名称：腾讯云AI
- 产品介绍：腾讯云AI提供智能语音、图像识别、自然语言处理等AI服务，适用于各种应用场景，如智能客服、智能交通等。
- 访问链接：https://cloud.tencent.com/product/ai
腾讯云物联网
- 产品名称：腾讯云物联网
- 产品介绍：腾讯云物联网提供一站式物联网解决方案，包括设备接入、设备管理、数据分析等，适用于各种物联网应用场景。
- 访问链接：https://cloud.tencent.com/product/iot

以上是腾讯云的部分产品，您可以根据实际需求选择相应的产品和服务。

实现智能列表

、、

我被要求设计一个名为“智能列表”的数据结构，该结构包含带有真实密钥号的项，并提供了接下来的操作： Insert(x) -向列表插入一个新元素。应该在O(log n)中。删除min/max -删除并返回列表中的min/max元素。应该在O(log n)时间内。 Transform -更改remove min/max的返回对象(如果是min，则改为max，相反)。应该在O(1)中。随机样本(K)-返回从列表中随机选择的k元素(k大于0，小于n)。应该在O(min(k log k，n+ (n-k) log (n-k))中)。关于结构的假设:数据结构在任何阶段都不能容纳超过3n个元素。我们不能假

浏览 3提问于2014-05-31得票数 1

2回答

构造双射函数将任意整数从[1，n]随机映射到[1，n]

、、、、

我想构造一个双射函数f(k, n, seed)从[1,n]到[1,n]，其中1<=k<=n和1<=f(k, n, seed)<=n对每个给定的seed和n。函数实际上应该从1,2,...,n的随机排列返回一个值。随机性由seed决定。不同的seed可能对应于不同的排列。我希望f(k, n, seed)函数的时间复杂度对于每个1<=k<=n和任何给定的seed都是O(1)。谁知道我怎么能构造这样的函数呢？随机性允许为伪随机性.n可以非常大(例如，>= 1e8)。

浏览 7提问于2021-04-17得票数 0

1回答

嗅出有偏随机排列

、、、、

‘s优秀的工程师们又一次出击了。这一次，他们“革命”了随机排列的产生。“每一项伟大的发明都是简单的”，他们说，他们神奇的新算法如下：从要排列的数字的列表1,2,3,...,n开始。对于列表中的每个元素x，在列表中绘制一个随机索引，在随机索引处交换x和元素。然后，他们“证明”这是无偏的，因为每个元素发生在每个位置的频率相同。显然，他们的推理是有缺陷的，因为他们的方法具有n^n的可能性，结果通常不是n!的倍数。您的任务如下:编写一个程序/函数，该程序/函数接受排列的列表/流/生成器/迭代器(在您所选择的语言中最有意义的东西)，并决定它们是否是上述算法创建的有偏样本。如果没有，你可以假设样

浏览 0提问于2022-04-05得票数 14

1回答

如何破解随机替换文本密码？

、、、

我读到了关于凯撒密码的文章，其中的人物只是简单地被这样的数字移动： l=['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't',

浏览 4提问于2022-10-20得票数 0

回答已采纳

2回答

列表N个不同排列的随机样本

、、、、

假设我有一个任意长度k的Python列表。现在，假设我想要一个n的随机样本，(其中n <= k!) 这个列表的不同的排列。我很想尝试： import random import itertools k = 6 n = 10 mylist = list(range(0, k)) j = random.sample(list(itertools.permutations(mylist)), n) for i in j: print(i) 但是，自然地，当k变得太大时，这段代码变得非常慢。考虑到我可能正在寻找的n排列的数量相对于排列的总数相对较少，计算所有的排列是不必要的。然而，重

浏览 1提问于2019-01-05得票数 5

回答已采纳

3回答

散列函数和随机置换

、、、

在阅读了问题之后。我想知道，是否可以使用O(1)空间生成序列1…n的随机排列，并使用类似双重散列的方法生成均匀分布的随机排列？我用序列1,2,3,4,5的一个小例子来尝试它，它起作用了。但对于更大的集合来说，它的规模是失败的。 int h1(int k) { return 5 - (k % 7); } int h2(int k) { return (k % 3) + 1; } int hash(int k, int i) { return (h1(k) + i*h2(k)) % size; } int main() { for(int k = 0; k

浏览 12提问于2012-09-17得票数 2

回答已采纳

1回答

如何快速生成一个随机排列，移动每个元素的距离小于K？

、、、

我知道以下PyTorch API可以对一维数组0、.、n-1执行全局随机洗牌 torch.randperm(n) 但是，我对如何快速生成随机排列感到困惑，这样杂乱数组中的每个元素都令人满意： K = 10 # should be positive shuffled_array = rand_perm_func(n, K) # a mysterious function for i in range(n): print(abs(shuffled_array[i] - i) < K) # should be True for each i 这意味着每个元素的移动距离小于K，是否

浏览 3提问于2021-03-29得票数 0

回答已采纳

4回答

产生所有排列的随机子集

、、

我在寻找一种随机采样所有排列的固定长度子集的方法。 import itertools from random import shuffle mylist = ['A','B','C','D','E','F','G','H','I','J','K','L','M','N','O','P','Q','R',

浏览 0提问于2018-02-12得票数 4

回答已采纳

1回答

利用地图约简实现水库采样

、

这个链接"“讨论了如何使用地图缩减框架实现储层采样。我觉得他们的解决方案很复杂，下面的更简单的方法是可行的。问题：给出了大量的样本，生成一组大小为k的样本，使得每个样本在集合中存在的概率相等。提出的解决方案：地图操作:对于每个输入数n，输出(i，n)，其中我被随机选择在0到k-1范围内。减少操作:在所有拥有相同密钥的数字中，随机选择一个。索赔:k大小集合中任意数的概率为k/n (其中n为样本总数) 证明直觉：由于map操作将每个输入样本随机分配给桶号i (0 <= i <= k-1)，则每个桶的大小为n/k。无论我的解决方案是否正确，我都希望你

浏览 0提问于2013-08-10得票数 0

回答已采纳

1回答

常量记忆库采样，O(k)可能吗？

、、、

我有一个大小为n的输入流，我想生成一个大小为k的输出流，它包含输入流的不同随机元素，而不需要为样本选择的元素提供任何额外的内存。我将要使用的算法基本上如下所示： for each element in input stream if random()<k/n decrement k output element if k = 0 halt end if end if decrement n end for 函数random()在随机分布上从[0..1]生成一个数字，我相信算法

浏览 0提问于2018-04-27得票数 1

2回答

生成随机Boggle板

、、

生成4x12个字母/空格网格：每个模具应精确出现一次，位置随机选择。位置应该近似于骰子的均匀随机排列。显示每个模具的随机(同样，近似均匀)面。左对脸在三个字符窗口。例如, A E A A E C D E D A Qu E E A H D 是一个我想要的格式的非随机板。允许拖尾空间。骰子： A A E E G N E L R T T Y A O O T T W A B B J O O E H R T V W C I M O T U D I S T T Y E I O S S T D E

浏览 0提问于2012-02-07得票数 19

回答已采纳

3回答

需要使用Notepad++ RegExp查找和删除花括号中的字符

、、

在下面的示例文本中删除{}之间的"#“字符样本文本： $C##nH##{##2##n##+##1}O$ 预期产出： $C##nH##{2n+1}O$ 我试过什么？ \{[#].*\} ^.+?(?=##\w##)##\K|##(?!$) 非常感谢您的帮助！

浏览 7提问于2020-07-17得票数 4

回答已采纳

1回答

在C++中随机交换数组索引/生成随机字母的最快方法

、

std::array < char, 27 > new_alphabet() { std::array < int, 26 > a; static std::random_device rd; static std::mt19937 mte(rd()); std::uniform_int_distribution < int > dist(0, 25); std::generate(a.begin(), a.end(), [ & ]() { return dist(mte); }); std::array

浏览 0提问于2020-11-12得票数 1

1回答

SAS从数据集中选择随机样本

、

我知道要选择一个随机样本，我可以使用 proc surveyselect data = raw_data method = srs n=200000 out=sample_data; run; 但是，有时我的raw_data的记录数小于200000。如果raw_data很小，我想只保留raw_data；如果它大于一百万条记录，我想从其中随机选择200k的记录。我该怎么做呢？谢谢!

浏览 0提问于2017-03-16得票数 2

2回答

尝试在Python中编写包含所有可能的4个字符组合的列表

、

基本上我希望所有4个字符的组合可能写在一个txt文件的问题是复制应该是允许的，我想要的组合1111,2222…你认为我哪里出错了?你会怎么弥补？ import itertools import sys import os tester = open(r"available.txt","a") lol =[] a = [1,2,3,4,5,6,7,8,9,0,'_','.','a','b','c','d','e','f','g&

浏览 0提问于2020-05-12得票数 0

4回答

包含计算值和非计算值的元组列表？

、、、、

我的tuples的前两个元素是经过计算的(见下文)，但我希望它们是3-tuples，而不是2-tuples，最后一个元素设置为1。 from itertools import permutations if __name__ == '__main__': alphabet='abcdefghijklmnopqrstuvwxyz' print list(permutations(alphabet,2)) [('a', 'b'), ('a', 'c'), ('a',

浏览 1提问于2012-06-11得票数 1

回答已采纳

5回答

样本k个在O(N)中无替换的随机排列

、、

我需要一个列表的一些独特的随机排列，而不需要替换，高效。我目前的方法是： total_permutations = math.factorial(len(population)) permutation_indices = random.sample(xrange(total_permutations), k) k_permutations = [get_nth_permutation(population, x) for x in permutation_indices] 在那里，get_nth_permutation完全按照它听起来的样子高效地做(意思是O(N))。然而，这只适用于len(

浏览 0提问于2012-04-20得票数 2

回答已采纳

1回答

偶数-Mansour密码:随机排列抽样的有效算法

、

我对偶数曼苏尔密码的理解如下：我们从所有置换P的集合中画出一个随机置换P: \{0,1\}^n \rightarrow \{0,1\}^n。这个排列是公开的。我们生成两个随机密钥k_1, k_2 \in \{0,1\}^n。为了加密消息m \in \{0,1\}^n，我们计算E_{k_1, k_2} = P(m \oplus k_1) \oplus k_2。有什么样的算法允许我们有效地从从P位字符串到n位字符串的所有排列集合中采样(并表示)一个置换的n？

浏览 0提问于2022-04-10得票数 1

回答已采纳

1回答

在PHP中将UTF8 IAST编码转换为SLP

、

我正在尝试编写一个脚本，该脚本将查看字符串是否有特定的对话框标记，并将其转换为不同的音译方案。(两者都是梵语的音译方案)。这是我的密码。 $first = $_POST["first"]; $second = $_POST['second']; $iast = array("a","A","ā","Ā","i","I","ī","Ī","u","U","ū","Ū",&#

浏览 3提问于2013-11-09得票数 1

回答已采纳

1回答

附加排列的抗碰撞性

、、

假设我们有一个n位密文c，由一个k位MAC和k < n保护。一般情况下，我们期望在看到O(2^{k/2})密文/MAC对后会发生冲突。考虑以下修改：对手选择m \in \{0, 1\}^n并将其发送给甲骨文。甲骨文发回\sigma((c) || MAC(c))，其中c=E(m)是随机加密，\sigma是n+k位上的置换。\sigma仍然不为对手所知。假设\sigma保持不变。看来我们要么攻击MAC/加密，要么找出排列。如果MAC和加密是完美的，那么我看不出我们怎么能找到MAC位: n+k位的任何k元素子集都会有相同的生日悖论碰撞概率。事实上，如果我们采用2^k + 1消息，则鸽子

浏览 0提问于2020-09-06得票数 0

3回答

randperm()能产生多个随机排列吗？

在Matlab中 P= randperm(n，k)返回包含随机从1到n包含的k个唯一整数的行向量。一次对randperm()的调用可以返回几行向量，每一行都如上？如果没有，还有其他方法来生成多个随机排列吗？在这种情况下，避免循环一定会更快吗？谢谢!

浏览 3提问于2013-03-28得票数 5

回答已采纳

1回答

如何在matlab中证明randperm()是公平的

、、

假设，我想(经验性地)证明，matlab中的随机from (n，k)确实从n个元素集合产生大小为k的均匀分布的随机样本。在反复绘制后，如何将发生的次数除以从N中提取的k-子集的总数？

浏览 1提问于2018-11-23得票数 0

回答已采纳

1回答

小于O(n^2)的可证明正确排列

、、、、

下面是用Haskell编写的数据类型，它证明了一个列表是另一个列表的排列： data Belongs (x :: k) (ys :: [k]) (zs :: [k]) where BelongsHere :: Belongs x xs (x ': xs) BelongsThere :: Belongs x xs xys -> Belongs x (y ': xs) (y ': xys) data Permutation (xs :: [k]) (ys :: [k]) where PermutationEmpty :: Permutation '

浏览 27提问于2017-03-05得票数 18

2回答

随机梯度下降中的“随机洗牌训练样本”得到了什么？

随机梯度下降中的“随机洗牌训练样本”得到了什么？我解释说，因为训练样本被用来计算 \hat{y}=f(w^t x) 那么，如果xs的顺序发生变化，那么权重就会“根据不同的顺序”分配？虽然，由于w^tx是线性的(顺序并不重要)，那么这种效果在哪里出现呢？或者在\hat{y}中没有看到，但是在LMS更新规则中： \Delta w_{ij}^k=\lambda(\hat{y}_i^k-y_i^k)\color{red}{x^î_j}

浏览 0提问于2018-12-08得票数 0

2回答

数学中的产量

你能做一些类似于Python的yield语句吗，在数学中，为了创建生成器？有关概念，请参见例如。 Update这里是一个例子，说明了我的意思是，只使用O(n)空间迭代所有排列：(算法，如塞奇威克的算法书中所示)： gen[f_, n_] := Module[{id = -1, val = Table[Null, {n}], visit}, visit[k_] := Module[{t}, id++; If[k != 0, val[[k]] = id]; If[id == n, f[val]]; Do[If[val[[t]] == Null, visit[t]], {

浏览 2提问于2009-07-22得票数 13

回答已采纳

2回答

random.sample的时间复杂度

、

在另一个线程中，我看到二进制堆加权随机样本的时间复杂度等于O(n * log(m))，其中n是选择的数量，m是要选择的节点的数量。我想知道一个未加权的随机样本的时间复杂度，它被Python用作random.sample。时间复杂度是简单的O(n)，还是完全不同？

浏览 5提问于2012-05-07得票数 11

回答已采纳

2回答

如何将K个随机值从DataFrame添加到没有重复列表的列表中？

、、、、

我有以下表格的数据框架： 1 2 3 4 5 6 7 8 A C C T G A T C C A G T T A D N Y F V H Q A F D 我需要随机选择一个列k倍，其中k是给定样本中的列数。我的程序创建了一个大小为k的空列表，然后随机地从dataframe中选择一个列来附加到列表中。每个列表必须是唯一的，不能有重复的。从上面的示例dataframe来看，预期的输出应该如下所示： [[2][4][6][1][7][3][5][8]] 然而，我所取得的结果如下： [[1][1][3][6][7][8][8][2]] 做这件事最重要的方法是什么？以下是我的遗憾尝试： k = le

浏览 8提问于2019-10-28得票数 1

回答已采纳

4回答

生成从0到N-1的随机整数，该整数不在列表中。

您将获得N和int K[]。当前的任务是在不存在于K中的0 to N-1之间生成一个相等的概率随机数。 N严格来说是一个整数>= 0。K.length <N1。和0 <= K[i] <= N-1。还假定K是排序的，K的每一个元素都是唯一的。给出了一个函数uniformRand(int M)，它在0 to M-1范围内产生一致随机数，并且假定这个函数的复杂度是O(1)。示例： N=7 K= {0，1，5} 函数应该以相同的概率返回任意随机数{ 2，3，4，6}。为此，我可以得到一个O(N)解:首先，在0到N- K.length之间生成一个随机数.并将由此生

浏览 1提问于2014-06-04得票数 11

2回答

在Javascript中以递归方式获取一组数字的所有可能组合

、

我有一个javascript应用程序，我需要对数字0到6的每个可能的组合运行测试，而不需要在组合中重复任何数字。所以: 0123456,0123465,0123546,0123564 ... (但是，例如，0123455不应该包括在内，因为5是重复的) 我已经反复地做过了： function testAllCombinations(){ for(var i = 0; i < 7; i++){ for(var j = 0; j < 7; j++){ if(j == i) continue;

浏览 2提问于2013-09-14得票数 0

1回答

如何更新大小为25的1000个随机样本的代码到一个大小为25的随机样本的1000个重采样

、、

我目前拥有的代码演示了为R中的分布Gamma(5,1)随机抽取1000个大小为25的样本。我的问题是更新此代码，以便表示从同一分布的一个大小为25的随机样本中抽取1000个重采样(带有替换)。正如我已经说过的，我已经有代码为Gamma(5,1)做大小为25的1000个随机样本。 set.seed(35) n <- 25 alpha <- 5 beta <- 1 sample.n <- 0 xbar.n <- 0 vars.n <- 0 k=1000 for (i in 1:k){ sample.n <- rgamma(n, alpha, sca

浏览 14提问于2019-04-15得票数 1

9回答

生成非连续的样本

、

如何从non-consecutive中高效地生成k随机样本和[1,...,N]样本不想要的(N=10, k=4)：2,3,8,10示例这不是一个想要的例子，因为2和3是连续的。 (N=10, k=4)：2,6,8,10所需的示例这是一个很好的例子，因为每对样本之间的差异都大于1。

浏览 8提问于2015-06-25得票数 13

回答已采纳

1回答

是否有任何块密码可以证明没有等价的密钥？

、、

存在2^n!可能的n-bit分组密码E_k:\{0,1\}^n \rightarrow \{0,1\}^n的排列，并且任意给定的密钥k随机选择这些排列中的一个。将等效键定义为一对键( k \neq k^\prime )，其中\forall P:E_k(P) = E_{k^\prime}(P)和P\in\{0,1\}^n。对于实际的密码参数，这种对存在的概率很低。能证明一个分组密码没有等价的密钥吗？

浏览 0提问于2019-08-21得票数 6

回答已采纳

2回答

使用熊猫和numpy将字符串类别映射为数字

、、

我有一个数据数组，每一行代表一个数据样本(5个样本)，每个列表示数据中的一个特性(每个样本有6个特性)。我试图量化每一列包含的状态数，然后将它们映射到一组数字中。只有当列当前为而不是数值时，才应该这样做。通过实例可以更容易地解释这一点：示例输入(输入类型为numpy.ndarray)： In = array([['x', 's', 3, 'k', 's', 'u'], ['x', 's', 2, 'n', 'n',

浏览 3提问于2017-05-10得票数 5

回答已采纳

3回答

生成具有成对不同行和列的随机矩阵

、、

我需要在包含1到K的范围内随机生成一个整数的NxN矩阵，这样所有行和列都有一个属性，即它们的元素是成对独立的。例如，对于N=2和K=3 这样就行了： 1 2 2 1 这不是： 1 3 1 2 (注意，如果K<N，这是不可能的) 当K足够大时，一个有效的算法就是生成一个1.K整数的随机矩阵，检查每一行和每列是否成对不同，如果没有再试一次。但是，在K不大于N的情况下呢？

浏览 5提问于2012-08-08得票数 2

3回答

随机算法中的期望运行时间

、

在的大部分计算分析中，我们假设所有的输入都是相同的。这是不正确的，因为例如，几乎排序的输入比统计上预期的要频繁得多，这会导致问题，特别是对于快速排序和二进制搜索树。通过使用随机算法，特定的输入不再重要。随机数是很重要的，我们可以得到一个预期的运行时间，现在我们平均所有可能的随机数，而不是所有可能的输入。利用随机枢轴的快速排序给出了一个O(n，log，n)期望时间算法.这意味着对于任何输入，包括已经排序的输入，根据随机数的统计信息，运行时间预计为O(n log )。预期的运行时间范围比一般情况下的约束要强一些，但当然比相应的最坏情况范围要弱。首先，我们将看到一种支持O(log )期望时间内的

浏览 1提问于2011-12-13得票数 1

回答已采纳

7回答

最有效的方法...唯一随机字符串

、、、

我需要有效地插入一个5个字符的随机字符串到数据库中，同时也确保它是唯一的。生成随机字符串不是问题，但目前我要做的是生成字符串，然后检查数据库是否已经存在……如果是这样，我会从头开始。有没有更有效的方法来完成这个过程？请注意，我不想使用GUID或任何其他超过5个字符的内容...我必须坚持5个字符。 PS:我不认为这有什么不同，但我的字符串都区分大小写。下面是"Random String“部分 Public Function GetRandomNumbers(ByVal numChars As Integer) As String Dim chars As Strin

浏览 4提问于2009-10-03得票数 4

回答已采纳

1回答

为什么collections.deque的旋转()方法具有线性时间复杂度？

、

根据，collections.deque的rotate方法具有线性时间复杂度。也就是说，对于collections.deque对象d，d.rotate(k)需要O(k)时间。为什么是这种情况？ collections.deque是双链接列表的实现。难道仅仅通过更改一个常量的引用(假设k不大于n，deque中元素的总数)就可以将deque的前k元素移动到deque的末尾吗？如果这是可能的话，d.rotate(k)可以在恒定时间内完成，O(1)，那么为什么d.rotate(k)没有在O(1)中完成呢？假设k <= n是合理的，因为在最常见的用法中是这样的。

浏览 6提问于2020-09-14得票数 2

回答已采纳

1回答

对于使用堆查找顶级K元素，哪种方法更好- NlogK还是KLogN？

、

对于使用堆查找顶级K元素，哪种方法更好？ NlogK，使用大小为K的最小堆并删除最小元素，使顶部k元素保留在堆中。 KlogN，使用Max堆，存储所有元素，然后提取顶部K元素我做了一些计算，在任何时候，我都没有看到NLogK比KlogN更好。 N= 16 (2^4), k = 8 (2^3) O(Nlog(K)) = 16* 3 = 48 O(Klog(N)) = 8 * 4 = 32 N= 16 (2^4), k = 12 (log to base 2 = 3.5849) O(Nlog(K)) = 16* 3.5849 = 57.3584 O(Klog(N)) = 1

浏览 4提问于2020-09-22得票数 1

回答已采纳

2回答

从未知长度的流中随机采样

、

假设我需要从N>>K元素的实时流中随机采样K个元素，其中我只有有限的内存，并且我事先不知道N个元素。有没有一种算法在理论上是合理的，也就是说，符合从集合中随机抽取样本的技术含义？我知道有一个算法可以满足一些关于随机抽样的直觉，但问题是，它在形式上是合理的吗？换句话说，我如何证明我提出的算法确实在这样的设置下产生了随机样本？例如，如果我可以证明我的算法产生了K个元素，其中流中的每个元素都以K/N的概率包括在内-这是一个合法的证明吗？

浏览 0提问于2017-12-30得票数 2

1回答

从混合模型采样的复杂性

、、

我有一个模型，在M个状态中选择状态j的概率是p_j，概率可以是任何实数。这指定了M个状态上的混合模型。我可以在固定时间内访问所有j的p_j。我想做大量(N)的随机样本。最明显的算法是 1)计算累积概率分布P_j = p_1+p_2+...p_j。O(M) 2)对于每个样本，选择0,1。O(N)中的随机浮点x。 3)对于每个样本，选择j使得min(0，P_j-1) <x <= max(1，P_j)。O(Nlog(M)) 因此，渐近复杂度为O(Nlog(M))。N的因素显然是不可避免的，但我想知道log(M)。在现实的实现中，有没有可能克服这个因素？

浏览 1提问于2010-10-12得票数 1

1回答

下一种词法“置换”算法

、、

我编写了一个程序来解决一个通用版本的24(对于好奇的人来说是)。也就是说，给定一组n数，是否有一种方法可以对它们执行二进制操作，以便它们计算成一个目标数。为此，我将可能的表达式视为由'v'或'o'组成的char数组，其中'v'是值的占位符，'o'是操作的占位符。注意，如果有n值，则必须有n-1操作。程序目前的工作方式是检查{'o','o',...,'v',v'...}的每一个词序排列，并查看前缀表达式是否有效。例如，当n = 4时，下列表达式被认为是有效的： {‘o’,’

浏览 1提问于2016-11-11得票数 2

回答已采纳

5回答

Matlab中无替换的加权采样

、

在向量p中，我有一个指数的总体w和相应的权重。我想从这个群体中得到k样本，而不需要替换，在这里，选择与随机权重成正比。我知道可以用来进行替换选择 J = randsample(p,k,true,w) 但是当我用参数false而不是true调用它时， ??? Error using ==> randsample at 184 Weighted sampling without replacement is not supported. 我编写了我自己的函数 p = 1:n; J = zeros(1,k); for i = 1:k J(i) = randsample(p,1,tru

浏览 0提问于2011-11-20得票数 1

回答已采纳

2回答

K-置换的第I-元素

、、、、

是否有一种快速算法来计算0..n-1序列的k-置换(0 <= k < n!)的第一元素(0 <= k < n!)？排列的任何顺序都可以选择，而不必是词典编纂。有一些在k中构造-th置换的算法(见下文)。但是这里不需要完全置换，只需要它的i-th元素。有比O(n)更好的算法吗？是否有一个空间复杂度小于O(n)的算法？有些算法通过处理大小为k-th的数组(参见下文)来构造n排列，但是对于大型n来说，空间需求可能是不可取的。是否有一种算法需要更少的空间，特别是当只需要i-th元素时？构造具有时间和空间复杂性的序列k-th排列的O(n)算法 def kth_permu

浏览 3提问于2015-02-15得票数 2

回答已采纳

1回答

Neo4j流导入内存错误

、、、、

我试图在neo4j中执行流导入，然后遇到内存不足错误(以及随后的崩溃)，跟踪如下： 2016-06-05 03:51:35.218+0000 INFO o.n.k.i.t.l.p.LogPruningImpl日志旋转5:开始日志剪枝。2016-06-05 03:51:35.218+0000 INFO o.n.k.i.t.l.p.LogPruningImpl日志旋转5:日志修剪完成。2016-06-05 03:53:58.140+0000 INFO o.n.k.i.a.i.s.OnlineIndexSamplingJob抽样索引:节点(NodeId)，平均大小为415290个唯一值，样本为41

浏览 3提问于2016-06-05得票数 0

7回答

洗牌一个数组，一点点

、、、

给定一些输入数组a = [a1, a2, ..., an]和一个正整数k，对输入数组a进行洗牌，使输入数组D2与其初始位置之间没有比k更远的条目。示例给定数组[1, 2, 3, 4, 5, 6]和k = 1，这意味着条目3可以位于以下位置： [*, 3, *, *, * ,*] [*, *, 3, *, *, *] (original position) [*, *, *, 3, *, *] 详细信息对于所有允许的排列，不需要均匀的随机性，但是您可以假设输入数组仅限于范围[1, n] (或[0, n-1]，其中n是长度)。所有允许的排列都必须有发生的非零概率。您也可以将k和数

浏览 0提问于2022-04-04得票数 20

1回答

随机选择范围内的k个不同的数字

、、、

我需要在范围k中随机选择0 to n-1元素。n可达10^9，而k可从1 to n-1起。我可以在O(n)时间内完成这一任务，只需对包含值0 to n-1的数组进行洗牌并从中选择第一个k元素即可。但是当k很小时，这种方法的时间和内存都是无效的。这个问题有O(k)解吗？注意:选定的k数字必须是不同的。我在想一个解决办法。有两种方法我能想到。让R是要返回的集合。在范围内选择一个随机值并将其添加到R中。继续这样做，直到|R| = k。这个过程需要sum(n/i) for n+1-k <= i <= n时间和O(k)空间。在数组中插入0到n-1，对其进行洗牌，从数组中获取第

浏览 1提问于2015-05-31得票数 8

回答已采纳

5回答

一种寻找同构排列集的算法

、、、、

我有一组排列，我想删除同构排列。我们有S排列集，其中每个集合都包含K置换，每个置换都表示为N元素的和数组。我目前将其保存为数组int pset[S][K][N]，其中S、K和N是固定的，N大于K。两组排列( A和B )是同构的，如果存在置换P，则将元素从A转换为B (例如，如果a是set A的元素，那么P(a)是set B的元素)。在这种情况下，我们可以说P 使 A 和 B 同构。我目前的算法是：我们选择所有对s1 = pset[i]和s2 = pset[j]，例如i < j 从选择集(s1和s2)的每个元素都从1到K。这意味着每个元素都可以表示为s1[i]或s2

浏览 10提问于2015-05-11得票数 16

回答已采纳

2回答

随机选择轴心的优点

、

在快速排序中，我们可以通过不同的方式选择轴值。随机选择轴值就是其中之一。它说，当我们随机选择轴值时，它将具有O(n^2)的机会最小化。有人能解释一下它是怎么发生的吗？有什么缺点吗？

浏览 0提问于2013-02-08得票数 1

回答已采纳

1回答

排列算法的复杂性分析

、、、、

我试图理解生成数组排列的算法的时间和空间复杂性。给定一个部分构建的排列，其中已经从k元素中选择了n元素，该算法从其余的n-k元素中选择元素k+1，并调用自己来选择其余的n-k-1元素： public static List<List<Integer>> permutations(List<Integer> A) { List<List<Integer>> result = new ArrayList<>(); permutations(A, 0, result); return result;

浏览 0提问于2021-11-14得票数 0

回答已采纳

4回答

生成1,000,000随机排列的样本

、、、、

我正在处理大量整数排列。每个排列中的元素数为K，元素大小为1字节。我需要生成N个唯一的随机排列。约束:K <= 144，N <= 1,000,000。我想出了以下简单的算法：生成N个随机排列的列表。将所有排列存储在RAM中。对列表进行排序并删除所有重复项(如果有的话)。重复的数量将相对较少。如果有任何重复，请将随机排列添加到列表中，直到有N个排列，然后返回到步骤2。有更好的方法吗？特别是，是否有一种方法可以不将所有排列存储在RAM中(在生成时将它们写在磁盘上)？编辑：最后，生成的排列需要顺序访问(一个接一个，不需要随机访问)。RAM是更关键的因素(

浏览 1提问于2012-10-14得票数 4

回答已采纳