我有30.000多个项目(作为字符串)。我有一个包含10个元素的数组。我想将每一项与数组的元素关联起来。因此,或多或少,3.000项将与第一个元素相关联,3.000项与第二个元素相关联,等等.这必须是随机的,但是函数必须根据输入分配相同的输出。例如,每次运行函数时,字符串“345 have”必须与数组的相同元素相关联。字符串"oiu85dsf“可能必须与不同的字符串相关联(但每次都是相同的)。
输入字符串可以是任意字符串。我不知道输入字符串的值,可以及时增加字符串的数量。
用PHP可以吗?也许我需要用些加密方法吗?
发布于 2020-04-18 14:28:02
这里您的主要要求是该过程是可重复的。在人类看来,它可能是随机的,但是决定每个元素属于哪一个“桶”的过程非常需要是稳定的。
您所要寻找的(正如人们在评论中提到的)是一个散列函数,它将输出10个键中的一个--所需的桶数。使用PHP最简单的方法是获取crc32
散列mod 10的其余部分:
$key = crc32($string) % 10;
然后,您可以在输出中将元素分配给该桶:
$buckets = [];
foreach ($strings as $string) {
$key = crc32($string) % 10;
$buckets[$key][] = $string;
}
无论如何,结果都不是十全十美的(在那个例子中,桶有5到14个元素),但是如果输入的大小更大,结果就会变得更好。30,000个元素的桶计数如下所示:
0 - 3099
1 - 3085
2 - 2930
3 - 2975
4 - 2983
5 - 2969
6 - 2981
7 - 2987
8 - 2921
9 - 3070
https://stackoverflow.com/questions/61290131
复制相似问题