C中的随机排列数组

问题描述

| 我正在寻找ANSI C中的一个函数，该函数可以像PHP的shuffle()那样随机化数组。是否有这样的功能，还是我必须自己编写？而且，如果我必须自己编写它，那么最佳/最高效的方法是什么？到目前为止，我的想法是：遍历数组100次，然后与另一个随机索引交换一个随机索引创建一个新数组，并用第一个随机索引填充它，每次检查索引是否已被占用（性能= 0复杂度=严重）

解决方法

出于持久性，从Asmodiel \的链接粘贴到Ben Pfaff的著作中：

#include <stdlib.h>

/* Arrange the N elements of ARRAY in random order.
   Only effective if N is much smaller than RAND_MAX;
   if this may not be the case,use a better random
   number generator. */
void shuffle(int *array,size_t n)
{
    if (n > 1) 
    {
        size_t i;
        for (i = 0; i < n - 1; i++) 
        {
          size_t j = i + rand() / (RAND_MAX / (n - i) + 1);
          int t = array[j];
          array[j] = array[i];
          array[i] = t;
        }
    }
}

编辑：这是通用版本，适用于任何类型（int，struct，...）至through4ѭ。要运行一个示例程序，它需要VLA，并非每个编译器都支持VLA，因此您可能希望将其更改为malloc（这将导致性能下降）或一个足够大的静态缓冲区来容纳您向其抛出的任何类型：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <time.h>

/* compile and run with
 * cc shuffle.c -o shuffle && ./shuffle */

#define NELEMS(x)  (sizeof(x) / sizeof(x[0]))

/* arrange the N elements of ARRAY in random order.
 * Only effective if N is much smaller than RAND_MAX;
 * if this may not be the case,use a better random
 * number generator. */
static void shuffle(void *array,size_t n,size_t size) {
    char tmp[size];
    char *arr = array;
    size_t stride = size * sizeof(char);

    if (n > 1) {
        size_t i;
        for (i = 0; i < n - 1; ++i) {
            size_t rnd = (size_t) rand();
            size_t j = i + rnd / (RAND_MAX / (n - i) + 1);

            memcpy(tmp,arr + j * stride,size);
            memcpy(arr + j * stride,arr + i * stride,size);
            memcpy(arr + i * stride,tmp,size);
        }
    }
}

#define print_type(count,stmt) \\
    do { \\
    printf(\"[\"); \\
    for (size_t i = 0; i < (count); ++i) { \\
        stmt; \\
    } \\
    printf(\"]\\n\"); \\
    } while (0)

struct cmplex {
    int foo;
    double bar;
};

int main() {
    srand(time(NULL));

    int intarr[] = { 1,-5,7,3,20,2 };

    print_type(NELEMS(intarr),printf(\"%d,\",intarr[i]));
    shuffle(intarr,NELEMS(intarr),sizeof(intarr[0]));
    print_type(NELEMS(intarr),intarr[i]));

    struct cmplex cmparr[] = {
        { 1,3.14 },{ 5,7.12 },{ 9,8.94 },{ 20,1.84 }
    };

    print_type(NELEMS(intarr),printf(\"{%d %f},cmparr[i].foo,cmparr[i].bar));
    shuffle(cmparr,NELEMS(cmparr),sizeof(cmparr[0]));
    print_type(NELEMS(intarr),cmparr[i].bar));

    return 0;
}

,下面的代码确保将基于从usec时间获取的随机种子对数组进行混洗。这也可以正确地实现Fisher-Yates的混洗。我已经测试了此函数的输出，它看起来不错（甚至期望将任何数组元素作为随机播放之后的第一个元素。甚至还希望将其作为最后一个元素）。

void shuffle(int *array,size_t n) {    
    struct timeval tv;
    gettimeofday(&tv,NULL);
    int usec = tv.tv_usec;
    srand48(usec);


    if (n > 1) {
        size_t i;
        for (i = n - 1; i > 0; i--) {
            size_t j = (unsigned int) (drand48()*(i+1));
            int t = array[j];
            array[j] = array[i];
            array[i] = t;
        }
    }
}

,C标准中没有用于随机化数组的函数。看一下Knuth-他有完成这项工作的算法。或查看Bentley-编程珍珠或更多编程珍珠。或浏览几乎所有算法书籍。确保公平的洗牌（原始顺序的每个排列均可能发生）很简单，但并非无关紧要。 ,这是一个使用memcpy而不是分配的解决方案，因此您可以将其用于任意数据的数组。您需要两倍于原始数组的内存，代价是线性O（n）：

void main ()
{
    int elesize = sizeof (int);
    int i;
    int r;
    int src [20];
    int tgt [20];

    for (i = 0; i < 20; src [i] = i++);

    srand ( (unsigned int) time (0) );

    for (i = 20; i > 0; i --)
    {
        r = rand () % i;
        memcpy (&tgt [20 - i],&src [r],elesize);
        memcpy (&src [r],&src [i - 1],elesize);
    }
    for (i = 0; i < 20; printf (\"%d \",tgt [i++] ) );
}

,我只是回应尼尔·巴特沃思（Neil Butterworth）的回答，并指出您的第一个想法有些麻烦：你建议遍历数组100次，然后与另一个随机索引交换一个随机索引使这个严格。我假设存在randn(int n)，它是一些RNG的包装，产生的数字均匀地分布在[0，n-1]和swap(int a[],size_t i,size_t j)中，

swap(int a[],size_t j) {
  int temp = a[i]; a[i] = a[j]; a[j] = temp;
}

交换a[i]和a[j]。现在，执行您的建议：

void silly_shuffle(size_t n,int a[n]) {
    for (size_t i = 0; i < n; i++)
        swap(a,randn(n),randn(n)); // swap two random elements
}

注意，这并没有比这个简单（但仍然错误）的版本更好：

void bad_shuffle(size_t n,i,randn(n));
}

好吧，怎么了？考虑一下这些函数给您带来多少排列：在[0，n-1]中使用n个（或2×n表示16个字符）随机选择时，代码将“公平地”选择n²（或2×n²）种方式中的一种进行混洗。甲板。麻烦是那里有n！ = n×（n-1）×⋯×2×1阵列的可能排列，并且n²和2×n²都不是n！的倍数，证明某些排列比其他排列更有可能。 Fisher-Yates混洗实际上等效于您的第二个建议，只是在某些优化中（性能= 0，复杂度=严重）变为（性能=很好，复杂度=非常简单）。（实际上，我不确定是否存在更快或更简单的正确版本。）

void fisher_yates_shuffle(size_t n,i+randn(n-1-i)); // swap element with random later element
}

预计到达时间：另请参阅有关编码恐怖的文章。 ,我没有在答案中看到它，所以我提出了这个解决方案，如果它可以帮助任何人：

static inline void shuffle(size_t n,int arr[])
{
    size_t      rng;
    size_t      i;
    int         tmp[n];
    int         tmp2[n];

   memcpy(tmp,arr,sizeof(int) * n);
    bzero(tmp2,sizeof(int) * n);
    srand(time(NULL));
    i = 0;
    while (i < n)
    {
        rng = rand() % (n - i);
        while (tmp2[rng] == 1)
            ++rng;
        tmp2[rng] = 1;
        arr[i] = tmp[rng];
        ++i;
    }
}

排列数组数组数组随机