Генератор случайных чисел в CUDA

Я боролся с этим весь день, я пытаюсь получить генератор случайных чисел для потоков в моем коде CUDA. Я просмотрел все форумы и да, эта тема подходит к концу, но я потратил часы, пытаясь разгадать всевозможные коды безрезультатно. Если кто-нибудь знает о простом методе, возможно, ядре устройство, которое может быть вызвано, чтобы возвращать случайное значение с 0 по 1 или целое число, которое я могу преобразовать, я был бы очень благодарен.

Опять же, я надеюсь использовать случайное число в ядре, например, как и rand().

Заранее спасибо

Ответ 1

Я не уверен, что понимаю, зачем вам что-то особенное. Любой традиционный PRNG должен иметь более или менее прямой доступ. линейный конгруэнтный должен работать нормально. У вас есть особые свойства, которые вы пытаетесь установить?

Ответ 2

Для всех, кого это интересует, вы можете сделать это через cuRAND.

Ответ 3

В зависимости от вашего приложения вы должны опасаться использования LCG без учета того, будут ли потоки (один поток на поток) перекрываться. Вы можете реализовать чехарду с LCG, но тогда вам понадобится достаточно длинный период LCG, чтобы гарантировать, что последовательность не повторяется.

Пример скачка может быть:

template <typename ValueType>
__device__ void leapfrog(unsigned long &a, unsigned long &c, int leap)
{
    unsigned long an = a;
    for (int i = 1 ; i < leap ; i++)
        an *= a;
    c = c * ((an - 1) / (a - 1));
    a = an;
}

template <typename ValueType>
__device__ ValueType quickrand(unsigned long &seed, const unsigned long a, const unsigned long c)
{
    seed = seed * a;
    return seed;
}

template <typename ValueType>
__global__ void mykernel(
    unsigned long *d_seeds)
{
    // RNG parameters
    unsigned long a = 1664525L;
    unsigned long c = 1013904223L;
    unsigned long ainit = a;
    unsigned long cinit = c;
    unsigned long seed;

    // Generate local seed
    seed = d_seeds[bid];
    leapfrog<ValueType>(ainit, cinit, tid);
    quickrand<ValueType>(seed, ainit, cinit);
    leapfrog<ValueType>(a, c, blockDim.x);

    ...
}

Но тогда период этого генератора, вероятно, в большинстве случаев недостаточен.

Если честно, я бы посмотрел на использование сторонней библиотеки, такой как NAG. В SDK есть несколько генераторов пакетов, но это, вероятно, не то, что вы ищете в этом случае.

ИЗМЕНИТЬ

Поскольку это только что поднялось, я считаю, что стоит обновить, отметив, что cuRAND, как упоминалось более поздними ответами на этот вопрос доступен и предоставляет ряд генераторов и распределений. Это определенно самое простое место для начала.

Ответ 4

Лучший способ для этого - написать собственную функцию устройства, вот что

void RNG()
{   
    unsigned int m_w = 150;
    unsigned int m_z = 40;

    for(int i=0; i < 100; i++)
    {
        m_z = 36969 * (m_z & 65535) + (m_z >> 16);
        m_w = 18000 * (m_w & 65535) + (m_w >> 16);

        cout <<(m_z << 16) + m_w << endl;  /* 32-bit result */
    }
}

Это даст вам 100 случайных чисел с 32-битным результатом.

Если вам нужны некоторые случайные числа от 1 до 1000, вы также можете взять result%1000, либо в точке потребления, либо в точке генерации:

((m_z << 16) + m_w)%1000

Изменение стартовых значений m_w и m_z (в примере 150 и 40) позволяет получать разные результаты каждый раз. Вы можете использовать threadIdx.x как один из них, который должен давать вам разные псевдослучайные ряды каждый раз.

Я хотел добавить, что он работает в 2 раза быстрее, чем функция rand(), и отлично работает;)

Ответ 5

Я думаю, что любое обсуждение этого вопроса должно отвечать на главный запрос Zenna, а для реализации уровня потока. В частности, функция устройства, которая может быть вызвана из ядра или потока. Извините, если я перевыполнил "жирные" фразы, но я действительно думаю, что ответы до сих пор не совсем касаются того, что здесь ищут.

Библиотека cuRAND - ваш лучший выбор. Я ценю, что люди хотят изобретать колесо (это заставляет ценить и более правильно использовать сторонние библиотеки), но высокопроизводительные генераторы качественных чисел изобилуют и хорошо тестируются. Лучшая информация, которую я могу порекомендовать, содержится в документации для библиотеки GSL на разных генераторах здесь: http://www.gnu.org/software/gsl/manual/html_node/Random-number-generator-algorithms.html

Для любого серьезного кода лучше всего использовать один из основных алгоритмов, который математики/компьютерные ученые снова и снова ищут системные недостатки. "Mersenne twister" - это что-то с периодом (цикл повторения) порядка 10 ^ 6000 (алгоритм MT19997 означает "Mersenne Twister 2 ^ 19997" ), который был специально адаптирован для использования Nvidia на уровне потока внутри потоков тот же warp, что и thread id, называется семенами. См. Статью здесь: http://developer.download.nvidia.com/compute/cuda/2_2/sdk/website/projects/MersenneTwister/doc/MersenneTwister.pdf. Я на самом деле работаю над реализацией somehting, используя эту библиотеку, и, если я получу ее для правильной работы, я отправлю свой код. Nvidia имеет несколько примеров на своем сайте документации для текущего инструментария CUDA.

ПРИМЕЧАНИЕ. Только для записи я не работаю для Nvidia, но я признаю, что их документация и дизайн абстракции для CUDA - это то, что я до сих пор впечатлял.


Ответ 6

Существует пакет MDGPU (GPL), который включает в себя реализацию функции GNU rand48() для CUDA здесь.

Я нашел его (довольно легко, используя Google, который, как я полагаю, вы пробовали:-) на форумах NVidia здесь.

Ответ 7

Я не нашел хорошего генератора параллельных чисел для CUDA, однако я нашел параллельный генератор случайных чисел, основанный на академических исследованиях здесь: http://sprng.cs.fsu.edu/

Ответ 8

Вы можете попробовать Mersenne Twister для графических процессоров

Он основан на SIMD-ориентированном Fast Mersenne Twister (SFMT), который является довольно быстрым и надежным генератором случайных чисел. Он проходит тесты Marsaglias DIEHARD для генераторов случайных чисел.