Python / Numpy / Scipy: рисовать случайные значения Пуассона с разными лямбдами

Моя проблема состоит в том, чтобы извлечь наиболее эффективным способом N случайных значений Пуассона (RV), каждое из которых имеет различное среднее значение / скорость Lam. В основном size(RV) == size(Lam).

Вот наивная (очень медленная) реализация:

import numpy as NP

def multi_rate_poisson(Lam):
    rv = NP.zeros(NP.size(Lam))
    for i,lam in enumerate(Lam):
        rv[i] = NP.random.poisson(lam=lam, size=1)
    return rv

Это на моем ноутбуке с образцами 1e6 дает:

Lam = NP.random.rand(1e6) + 1
timeit multi_poisson(Lam)
1 loops, best of 3: 4.82 s per loop

Можно ли что-то улучшить?


person user2304916    schedule 21.04.2013    source источник


Ответы (1)


Хотя строки документации не документируют эту функциональность, source указывает, что можно передать массив в функцию numpy.random.poisson.

>>> import numpy
>>> # 1 dimension array of 1M random var's uniformly distributed between 1 and 2
>>> numpyarray = numpy.random.rand(1e6) + 1 
>>> # pass to poisson
>>> poissonarray = numpy.random.poisson(lam=numpyarray)
>>> poissonarray
array([4, 2, 3, ..., 1, 0, 0])

случайная величина Пуассона возвращает дискретные значения, кратные единице, и аппроксимирует колоколообразную кривую, когда лямбда превышает единицу.

>>> import matplotlib.pyplot
>>> count, bins, ignored = matplotlib.pyplot.hist(
            numpy.random.poisson(
                    lam=numpy.random.rand(1e6) + 10), 
                    14, normed=True)
>>> matplotlib.pyplot.show()

Этот метод передачи массива генератору Пуассона оказывается достаточно эффективным.

>>> timeit.Timer("numpy.random.poisson(lam=numpy.random.rand(1e6) + 1)",
                 'import numpy').repeat(3,1)
[0.13525915145874023, 0.12136101722717285, 0.12127304077148438]
person Aaron Hall    schedule 17.09.2013