问题描述
我想生成一个不均匀的数据集,该数据集的结尾处有更多数据点。假设范围是[a-b],a,b> 0,并且我想在python中找到一种方法来生成具有更高数据点的上限数据附近的非均匀数据。类似于反向日志分配。
谢谢。
解决方法
如果您已经有了发行版,可以使用scipy。
from scipy import stats
a = 2 # just an example min-range value
b = 10 # just an example max-range value
data = stats.beta(2,8)*(b-a) + a # you can alter the shape of the distribution by playing with parameters
Here,您可以找到有关Beta发行版的更多信息。