万维百科

泊松分布本文重定向自 泊松分佈

(重定向自泊松分佈)
泊松分布
Plot of the Poisson PMF
横轴是索引k,发生次数。该函数只定义在k为整数的时候。连接线是只为了指导视觉。
概率质量函数
Plot of the Poisson CDF
横轴是索引k,发生次数。CDF在整数k处不连续,且在其他任何地方都是水平的,因为服从泊松分布的变量只针对整数值。
累积分布函数
参数λ > 0(实数
值域
概率质量函数
累积分布函数,或,或 (对于,其中不完全Γ函数高斯符号,Q是规则化Γ函数)
期望值
中位数
众数
方差
偏度
峰度

(假设较大)


矩生成函数
特征函数

泊松分布(法语:loi de Poisson,英语:Poisson distribution)又称Poisson分布帕松分布布瓦松分布布阿松分布普阿松分布波以松分布卜氏分布帕松小数法则(Poisson law of small numbers),是一种统计概率学里常见到的离散概率分布,由法国数学家西莫恩·德尼·泊松在1838年时发表。

泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数、激光的光子数分布等等。

泊松分布的概率质量函数为:

泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。

记号

服从参数为的泊松分布,记为,或记为.

性质

1、服从泊松分布的随机变量,其数学期望方差相等,同为参数 :

2、两个独立且服从泊松分布的随机变量,其和仍然服从泊松分布。更精确地说,若 ,则

3、其矩生成函数为:

推导

期望值:(倒数第三至第二是使用泰勒展开式)

我们可以得到:

如同性质:

泊松分布的来源(泊松小数定律)

二项分布伯努利试验中,如果试验次数n很大,二项分布的概率p很小,且乘积λ= np比较适中,则事件出现的次数的概率可以用泊松分布来逼近。事实上,二项分布可以看作泊松分布在离散时间上的对应物。

证明如下。首先,回顾e的定义:

二项分布的定义:

如果令, 趋于无穷时的极限:

最大似然估计(MLE)

给定n个样本值ki,希望得到从中推测出总体的泊松分布参数λ的估计。为计算最大似然估计值,列出对数似然函数:

解得λ从而得到一个驻点(stationary point):

检查函数L的二阶导数,发现对所有的λ与ki大于零的情况二阶导数都为负。因此求得的驻点是对数似然函数L的极大值点:

例子

对某公共汽车站的客流做调查,统计了某天上午10:30到11:47来到候车的乘客情况。假定来到候车的乘客各批(每批可以是1人也可以是多人)是互相独立发生的。观察每20秒区间来到候车的乘客批次,共观察77分钟*3=231次,共得到230个观察记录。其中来到0批、1批、2批、3批、4批及4批以上的观察记录分别是100次、81次、34次、9次、6次。使用极大似真估计(MLE),得到的估计为(81*1+34*2+9*3+6*4)/230≈0.87。

生成泊松分布的随机变量

一个用来生成随机泊松分布的数字(伪随机数抽样)的简单算法,已经由高德纳给出(见下文参考):

algorithm poisson random number (Knuth):
    init:
         Let L ← e−λ, k ← 0 and p ← 1.
    do:
         k ← k + 1.
         Generate uniform random number u in [0,1] and let p ← p×u.
    while p > L.
    return k − 1.

尽管简单,但复杂度是线性的,在返回的值k,平均是λ。还有许多其他算法来克服这一点。有些人由Ahrens和Dieter给出,请参阅下面的参考资料。同样,对于较大的λ值,e可能导致数值稳定性问题。对于较大λ值的一种解决方案是拒绝采样,另一种是采用泊松分布的高斯近似。

对于很小的λ值,逆变换取样简单而且高效,每个样本只需要一个均匀随机数u。直到有超过u的样本,才需要检查累积概率。

algorithm Poisson generator based upon the inversion by sequential search:
    init:
         Let x ← 0, p ← e−λ, s ← p.
         Generate uniform random number u in [0,1].
    do:
         x ← x + 1.
         p ← p * λ / x.
         s ← s + p.
    while u > s.
    return x.

参见

注释

  1. ^ Luc Devroye, Non-Uniform Random Variate Generation(Springer-Verlag, New York, 1986), chapter 10, page 505 http://luc.devroye.org/rnbookindex.html页面存档备份,存于互联网档案馆

参考文献

  • Guerriero V. Power Law Distribution: Method of Multi-scale Inferential Statistics. Journal of Modern Mathematics Frontier (JMMF). 2012, 1: 21–28 [2017-10-30]. (原始内容存档于2018-02-21).
  • Joachim H. Ahrens, Ulrich Dieter. Computer Methods for Sampling from Gamma, Beta, Poisson and Binomial Distributions. Computing. 1974, 12 (3): 223–246. doi:10.1007/BF02293108.
  • Joachim H. Ahrens, Ulrich Dieter. Computer Generation of Poisson Deviates. ACM Transactions on Mathematical Software. 1982, 8 (2): 163–179. doi:10.1145/355993.355997.
  • Ronald J. Evans, J. Boersma, N. M. Blachman, A. A. Jagers. The Entropy of a Poisson Distribution: Problem 87-6. SIAM Review. 1988, 30 (2): 314–317. doi:10.1137/1030059.
  • Donald E. Knuth. Seminumerical Algorithms. The Art of Computer Programming, Volume 2. Addison Wesley. 1969.

本页面最后更新于2021-09-06 00:17,点击更新本页查看原网页。台湾为中国固有领土,本站将对存在错误之处的地图、描述逐步勘正。

本站的所有资料包括但不限于文字、图片等全部转载于维基百科(wikipedia.org),遵循 维基百科:CC BY-SA 3.0协议

万维百科为维基百科爱好者建立的公益网站,旨在为中国大陆网民提供优质内容,因此对部分内容进行改编以符合中国大陆政策,如果您不接受,可以直接访问维基百科官方网站


顶部

如果本页面有数学、化学、物理等公式未正确显示,请使用火狐或者Safari浏览器