查看“泊松分佈”的源代码
←
泊松分佈
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑本页:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{NoteTA |G1 = Math |1 = zh-cn:泊松; zh-tw:帕松; zh-hk:泊松; }} {{機率分佈 | name = 泊松分布 | type = 质量 | pdf_image = [[File:poisson pmf.svg|325px|Plot of the Poisson PMF]]<br />横轴是索引''k'',发生次数。该函数只定义在''k''为整数的时候。连接线是只为了指导视觉。 | cdf_image = [[File:poisson cdf.svg|325px|Plot of the Poisson CDF]]<br />横轴是索引''k'',发生次数。CDF在整数''k''处不连续,且在其他任何地方都是水平的,因为服从泊松分布的变量只针对整数值。 | parameters = ''λ'' > 0([[实数]]) | support = ''k'' ∈ { 0, 1, 2, 3, ... } | pdf = <math>\frac{\lambda^k}{k!} e^{-\lambda}</math> | cdf = <math>\frac{\Gamma(\lfloor k+1\rfloor, \lambda)}{\lfloor k\rfloor !}</math>,或<math>e^{-\lambda} \sum_{i=0}^{\lfloor k\rfloor} \frac{\lambda^i}{i!}\ </math>,或<math>Q(\lfloor k+1\rfloor,\lambda)</math> (对于<math>k\ge 0</math>,其中<math>\Gamma(x, y)</math>是[[不完全Γ函数]],<math>\lfloor k\rfloor</math>是[[高斯符号]],Q是规则化Γ函数) | mean = <math>\lambda</math> | median = <math>\approx\lfloor\lambda+1/3-0.02/\lambda\rfloor</math> | mode = <math>\lceil\lambda\rceil - 1, \lfloor\lambda\rfloor</math> | variance = <math>\lambda</math> | skewness = <math>\lambda^{-1/2}</math> | kurtosis = <math>\lambda^{-1}</math> | entropy = <math>\lambda[1 - \log(\lambda)] + e^{-\lambda}\sum_{k=0}^\infty \frac{\lambda^k\log(k!)}{k!}</math> (for large <math>\lambda</math>) <math>\frac{1}{2}\log(2 \pi e \lambda) - \frac{1}{12 \lambda} - \frac{1}{24 \lambda^2} -</math><br><math>\qquad \frac{19}{360 \lambda^3} + O\left(\frac{1}{\lambda^4}\right)</math><!--formula split with \qquad indent--> | pgf = <math>\exp(\lambda(z - 1))</math> | mgf = <math>\exp(\lambda (e^{t} - 1))</math> | char = <math>\exp(\lambda (e^{it} - 1))</math> }} '''泊松分布'''({{Lang-fr|loi de Poisson}},{{Lang-en|Poisson distribution}})又稱'''-{zh-cn:帕松; zh-tw:泊松; zh-hk:帕松;}-分布'''、'''普阿松分布'''、'''布瓦松分佈'''、'''布阿松分佈'''、'''波以松分佈'''、'''卜氏分配'''、'''帕松小數法則'''(Poisson law of small numbers),是一種[[統計]]與[[概率]]學裡常見到的[[机率分布|離散機率分佈]],由[[法國]][[數學家]][[西莫恩·丹尼·泊松|西莫恩·德尼·泊松]](Siméon-Denis Poisson)在1838年時發表。 泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,[[电话]][[交换机]]接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、[[自然灾害]]发生的次数、DNA序列的变异数、放射性原子核的衰变数、[[雷射]]的光子數分布等等。 泊松分布的[[概率質量函数]]为: :<math>P(X=k)=\frac{e^{-\lambda}\lambda^k}{k!}</math> 泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。 == 记号 == 若<math>X</math>服从参数为<math>\lambda</math>的泊松分布,记为<math>X \sim \pi(\lambda)</math>,或记为<math>X \sim P(\lambda)</math>. == 性质 == 1、服从泊松分布的[[随机变量]],其[[期望值|数学期望]]与[[方差]]相等,同为参数<math>\lambda</math> : <math> E(X) = V(X)= \lambda</math> 2、兩個獨立且服从泊松分布的[[随机变量]],其和仍然服从泊松分布。更精確地說,若 <math>X \sim Poisson(\lambda_1)</math>且 <math>Y \sim Poisson(\lambda_2)</math>,則<math>X+Y \sim Poisson(\lambda_1+\lambda_2)</math>。 3、其[[矩母函数]]为: :<math>M_X(t)=E[e^{tX}]=\sum_{x=0}^\infty e^{tx}\frac{e^{-\lambda}\lambda^x}{x!}=e^{-\lambda}\sum_{x=0}^\infty\frac{({e^t}\lambda)^x}{x!}=e^{{\lambda}(e^t-1)}</math> == 推導 == 期望值:(倒數第三至第二是使用[[泰勒级数|泰勒展開式]]) <math>\begin{align} \Epsilon(X) & =\textstyle \sum_{i=0}^\infty \displaystyle i P(X = i) \\ & = \textstyle \sum_{i=1}^\infty \displaystyle i {e^{-\lambda} \lambda^i \over i!} \\ & = \lambda e^{-\lambda} \textstyle \sum_{i=1}^\infty \displaystyle {\lambda^{i-1} \over (i-1)!} \\ & = \lambda e^{-\lambda} \textstyle \sum_{i=0}^\infty \displaystyle {\lambda^i \over i!} \\ & = \lambda e^{-\lambda} e^{\lambda} \\ & = \lambda \end{align}</math> <math>\begin{align} \Epsilon(X^2) & =\textstyle \sum_{i=0}^\infty \displaystyle i^2 P(X = i) \\ & = \textstyle \sum_{i=1}^\infty \displaystyle i^2 {e^{-\lambda} \lambda^i \over i!}\\ & = \lambda e^{-\lambda} \textstyle \sum_{i=1}^\infty \displaystyle {i \lambda^{i-1} \over (i-1)!}\\ & = \lambda e^{-\lambda} \textstyle \sum_{i=1}^\infty \displaystyle {1 \over (i-1)!} {d \over d \lambda}(\lambda ^ i)\\ & = \lambda e^ {- \lambda}{d \over d \lambda}[\textstyle \sum_{i=1}^\infty \displaystyle {\lambda^i \over (i-1)!}]\\ & = \lambda e^ {- \lambda}{d \over d \lambda}[\lambda \textstyle \sum_{i=1}^\infty \displaystyle {\lambda^{i-1} \over (i-1)!}]\\ & = \lambda e^ {- \lambda}{d \over d \lambda} (\lambda e^{\lambda}) = \lambda e^ {- \lambda} (e^ {\lambda} + \lambda e ^{\lambda}) = \lambda + \lambda^2 \end{align}</math> 我們可以得到:<math>Var(X) = (\lambda + \lambda ^2) - \lambda ^2 = \lambda</math> 如同性質:<math>E(X) = Var(X) = \lambda</math>、<math>\sigma x = \sqrt{\lambda}</math>{{-}} == 泊松分布的来源(泊松小数定律) == 在[[二项分布]]的[[伯努利试验]]中,如果试验次数n很大,二项分布的概率p很小,且乘积λ='' np''比较适中,则事件出现的次数的概率可以用泊松分布来逼近。事实上,二项分布可以看作泊松分布在离散時間上的对应物。 证明如下。首先,回顾''e''的定义: :<math>\lim_{n\to\infty}\left(1-{\lambda \over n}\right)^n=e^{-\lambda},</math> 二项分布的定义: :<math>P(X=k)={n \choose k} p^k (1-p)^{n-k}</math>。 如果令<math>p = \lambda/n</math>, <math>n</math>趋于无穷时<math>P</math>的极限: :<math> \begin{align} \lim_{n\to\infty} P(X=k)&=\lim_{n\to\infty}{n \choose k} p^k (1-p)^{n-k} \\ &=\lim_{n\to\infty}{n! \over (n-k)!k!} \left({\lambda \over n}\right)^k \left(1-{\lambda\over n}\right)^{n-k}\\ &=\lim_{n\to\infty} \underbrace{\left[\frac{n!}{n^k\left(n-k\right)!}\right]}_F \left(\frac{\lambda^k}{k!}\right) \underbrace{\left(1-\frac{\lambda}{n}\right)^n}_{\to\exp\left(-\lambda\right)} \underbrace{\left(1-\frac{\lambda}{n}\right)^{-k}}_{\to 1} \\ &= \lim_{n\to\infty} \underbrace{\left[ \left(1-\frac{1}{n}\right)\left(1-\frac{2}{n}\right) \ldots \left(1-\frac{k-1}{n}\right) \right]}_{\to 1} \left(\frac{\lambda^k}{k!}\right) \underbrace{\left(1-\frac{\lambda}{n}\right)^n}_{\to\exp\left(-\lambda\right)} \underbrace{\left(1-\frac{\lambda}{n}\right)^{-k}}_{\to 1} \\ &= \left(\frac{\lambda^k}{k!}\right)\exp\left(-\lambda\right) \end{align} </math> == 極大似然估計(MLE) == 给定''n''个样本值''k''<sub>''i''</sub>,希望得到从中推测出总体的泊松分布参数''λ''的估计。为计算[[最大似然估计]]值,列出对数似然函数: :<math> \begin{align} L(\lambda) & = \ln \prod_{i=1}^n f(k_i \mid \lambda) \\ & = \sum_{i=1}^n \ln\!\left(\frac{e^{-\lambda}\lambda^{k_i}}{k_i!}\right) \\ & = -n\lambda + \left(\sum_{i=1}^n k_i\right) \ln(\lambda) - \sum_{i=1}^n \ln(k_i!). \end{align} </math> :<math>\frac{\mathrm{d}}{\mathrm{d}\lambda} L(\lambda) = 0 \iff -n + \left(\sum_{i=1}^n k_i\right) \frac{1}{\lambda} = 0. \!</math> 解得''λ''从而得到一个[[驻点]](stationary point): :<math>\widehat{\lambda}_\mathrm{MLE}=\frac{1}{n}\sum_{i=1}^n k_i. \!</math> 检查函数''L''的二阶导数,发现对所有的''λ''与k<sub>i</sub>大于零的情况二阶导数都为负。因此求得的驻点是对数似然函数''L''的极大值点: :<math>\frac{\partial^2 L}{\partial \lambda^2} = \sum_{i=1}^n -\lambda^{-2} k_i </math> == 例子 == 对某公共汽车站的客流做调查,统计了某天上午10:30到11:47来到候车的乘客情况。假定来到候车的乘客各批(每批可以是1人也可以是多人)是互相独立发生的。观察每20秒区间来到候车的乘客批次,共观察77分钟*3=231次,共得到230个观察记录。其中来到0批、1批、2批、3批、4批及4批以上的观察记录分别是100次、81次、34次、9次、6次。使用极大似真估计(MLE),得到<math>\lambda</math>的估计为(81*1+34*2+9*3+6*4)/231=0.8658。 ==生成泊松分布的随机变量== 一个用来生成随机泊松分布的数字(伪随机数抽样)的简单算法,已经由[[高德纳]]给出(见下文参考): '''algorithm''' ''poisson random number (Knuth)'': '''init''': '''Let''' L ← ''e''<sup>−λ</sup>, k ← 0 and p ← 1. '''do''': k ← k + 1. Generate uniform random number u in [0,1] and '''let''' p ← p×u. '''while''' p > L. '''return''' k − 1. 尽管简单,但复杂度是线性的,在返回的值''k'',平均是λ。还有许多其他算法来克服这一点。有些人由Ahrens和Dieter给出,请参阅下面的参考资料。同样,对于较大的λ值,e<sup>-λ</sup>可能导致数值稳定性问题。对于较大λ值的一种解决方案是[[拒绝采样]],另一种是采用泊松分布的高斯近似。 对于很小的λ值,逆变换取样简单而且高效,每个样本只需要一个均匀随机数u。直到有超过''u''的样本,才需要检查累积概率。 '''algorithm''' ''Poisson generator based upon the inversion by sequential search'':<ref>Luc Devroye, ''Non-Uniform Random Variate Generation''(Springer-Verlag, New York, 1986), chapter 10, page 505 http://luc.devroye.org/rnbookindex.html</ref> '''init''': '''Let''' x ← 0, p ← ''e''<sup>−λ</sup>, s ← p. Generate uniform random number u in [0,1]. '''do''': x ← x + 1. p ← p * λ / x. s ← s + p. '''while''' u > s. '''return''' x. == 参见 == * [[泊松过程]] * [[概率论]] * [[泊松回归]] == 注释 == {{reflist}} == 参考文献 == * {{cite journal | author=Guerriero V. | title=Power Law Distribution: Method of Multi-scale Inferential Statistics | journal=Journal of Modern Mathematics Frontier (JMMF) | year=2012 | volume=1 | pages=21–28 | url=http://www.seipub.org/sjmmf/MostDownloaded.aspx | access-date=2017-10-30 | archive-url=https://web.archive.org/web/20180221211902/http://www.seipub.org/sjmmf/MostDownloaded.aspx | archive-date=2018-02-21 | dead-url=yes }} * {{cite journal | author=Joachim H. Ahrens, Ulrich Dieter | title=Computer Methods for Sampling from Gamma, Beta, Poisson and Binomial Distributions | journal=Computing | year=1974 | volume=12 | issue=3 | pages=223–246 | doi=10.1007/BF02293108 }} * {{cite journal | author=Joachim H. Ahrens, Ulrich Dieter | title=Computer Generation of Poisson Deviates | journal=ACM Transactions on Mathematical Software | year=1982 | volume=8 | issue=2 | pages=163–179 | doi=10.1145/355993.355997 }} * {{cite journal | author=Ronald J. Evans, J. Boersma, N. M. Blachman, A. A. Jagers | title=The Entropy of a Poisson Distribution: Problem 87-6 | journal=SIAM Review | year=1988 | volume=30 | issue=2 | pages=314–317 | doi=10.1137/1030059 }} * {{cite book | author = Donald E. Knuth | title = Seminumerical Algorithms | publisher = [[Addison Wesley]] | series = The Art of Computer Programming, Volume 2 | year = 1969}} {{常见一元概率分布}} {{概率分布类型列表}} [[Category:离散分布]] [[Category:阶乘与二项式主题]]
本页使用的模板:
Template:-
(
查看源代码
)
Template:Cite book
(
查看源代码
)
Template:Cite journal
(
查看源代码
)
Template:Lang-en
(
查看源代码
)
Template:Lang-fr
(
查看源代码
)
Template:NoteTA
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:常见一元概率分布
(
查看源代码
)
Template:概率分布类型列表
(
查看源代码
)
Template:機率分佈
(
查看源代码
)
返回
泊松分佈
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息