二项分布与泊松分布

  • 二项分布

在概率论和统计学中,二项分布是n个 独立是/非 试验中成功的次数的离散概率分布,其中每次试验的成功概率为p。这样的单次成功/失败试验又称为 伯努利试验

在n次独立的伯努利试验中有k次成功的概率为:($q=1-p$)
$$
P(X=k)=\dbinom{n}{k}p^kq^{n-k}
$$
其中${n\choose k}=\frac{n!}{k!(n-k)!}$是二项式系数(这就是二项分布的名称的由来)

例1:

一枚硬币是不均匀的,出现头像(H)的概率是2/3,假定每次掷硬币是独立的,当掷7次硬币恰好4次出现头像的概率是多少?
此例属于伯努利试验,我们用p=2/3表示出现头像的概率,q表示出现反面的概率(T),则q=1-p=1/3, 随机变量X表示出现k次头像
$$
P(X=4)=\dbinom{7}{4}\left(\frac{2}{3}\right)^4\left(\frac{1}{3}\right)^3
$$

  • 泊松分布

泊松分布是一种统计与概率学里常见到的离散概率分布。泊松分布可以看成是二项分布的一种极限情形。

泊松分布的概率质量函数为:
$$
P(X=k)=\frac{e^{-\lambda}\lambda^k}{k!}
$$
泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。

  • 泊松分布使用范围
  1. 给定区域内的特定事件产生的次数,可以是根据时间,长度,面积来定义;
  2. 各段相等区域内的特定事件产生的概率是一样的;
  3. 各区域内,事件发生的概率是相互独立的;
  4. 当给定区域变得非常小时,两次以上事件发生的概率趋向于0。
  • 泊松分布的来源

在二项分布的伯努利试验中,如果试验次数n很大,二项分布的概率p很小,且乘积λ= n p比较适中,则事件出现的次数的概率可以用泊松分布来逼近。事实上,二项分布可以看作泊松分布在离散时间上的对应物。

首先,回顾$e$的定义:
$$
\lim_{n\to\infty}\left(1-{\lambda \over n}\right)^n=e^{-\lambda}
$$

二项分布的定义:
$$
P(X=k)={n \choose k} p^k (1-p)^{n-k}.
$$

例2:

有一繁忙的汽车站,每天有大量汽车通过,设每辆汽车,在一天的某段时间内出事故的概率为0.0001,在每天的该段时间内有1000辆汽车通过,问出事故的次数不小于2的概率是多少?

由于p=0.0001很小,n=1000很大,而且事故发生的概率是相互独立的,所以满足泊松分布条件。我们先计算出现0,1次事故的概率:($\lambda=np=0.1$)
$$
P(X=0)=\frac{e^{-0.1}0.1^0}{0!}=e^{-0.1}=0.9048374180359595
$$
$$
P(X=1)=\frac{e^{-0.1}0.1^1}{1!}=0.1e^{-0.1}=0.0904837418035959
$$
所以出事故的次数不小于2的概率是$1-P(X=0)-P(X=1)=0.0046788401604445085$