概率论(四)

中心极限定理

当你看数据挖掘的相关数据,虽然一遍一遍的看,但是总是不太懂,这个时候你可能需要看看数理统计的相关知识,这是个追根溯源的时代,知识体系也是一样,所以我们开始数学路程吧。在本节中我们来说一下中心极限定理

极限定理

X1,...,XnX_1,...,X_n是独立同分布的随机变量序列,序列的每一项均值是μ\mu,方差为σ2\sigma^2,记为

Zn=X1+...+XnnμnσZ_n=\frac{X_1+...+X_n-n\mu}{\sqrt{n}\sigma}

ZnZ_n的分布式标准正态分布。

这就是中心极限定理的描述

基于中心极限定理的正态近似

Sn=X1+...+XnS_n=X_1+...+X_n,其中X1...XnX_1...X_n是独立同分布,且序列的每一项均值是μ\mu,方差为σ2\sigma^2,当n充分大的时候,概率P(Sn<c)P(S_n<c)可以通过SnS_n视为正态分布近似计算,其步骤是

1.计算SnS_n均值nμn\mu和方差nσ2n\sigma^2

2.计算归一化的值,z=cnμnσz=\frac{c-n\mu}{\sqrt{n}\sigma}

3.计算近似值

demo

下面我们说一个实际的例子,飞机运载100个货物,每个货物的总量随机,但是在5-50磅之间,那么这100个货物总量小于3000磅的概率是多少?

首先计算均值和方差

μ=5+502=27.5\mu=\frac{5+50}{2}=27.5

σ2=(505)212=168.75\sigma^2=\frac{(50-5)^2}{12}=168.75

计算标准正态值

z=300010027.5100168.75=1.92z=\frac{3000-100*27.5}{\sqrt{100*168.75}}=1.92

直接查表

P(x<3000)=0.972P(x<3000)=0.972

二项分布的拉普拉斯近似

probability_theory_19.png

# math 
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×