中心极限定理
当你看数据挖掘的相关数据,虽然一遍一遍的看,但是总是不太懂,这个时候你可能需要看看数理统计的相关知识,这是个追根溯源的时代,知识体系也是一样,所以我们开始数学路程吧。在本节中我们来说一下中心极限定理
极限定理
设X1,...,Xn是独立同分布的随机变量序列,序列的每一项均值是μ,方差为σ2,记为
Zn=nσX1+...+Xn−nμ
则Zn的分布式标准正态分布。
这就是中心极限定理的描述
基于中心极限定理的正态近似
令Sn=X1+...+Xn,其中X1...Xn是独立同分布,且序列的每一项均值是μ,方差为σ2,当n充分大的时候,概率P(Sn<c)可以通过Sn视为正态分布近似计算,其步骤是
1.计算Sn均值nμ和方差nσ2
2.计算归一化的值,z=nσc−nμ
3.计算近似值
demo
下面我们说一个实际的例子,飞机运载100个货物,每个货物的总量随机,但是在5-50磅之间,那么这100个货物总量小于3000磅的概率是多少?
首先计算均值和方差
μ=25+50=27.5
σ2=12(50−5)2=168.75
计算标准正态值
z=100∗168.753000−100∗27.5=1.92
直接查表
P(x<3000)=0.972
二项分布的拉普拉斯近似