概率论(三)

参数估计

当你看数据挖掘的相关数据,虽然一遍一遍的看,但是总是不太懂,这个时候你可能需要看看数理统计的相关知识,这是个追根溯源的时代,知识体系也是一样,所以我们开始数学路程吧。

probability_theory_14.jpg

点估计:依据样本估计总体分布中所含的未知参数或未知参数的函数。

probability_theory_15.jpg

区间估计(置信区间的估计):依据抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,作为总体分布的未知参数或参数的函数的真值所在范围的估计。例如人们常说的有百分之多少的把握保证某值在某个范围内,即是区间估计的最简单的应用。

probability_theory_16.jpg

矩方法

矩估计法的理论依据是大数定律。矩估计是基于一种简单的“替换”思想,即用样本矩估计总体矩。

probability_theory_17.jpg

根据 式1 和式2 能够得到

x(1+α)xa=Xˉ\int x(1+\alpha)x^a = \bar{X}

使用矩方法做参数估计一般包括三个步骤

1.计算低阶矩,找出利用参数表示的表达式。通常需要的低阶矩的个数就是参数的个数。
2.求解上面的表达式。得到矩表示参数表达式
3.将样本矩带入第二步的表达式,得到样本矩的参数估计。

矩方法的优缺点

优点:简单易行,不需要知道总体分布
缺点: 样本矩近似总体矩有一个的随机性。

极大似然估计

极大似然估计 是在总体分布已知的情况下进行的一种参数估计的方法,极大似然估计使用的原理就是极大似然原理 大概率事件更加容易被观测到,极大似然估计的核心是似然函数的构造和求解。

似然函数的构造

假设X是离散型随机变量,其分布律为P(X=x)=p(xθ)P(X=x)=p(x|\theta),从总体中抽取若干样本x0,x1,,,xnx_0, x_1,,,x_n,样本的联合分布律为:
probability_theory_18.jpg

这里需要关联原来所说的知识,再说到线性回归的逻辑回归的时候,当时提到的似然函数等知识,你可能不太懂,这里将似然函数的使用套路说了一下,更加有助于你的理解。

# math 
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×