参数估计
当你看数据挖掘的相关数据,虽然一遍一遍的看,但是总是不太懂,这个时候你可能需要看看数理统计的相关知识,这是个追根溯源的时代,知识体系也是一样,所以我们开始数学路程吧。

点估计:依据样本估计总体分布中所含的未知参数或未知参数的函数。

区间估计(置信区间的估计):依据抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,作为总体分布的未知参数或参数的函数的真值所在范围的估计。例如人们常说的有百分之多少的把握保证某值在某个范围内,即是区间估计的最简单的应用。

矩方法
矩估计法的理论依据是大数定律。矩估计是基于一种简单的“替换”思想,即用样本矩估计总体矩。

根据 式1 和式2 能够得到
∫x(1+α)xa=Xˉ
使用矩方法做参数估计一般包括三个步骤
1.计算低阶矩,找出利用参数表示的表达式。通常需要的低阶矩的个数就是参数的个数。
2.求解上面的表达式。得到矩表示参数表达式
3.将样本矩带入第二步的表达式,得到样本矩的参数估计。
矩方法的优缺点
优点:简单易行,不需要知道总体分布
缺点: 样本矩近似总体矩有一个的随机性。
极大似然估计
极大似然估计 是在总体分布已知的情况下进行的一种参数估计的方法,极大似然估计使用的原理就是极大似然原理 大概率事件更加容易被观测到,极大似然估计的核心是似然函数的构造和求解。
似然函数的构造
假设X是离散型随机变量,其分布律为P(X=x)=p(x∣θ),从总体中抽取若干样本x0,x1,,,xn,样本的联合分布律为:

这里需要关联原来所说的知识,再说到线性回归的逻辑回归的时候,当时提到的似然函数等知识,你可能不太懂,这里将似然函数的使用套路说了一下,更加有助于你的理解。