[拼音]:dianguji
[外文]:point estimation
参数估计的一种形式。目的是依据样本X=(X1,X2,…,Xn)估计总体分布所含的未知参数θ或θ的函数 g(θ)。一般θ或g(θ)是总体的某个特征值,如数学期望、方差、相关系数(见相关分析)等。θ或 g(θ)通常取实数或k维实向量为值。点估计问题就是要构造一个只依赖于样本X的量抭(X),作为g(θ)的估计值。抭(X)称为g(θ)的估计量。因为k维实向量可表为k维欧几里得空间的一个点,故称这样的估计为点估计。
例如,设一批产品的废品率为θ,为估计θ,从这批产品中随机地抽出 n个作检查,以X 记其中的废品个数,用 X/n估计θ,就是一个点估计。又如用样本方差(见统计量)估计总体分布的方差,或用样本相关系数估计总体分布的相关系数,都是常见的点估计。
构造点估计的方法
常用的有以下几种:
矩估计法这是英国统计学家К.皮尔森在1894年提出的方法,其要旨是用样本矩的函数估计总体矩的同一函数。例如,若总体分布服从正态分布 N(μ,σ2),其中μ是总体均值,σ2是总体方差,未知参数可记为θ=(μ,σ)。σ/μ(μ≠0)称为变异系数,它是总体的一阶原点矩(即均值)μ与二阶中心矩(即方差)σ2的函数。设有样本X=(X1,X2,…,Xn),其一阶样本原点矩为,二阶样本中心矩为,而用估计 σ/μ,就是一个典型的矩估计方法。
最大似然估计法此法作为一种重要而普遍的点估计法,由英国统计学家R.A.费希尔在1912年提出。后来在他1921年和1925年的工作中又加以发展。设样本X=(X1,X2,…,Xn)的分布密度为L(X,θ),若固定X而将L视为θ的函数,则称为似然函数,当X是简单随机样本时,它等于ƒ(X1,θ)ƒ(X2,θ)…ƒ(Xn,θ),其中,ƒ(X,θ)是总体分布的密度函数或概率函数(见概率分布)。一经得到样本值x,就确定(x),使 ,然后用估计g(θ),这就是g(θ)的最大似然估计。例如,不难证明,前面为估计正态分布N(μ,σ2)中的参数μ和σ2而提出的估计量和2,就是μ和σ2的最大似然估计。
最小二乘估计法这个重要的估计方法是由德国数学家C.F.高斯在1799~1809年和法国数学家A.-M.勒让德在1806年提出,并由俄国数学家Α.Α.马尔可夫在1900年加以发展。它主要用于线性统计模型中的参数估计问题。
贝叶斯估计法是基于“贝叶斯学派”的观点而提出的估计法(见贝叶斯统计)。
小样本优良性准则
可以用来估计g(θ)的估计量很多,于是产生了怎样选择一个优良估计量的问题。首先必须对“优良性”定出准则。这种准则不是惟一的,它可以根据问题的实际背景和理论上的方便进行选择。优良性准则有两大类:一类是小样本准则,即在样本大小固定时的优良性准则;另一类是大样本准则,即在样本大小趋于无穷时的优良性准则。最重要的小样本优良性准则是无偏性及与此相关的一致最小方差无偏估计。若一个估计量抭(X)的数学期望等于被估计的g(θ),即对一切θ,,则称抭(X)为g(θ)的无偏估计,这种估计的特点是:在多次重复使用时, 抭(X)与g(θ)的偏差的算术平均值随使用次数的增加而趋于零。因此,无偏性只在重复使用中,并且各次误差能相互抵消时,才显出其意义。无偏估计并不总是存在。例如,设总体服从二项分布B(n,θ),0