第三节 数理统计(Mathematical Statistics)
数理统计方法考虑问题般资料统计更侧重应机现象身规律性考虑资料收集整理分析找出相应机变量分布律数字特征量机试验必呈现出规律性理讲机现象进行足够次观察研究机现象规律性定清楚呈现出实际允许观察永远限时甚少量关心问题样效利限资料便掉资料足引起机干扰实质性东西找出统计方法 效利获资料作出精确结
1数理统计基概念
1)母体子样
研究全部元素组成集合称母体总体组成母体元素称体
母体分布律进行种研究必需母体进行抽样观察般说止进行次抽样观察进行次观察设X1X2…Xn观察结果显然机变量称容量n子样X1X2…Xn取值全体称子样空间
抽取子样目母体分布律进行种分析推断求抽取子样反映母体特性必须机抽样方法提出定求通常提出面两点:
(i)代表性:求子样分量Xi考察母体X具相分布F(x)
(ii)独立性:X1X2…Xn相互独立机变量说观察结果影响观察结果受观察结果影响
满足述两点性质子样称简单机子样获简单机子样抽样方法称简单机抽样
简单机子样X(X1X2…Xn)分布母体分布函数F(x)完全决定X分布函数
2)统计量
般说子样某种含未知参数函数统计学中称统计量
统计量:
非统计量:
3)常统计量—子样矩
r阶矩(r阶原点矩):子样均值
r阶中心矩:子样方差
总结:母体母体均值μ母体方差母体k阶原点矩k阶中心矩
子样子样均值子样方差子样r阶矩Arr阶中心矩Br
结:
定理1 设母体服分布F(x)X(X1…Xn)该母体中抽简单机子样果F(x)二阶矩阵存子样均值
[证明]
思考:否存更简单证明方法?
定理2 子样方差均值
证明:
(中)
4)序统计量验分布函数子样矩
设(X1…Xn)母体 中抽取子样记(x1x2…xn)子样观察值观察值分量递增次序排列
≤≤…≤
(X1…Xn)取值(x1…xn)时定义取值称(X1…Xn)组序统计量显然≤≤…≤观察值子样观察值中观察值子样观察值中
记
>
<
显然0≤≤1作x函数非减左连续函数作x函数具备分布函数求性质称验分布函数(子样分布函数)
验分布函数子样函数子样矩间具列关系:设(x1x2…xn)子样观察值应验分布函数:
2正态母体子样线性函数分布
定理1 设X1…Xn抽正态母体子样统计量U子样确定线性函数
(1)
U正态机变量均值方差分
(2)
(3)
(1)式中特取时行U子样均值
见具X相均值更数学期集中集中程度子样容量n关
定理2 设
(1)X1X2…Xn独立分布机变量服正态分布
(2)矩阵记
Y1…Yp正态机变量均值方差协方差分:
特An×n正交矩阵时Y1Y2…Yp相互独立服分布机变量
3种正态分布N(01)关常分布
1)x2分布
定义 设X1X2…Xn相互独立服N(01)分布机变量
服分布x2分布称度nx2变量
定理 设X1X2相互独立
2)t分布
设XY相互独立称机变量
服分布t分布n称度记T~t(n)
3)F分布
定义 设XY相互独立x2分布机变量度分mn称机变量
服分布F分布(mn)称度通常写F~F(mn)
推 果相互独立分布
推 果X~F(mn)分布1X~F(nm)分布
结 设X1…XmY1…Yn分正态母体中抽取独立子样
服t(m+n-2)分布
***[练] 设X1…Xn正态分布母体中抽取简单子样分表示子样均值子样方差设X1…Xn独立试求统计量
(提示:服t(n1)分布)
4统计量分布独立性
定理 x~N[0I]两幂等二次型时独立
[证明] AB称幂等二次型:
两量零均值量X1X2协方差矩阵
AXBX正态分布机量线性函数服正态分布零协方差矩阵暗示统计独立函数形式独立证明两二次型统计量独立性
[例] 易知
相互独立
5线性变换二次型独立性
定理 标准正态量线性函数Lx幂等二次型LA0时两统计量独立
证明遵循两二次型证明样逻辑写作变量LxAx协方差矩阵LA0证实两机量独立性线性函数二次型独立性立推导
[例]
面两统计量相互独立
总结:设X1X2…Xn正态母体中抽取简单子样记
(1)
(2)
(3)
[证明]
服度n-1t分布
6参数估计常方法
参数估计问题中总首先假设母体X具族分布FF函数形式已知仅包含未知参数记θ支配分布未知参数(量)统计学分布F未知参数θ全部容许值组成集合称参数空间记
F(·θ)表示X分布称集合{F(·θ)θ∈}X分布函数族类似果X连续型机变量概率密度函数族果X离散型机变量概率分布族
参数估计问题求通子样估计母体分布包含未知参数θ
般设母体具分布族{F(·θ)θ∈}X1X2…Xn子样点估计问题求构造统计量T(X1…Xn)作参数θ估计(T维数θ维数相)统计学称Tθ估计量
1)矩方法
设{F(·θ)θ∈}母体X分布族θ(θ1…θk)估计未知参数假定母体分布k阶矩存母体分布v阶矩
1≤v≤k
θ(θ1…θk)函数
子样X(X1…Xn)v阶子样矩
1≤v≤k
现子样矩作母体矩估计令
(1)
样(1)式确定包含k未知参数θ(θ1…θk)k方程式
[例] 母体均值方差矩估计
设X1…Xn子样设母体二阶矩存矩方法方程组
解
母体均值方差矩估计分子样均值子样方差
运前关定理
见作估计真值周围波动均值恰真值性质统计学称偏性
2)似然估计方法
般设母体具分布密度族{F(xθ)θ∈}中θ(θ1θ2…θk)未知k维参数量需估计设(x1…xn)子样(X1…Xn)观察值子样(X1…Xn)落点(x1…xn)邻域里概率
方便起见记
(θ量)作θ函数称θ似然函数
果选取式
(2)
成立作θ估计称θ似然估计
logxx单调函数(2)式等价写:
果开集关θ微满足(4)式解定满足列似然方程
[例] 设X(X1…Xn)取均匀分布
(θ>0)
0<x≤θ
0<
子样试求θ似然估计
时
(注意:条件0<xi≤θi1…n条件0<等价
显然取值θ似然***估计计算出
7估计效性
1)偏估计
定义 般果T(X)未知参数θ估计量满足面关系式
称T(X)θ偏估计
2)效估计
定义 两偏估计量方差方差<称更效
判方式:数情形中较基两估计量协方差矩阵—非负定矩阵更效
3)渐偏估计
果列θ估计满足面关系式
称Tnθ渐偏估计
4)致估计
设X1…Xn取分布族子样TnTn(X1…Xn)θ估计果序列{Tn}机收敛真参数值θ意>0
>
称Tnθ致估计
5)方差偏估计
般T1θ偏估计关θ偏估计T2成立式
≤
称T1θ方差偏估计
6)线性估计
果估计T子样线性函数T表示中a1…an固定常数称T线性估计类似定义果T线性估计满足偏性条件T称线性偏估计果UL表示θ具限方差线性偏估计全体组成集合T0∈UL
≤切
称T0θ方差线性偏估计
高斯—马尔科夫定理
线性偏估计量中二估计量具方差
7)克拉美—劳(CramerRao)界
克拉美—劳(CramerRao)界假定x密度满足定正条件参数θ偏估计量方差等:
量I(θ)样信息数
考虑变量情形θ参数量I(θ)信息矩阵
克拉美—劳定理偏估计量方差矩阵信息矩阵逆[I(θ)]-1
差非负定矩阵中
矩阵逆矩阵[I(θ)]1称CR界CRLB
8假设检验
1)正态母样参数检验
前面介绍两种常参数估计方法实践中提出统计推断问题
先例子
[例] 某厂批产品万件须检验方出厂规定标准次品率超5中意选取50件产品进行检查发现次品4件问批产品否出厂?
例子中事先批产品次品率情况知然频率稳定性说检查50件产品次品率450估计整批产品次品率目前关心问题:根抽样次品率n(450)推断批产品次品率否超5说首先整批产品作种假设:次品率低5然利子样次品率n检验作假设正确性
母体未知分布作假设称统计假设记H0面举例子中统计假设分:H0p(次品率)≤005
母体真分布完全未知参数决定关母体未知分布假设总等价出未知参数种仅涉母体分布中包含未知参数统计假设称
参数假设
假设检验问题首先根实际问题求提出统计假设H0仅第步提出统计假设目求进步推断提出统计假设H0否正确求建立推断统计假设H0方法统计学称判断定统计假设H0方法统计假设检验简称统计检验
果统计问题中仅提出统计假设 目仅仅判断统计假设否成立时研究统计假设类检验问题称显著性检验
显著性检验问题处理般步骤:
(1)建立统计假设H0
(2)构造合适统计量U子样观察值计算出统计量U观察值u
(3)规定显著水α(般取005001)求出H0成立条件PH0{|U|≥u0}≤α满足值u0
(4)较观察值uu0果|u|≥u0拒绝设H0
显然寻找检验统计量U分布少定α找出满足PH0{|U|≥u0α界值u0重进行检验时取子样容量分样样两类问题样显著性检验需出检验统计量U精确分布样问题利U极限分布作似
正态母体参数显著性检验总结表1
表1 正态母体参数显著性检验
检验参数
假设H0
统 计 量
分 布
μ
μμ0(σσ0)
N(01)
μ1μ2(σ1σ2已知)
μμ0σ2>0
t(n-1)
μ1μ2σ1σ2
t(m+n-2)
σ2
σσ0
x2(n-1)
F(m-1n-1)
例1解:
简单起见问题结希利次品率vn检验母体次品率p否满足假设H0pp0(005)
Y记母体元素指标
Y
假设H0成立时P{Y0}1-p0P{Y1}p0EYp0Var(Y)p0(1-p0)设X1…Xn子样
中表示子样中次品数
中心极限定理知道H0(pp0)成立条件
(1)
渐N(01)分布n较时(般30)(1)式决定U似作正态变量处理
现p0005 n50 4代入(1)式
α001查表uα2258时
|u|096<258uα2
拒绝假设H0(p005)
2)正态母体参数置信区间
许实际问题中希通子样观察出范围便范围足够概率(定)包含感兴趣参数统计学称范围置信区间(置信域)类问题称区间估计问题
参数置信区间参数假设检验间着密切联系
直接正态母体参数种检验法构造正态母体参数种置信区间
正态母体参数科置信区间情况总结表2
表2 正态母体参数置信区间
估
参数
条件
置信区间限
置信区间限
应检验统计量
μ
单
子
样
σσ0
σ未知
μ1-μ2
双
子
样
已知σ1σ2数值未知
σ2
单
子
样
双
子
样
3)联合置信域
面讨正态分布均值方差联合置信域
(μσ2)联合置信域运联合分布构造独立果希寻找置信水095置信域找数ac1c2
<<
<<
联合概率
<<<<
解:
<<< (1)
见置信度095联合置信域(1)式括号等式出范围
4)广义似然检验
设X(X1…Xn)母体中抽取子样分布族{f(xθ)θ}中θ(量)未知参数(母体连续型变量时f表示分布密度母体离散型变量时f表示概率分布)求检验假设H0:θ0里应指出θ0时表示集合运t检验法检验假设H0μμ0时里
<<>
>
未知参数集合单点
现引进统计量:
惯称λ(x)广义似然显然子样函数赖未知参数θ
0≤λ(x)≤1
类似似然原理果λ(x)取值较说明H0真时观察样点x概率H0真时观察样点x概率时理怀疑假设H0真广义似然出发该检验问题式成立时拒绝H0
λ(x)≤λ0 (1)
中λ0选取式成立
切 (2)
出检验法称水α广义似然检验θ0单点时写
进步分析样参数假设显著性检验程会发现系列问题解决采取接受拒绝假设H0判断根子样观察值作出子样机变量子样观察值出现带机性判断发生错误发生类型错误发生类错误概率?
犯面两种类型错误:原假设H0真时候θ真实值落中时作出拒绝H0决策a1——称第类错误种错误备选假设真时θ真实值落中时作出接受原假设H0决策a0——称第二类错误(见图1)两类错误造成影响常常样例求检验病否患某种疾病取原假设该患种疾病第二类错误(病作病)造成必药品引起病痛苦济浪费第类错误(病作病)导致死亡
H0真
H1真
接受H0
正 确
第Ⅱ类错误
拒绝H0
第Ⅰ类错误
正 确
图1
然希作出检验犯两种类型错误概率时全零实际子样容量(观察数)定犯两种类型错误概率时控制
文档香网(httpswwwxiangdangnet)户传
《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
该内容是文档的文本内容,更好的格式请下载文档