概率论与数理统计 第五章 大数定律及中心极限定理
概率论是研究大量试验后呈现出的统计规律性的一门理论。
数学中研究大量的工具是极限。
因此这一章学习概率论中的极限定理。
随着试验次数的增大,事件的 频率 逐步稳定到事件的 概率 。意味着随着试验次数的增多,在某种收敛意义下,频率的极限是概率。大数定律解释了这一结论。
首先介绍切比雪夫不等式。
随机变量 的取值总是围绕着其期望变动,若 的分布已知时,可以计算事件 的概率。
切比雪夫不等式 :
当随机变量 的分布未知时,可由 的观测数据估计得到 的期望和方差,然后使用切比雪夫不等式估计 关于 的偏离程度。
随机变量序列 即由随机变量构成的一个序列。不能用类似定义数列极限的方式定义随机变量序列的极限,因为序列中的每一个元素 是随机变量,取值不确定,不可能和一个常数c的距离任意小。
只能说某个事件 发生的频率 收敛到 的概率 。
依概率收敛 的定义:
定理2 :
三个大数定律:切比雪夫大数定律、辛钦大数定律和伯努利大数定律。注意这三个大数定律的条件有何异同。
定理3 切比雪夫大数定律 :
若 随机变量序列相互不相关 , 方差存在且一致有上界 ,当n充分大时,随机序列的前n项的算术平均值和自身的期望充分接近几乎总是发生的。
定理4 相互独立同分布的大数定律(辛钦大数定律) :
辛钦大数定律为 算术平均值法则 提供了理论依据。
伯努利大数定律 :
伯努利大数定律是相互独立同分布大数定律的特例,限定分布为两点分布。
伯努利大数定律体现了:随着试验次数的增大,事件的频率逐步稳定到时间的概率,这里的稳定即为依概率收敛。
伯努利大数定律的直观意义:
试验次数足够多,可用频率作为概率的估计。
三个大数定律的条件是不同的,它们的条件关系如图所示。
大数定律在实际中有许多重要应用,除了算术平均值法则、用频率估计概率,还有数理统计中参数的点估计思想等。
自然界中有许多随机现象可以用正态分布或近似正态分布来描述,这是为何?中心极限定理揭示了其中的奥秘。
中心极限定理是 相互独立的随机变量之和用正态分布近似 的一类定理。首先介绍最为著名的相互独立同分布情形下的中心极限定理,又称为 列维-林德伯格中心定理 。
**定理1 列维-林德伯格中心极限定理(相互独立同分布)
定理的条件要求随机变量相互独立并且服从同一分布。
还有更为一般的结论:只要随机变量相互独立,每个随机变量对和的影响都是微笑的,哪怕它们的分布类型不同,其和标准化后都有标准正态的极限分不。
中心极限定理的直观意义:
中心极限定理在实际应用中有如下三种形式:
定理2 (棣莫弗-拉普拉斯中心极限定理) :二项分布的正态近似。
中心极限定理的结论更为细致:
中心极限定理是随机变量和的分布收敛到正态分布的一类定理。不同的中心极限定理的差异就在于对随机变量序列做出了不同的假设。
大数定律是保险业保险费计算的科学理论基础。当承保标的数量足够大时,由切比雪夫大数定律知,被保险人缴纳的纯保费与其能获得赔款的期望值是相等的。