随机变量的概率分布
列出离散型随机变量X的所有可能取值;列出随机变量取这些值的概率
P(X =x i )=p i 称为离散型随机变量的概率函数
常用的有二项分布、泊松分布、超几何分布等
连续型随机变量可以取某一区间或整个实数轴上的任意一个值
它取任何一个特定的值的概率都等于0,不能列出每一个值及其相应的概率
通常研究它取某一区间值的概率,用概率密度函数的形式和分布函数的形式来描述
用概率密度函数的形式和分布函数的形式来描述
由C.F.高斯(Carl Friedrich Gauss,1777—1855)作为描述误差相对频数分布的模型而提出
描述连续型随机变量的最重要的分布
许多现象都可以由正态分布来描述,可用于近似离散型随机变量的分布(例如: 二项分布),是经典统计推断的基础
随机变量具有均值为0,标准差为1的正态分布
任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布
数据正态性的评估
t 分布是类似正态分布的一种对称分布,通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布
设X~N(μ,σ 2 ),则 z= (X-μ)/σ~N(0,1)
令Y=z 2 ,则 y 服从自由度为1的χ2分布,即Y~χ2(1)
对于n个正态随机变量y 1 ,y 2 ,y n ,则随机变量χ2称为具有n个自由度的χ2分布,记为X~χ2
性质和特点
设若U为服从自由度为n1的χ2分布,即U ~ χ2(n1),V为服从自由度为n2的χ2分布,即V ~ χ2(n2),且U和V相互独立,则
称F为服从自由度n1和n2的F分布,记为 F ~ F(n 1 ,n 2 )
在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布
是一种理论概率分布,推断总体均值μ的理论基础
当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值▔x也服从正态分布,▔x 的期望值为μ,方差为σ2/n。即▔x~N(μ,σ 2 /n)
在重复选取容量为n的样本时,由样本方差的所有可能取值形成的相对频数分布
对于来自正态总体的简单随机样本,则比值
的抽样分布服从自由度为 (n -1) 的χ2分布,即