概率分布的概率分布
事件的概率表示了一次试验某一个结果发生的可能性大小。若要全面了解试验,则必须知道试验的全部可能结果及各种可能结果发生的概率,即必须知道随机试验的概率分布(probability distribution)。为了深入研究随机试验,我们先引入随机变量(random variable)的概念。 作一次试验,其结果有多种可能。每一种可能结果都可用一个数来表示,把这些数作为变量x的取值范围,则试验结果可用变量x来表示。
【例4.3】对100头病畜用某种药物进行治疗,其可能结果是“0头治愈”、 “1头治愈”、“2头治愈”、“…”、“100头治愈”。若用x表示治愈头数,则x的取值为0、1、2、…、100。
【例4.4】孵化一枚种蛋可能结果只有两种,即“孵出小鸡”与“未孵出小鸡”。若用变量x表示试验的两种结果,则可令x=0表示“未孵出小鸡”,x=1表示“孵出小鸡”。
【例4.5】测定某品种猪初生重,表示测定结果的变量x所取的值为一个特定范围(a,b),如0.5―1.5kg,x值可以是这个范围内的任何实数。
如果表示试验结果的变量x,其可能取值至多为可列个,且以各种确定的概率取这些不同的值,则称x为离散型随机变量(discrete random variable);如果表示试验结果的变量x,其可能取值为某范围内的任何数值,且x在其取值范围内的任一区间中取值时,其概率是确定的,则称x为连续型随机变量(continuous random variable)。引入随机变量的概念后,对随机试验的概率分布的研究就转为对随机变量概率分布的研究了。 离散型随机变量概率分布
要了解离散型随机变量x的统计规律,就必须知道它的一切可能值xi及取每种可能值的概率pi。
如果我们将离散型随机变量x的一切可能取值xi(i=1,2,…),及其对应的概率pi,记作
P(x=xi)=pii=1,2,… (4—3)
则称(4—3)式为离散型随机变量x的概率分布或分布。常用分布列(distribution series)来表示离散型随机变量:
x1 x2… xn …。
p1 p2… pn …
显然离散型随机变量的概率分布具有pi≥0和Σpi=1这两个基本性质。 连续型随机变量概率分布
连续型随机变量(如体长、体重、蛋重)的概率分布不能用分布列来表示,因为其可能取的值是不可数的。我们改用随机变量x在某个区间内取值的概率P(a≤x<b)来表示。下面通过频率分布密度曲线予以说明。
由表2—7作126头基础母羊体重资料的频率分布直方图,见图4—1,图中纵坐标取频率与组距的比值。可以设想,如果样本取得越来越大(n→+∞),组分得越来越细(i→0),某一范围内的频率将趋近于一个稳定值──概率。这时,频率分布直方图各个直方上端中点的联线──频率分布折线将逐渐趋向于一条曲线,换句话说,当n→+∞、i→0时,频率分布折线的极限是一条稳定的函数曲线。对于样本是取自连续型随机变量的情况,这条函数曲线将是光滑的。这条曲线排除了抽样和测量的误差,完全反映了基础母羊体重的变动规律。这条曲线叫概率分布密度曲线,相应的函数叫概率分布密度函数。若记体重概率分布密度函数为f(x),则x取值于区间[a,b)的概率为图中阴影部分的面积,即 图4-1表2-7资料的分布曲线 (4—4)式为连续型随机变量x在区间[a,b)上取值概率的表达式。可见,连续型随机变量的概率由概率分布密度函数确定。此外,连续型随机变量概率分布还具有以下性质:
1.分布密度函数总是大于或等于0,即f(x)≥0
2.当随机变量x取某一特定值时,其概率等于0
3.在一次试验中随机变量x之取值必在-∞<x<+∞范围内,为一必然事件。
2024-11-13 广告