概率分布F(x)和概率密度f(x)
从数学上看,分布函数F(x)=P(X<x),表示随机变量X的值小于x的概率。这个意义很容易理解。概率密度f(x)是F(x)在x处的关于x的一阶导数,即变化率。如果在某一x附近取非常小的一个邻域Δx,那么,随机变量X落在(x, x+Δx)内的概率约为f(x)Δx,即P(x<X<x+Δx)≈f(x)Δx。换句话说,概率密度f(x)是X落在x处“单位宽度”内的概率。“密
度”一词可以由此理解。
假设有一元随机变量X,如果X是连续随机变量,那么可以定义它的概率
密度函数(probability density function, PDF) f(x),有时成为密度函数。
我们用PDF在某一区间上的积分来刻画随机变量落在这个区间中的概率,即
如果X是离散型随机变量,那么可以定义它的 概率质量函数(probability mass function, PMF)pX(x)。概率质量函数 (Probability Mass Function,PMF)是离散随机变量在各特定取值上的概率。 即,它本身就是一个概率值**。
与连续型随机变量不同,这里的PMF其实就是高中所学的离散型随机变量的分布律,即
两张图一对比,你就会发现,如果用右图中的面积来表示概率,利用图形就能很清楚的看出,哪些取值的概率更大!所以,我们在表示连续型随机变量的概率时,用f(x)概率密度函数来表示,是非常好的!
但是,可能读者会有这样的问题:
Q:概率密度函数在某一点的值有什么意义?
A:比较容易理解的意义,某点的 概率密度函数 即为 概率在该点的变化率(或导数)。很容易误以为 该点概率密度值 为 概率值.
比如: 距离(概率)和速度(概率密度)的关系.
某一点的速度, 不能以为是某一点的距离
没意义,因为距离是从XX到XX的概念
所以, 概率也需要有个区间.
这个区间可以是x的邻域(可以无限趋近于0)。对x邻域内的f(x)进行积分,可以求得这个邻域的面积,就代表了这个邻域所代表这个事件发生的概率。
而不管X是什么类型(连续/离散/其他)的随机变量,都可以定义它的 累积分布函数(cumulative distribution function ,CDF) FX(x),有时简称为 分布函数 。
,那么分布函数CDF(FX(x))就是密度函数PDF(fX(t))的积分,PDF就是CDF的导数。
对于离散型随机变量,其CDF是阶梯状的分段函数,比如举例中的掷硬币随机变量,它的CDF如下
正态分布是重要的概率分布。它的概率密度函数是:
随着参数μ和δ变化,概率分布也产生变化。
随机变量X的n阶 矩 是X的n次方的 期望值 ,即
对概率密度函数作 类似傅利叶变换 可得 特征函数 。
2024-08-26 广告