2.10 密度函数

连续随机变量没有概率质量函数.类似的概念是分布函数的导数,称为密度.

定义2.9 Fx)是可微的,则其密度(density)为.

密度函数也称为概率密度函数(probability density function,PDF).

通常使用小写字母表示密度函数,常用的选择是f.与分布函数类似,fXx)表示随机变量X的密度函数,其中下标表示这是X的密度函数.简写为“Xf”,表示“随机变量X的密度函数为f”.

定理2.3 概率密度函数的性质.函数fx)是密度函数当且仅当

1.对所有的xfx)≥0.

2..

密度是可积且全域积分为1的非负函数.根据微积分基本定理,有

这表明X落在区间[a, b]中的概率是密度函数在[a, b]上的积分,即概率等于密度函数下的面积.

例10 均匀分布.Fx)=x,0≤x≤1,其密度为

其中0≤x≤1,其他为0.该函数是非负的且满足

即满足密度函数的性质.

例11 指数分布.Fx)=1-exp(-x),x≥0.在x≥0上,其密度为

其他为0.该函数是非负的且满足

即满足密度函数的性质.密度函数可用来计算概率.例如,

例12 时薪.图2-7展示了时薪的密度函数.

图2-7 时薪的密度函数

解释密度函数的方法如下.密度fx)相对较高的区域是X发生的可能性相对较大的区域.密度fx)相对较低的区域是X发生的可能性相对较小的区域.密度在尾部下降到零,因为密度函数是可积的.密度函数下的面积是概率.例如,在图2-7中,20<X<30阴影区域的面积为0.24,表示时薪在20美元到30美元的概率是0.24.密度函数在15美元左右有一个单峰,是该分布的众数(mode).

时薪的密度是不对称的.左尾比右尾更陡,右尾比左尾更平缓.这种非对称性称为偏度(skewness).收入和财富分布常常是有偏的,即相对于一般人群,有人以很小,但可能发生的概率获得非常高的薪水.

连续随机变量的支撑为使密度函数为正的值的集合.

定义2.10 连续随机变量的支撑X是包含{xfx0}的最小闭集.