随机变量

随机变量是一种数学概念，用来表示随机试验结果的变量。

简介

随机变量通常用大写字母 $X$ 、 $Y$ 表示。在各种随机试验中，每一个随机事件都可以用一个变量代替任何一个数值。例如掷骰子时掷出的点数是1,2,..,6中的一个，其中的任意一个点数都可以用变量 $X$ 来表示， $X$ 可以=1，=2....=6，又例如在产品的抽查中，抽到正品可以用“ $X$ =1”来表示，抽到次品可以用“ $X$ =0”来表示，这样 $X$ 又可以=1也可以=0。^[1]，随机变量实质上是函数。称其为变量是指可作为因变量。

正式定义

随机变量的定义 — $X:S\to \mathbb {R}$ 是一个定义在样本空间 $S$ 上的实函数，而 ${\mathcal {E))\subseteq {\mathcal {P))(S)$ 为 $S$ 的某事件族，若对任意实数 $r\in \mathbb {R}$ ，有：

\{s\in S\,|\,X(s)\leq r\}\in {\mathcal {E))

（也就是说，

X(s)\leq r

必为一个事件）

则称函数 $X$ 为一个（在 ${\mathcal {E))$ 的意义下）定义在 $S$ 上的随机变量。

直观上，随机变量为一种特殊的实函数，其值不大于某数的状况都是事件。所以一个函数是不是随机变量也跟“怎样的子集合算事件”有密不可分的关系。

如果随机变量 $X$ 的取值是有限的或者是可数无穷尽的值：

X(S)=\{x_{1},x_{2},x_{3},\ldots ,\}\cong \mathbb {N}

则称 $X$ 为离散随机变量。如果 $X$ 的取值遍布一区间甚至是整个数线：（ $a,\,b\in \mathbb {R}$ ）

X(S)=[a,\,b]

则称 $X$ 为连续随机变量。

与可测函数的关系

如果取 ${\mathcal {I))$ 为所有实开区间所构成的集合：

{\mathcal {I))={\bigg \{}A\in {\mathcal {P))(\mathbb {R} )\,{\bigg |}\,(\exists a)(\exists b)\left[\,(a,\,b\in \mathbb {R} )\wedge (A=(a,\,b))\,\right]{\bigg \))

则可以把博雷尔代数 ${\mathcal {B))$ 定义为包含 ${\mathcal {I))$ 的最小Σ-代数：

{\mathcal {B)):=\sigma ({\mathcal {I)))=\bigcap {\bigg \{}\Sigma \,{\bigg |}\,(\Sigma {\text{ is a sigma algebra.)))\wedge ({\mathcal {I))\subseteq \Sigma ){\bigg \))

则根据阿基米德性质，对任意实数 $r\in \mathbb {R}$ ， $(-\infty ,\,r]\in {\mathcal {B))$ ，有以下的关系：

{\displaystyle (r,\,\infty )=\bigcup \left\{A\in {\mathcal {I))\,{\bigg |}\,(\exists n\in \mathbb {N} )\left[A=(r,\,n)\right]\right\))

(-\infty ,\,r]=\mathbb {R} -(r,\,\infty )

反之，也可以用类似的方法，由任意的 $(-\infty ,\,r]$ ，透过并集和补集组合出 $(a,\,b)$ ：

{\displaystyle (-\infty ,\,b)=\bigcup \left\{A\in {\mathcal {P))(\mathbb {R} )\,{\bigg |}\,(\exists n\in \mathbb {N} )\left[A=(-\infty ,\,b-{\frac {1}{n))]\right]\right\))

(a,\,b)=\left(\mathbb {R} -(-\infty ,\,a]\right)\cup (-\infty ,b)

这样的话，任意的 $r\in \mathbb {R}$ 都有 $\{s\in S\,|\,X(s)\leq r\}\in {\mathcal {E))$ ，等价于对任意的 $a,\,b\in \mathbb {R}$ 都有 $\{s\in S\,|\,a<X(s)<b\}\in {\mathcal {E))$ ，这样根据可测函数性质的定理(2)，上小节定义的 $X$ ，就是一个 ${\mathcal {E))$ - ${\mathcal {B))$ 可测函数，换句话说，随机变量是可测函数的一种特例。

示例

随机掷两个骰子，整个样本空间由36个元素组成：

{\displaystyle S=\left\{(i,j)\in \mathbb {N} ^{2}|(i\leq 6)\wedge (j\leq 6)\right\))

然后可以简单地把 $S$ 的任意子集合都视为事件，换句话说，把事件族 ${\mathcal {E))$ 取成 $S$ 的幂集：

{\mathcal {E))={\mathcal {P))(S)

这样的话，可以构造出许多定义在 $S$ 上的随机变量，比如 $X$ 可以定义为“两个骰子的点数和”；者 $Y$ 可以定义为“两个骰子的点数差”：

X(i,j):=i+j

Y(i,j):=|i-j|

因为“两个骰子的点数和不大于 $r$ ”和“两个骰子的点数差不大于 $r$ ”的样本点所构成的集合，都是 $S$ 的子集合，所以 $X$ 和 $Y$ 都是（在 ${\mathcal {E))={\mathcal {P))(S)$ 的意义下）定义在 $S$ 上的随机变量，而且它们都是离散随机变量。

性质

不确定性

随机变量在不同的条件下由于偶然因素影响，其可能取各种随机变量不同的值，具有不确定性和随机性，但这些取值落在某个范围的概率是一定的，此种变量称为随机变量。随机变量可以是离散型的，也可以是连续型的。如分析测试中的测定值就是一个以概率取值的随机变量，被测定量的取值可能在某一范围内随机变化，具体取什么值在测定之前是无法确定的，但测定的结果是确定的，多次重复测定所得到的测定值具有统计规律性。随机变量与模糊变量的不确定性的本质差别在于，后者的测定结果仍具有不确定性，即模糊性。

基本类型

简单地说，随机变量是指随机事件的数量表现。某地若干名男性健康成人中，每人血红蛋白量的测定值；等等。另有一些现象并不直接表现为数量，例如人口的男女性别、试验结果的阳性或阴性等，但我们可以规定男性为1，女性为0，则非数量标志也可以用数量来表示。这些例子中所提到的量，尽管它们的具体内容是各式各样的，但从数学观点来看，它们表现了同一种情况，这就是每个变量都可以随机地获取不同的数值，而在进行试验或测量之前，我们要预言这个变量将获取某个确定的数值是不可能的。按照随机变量可能获取的值，可以把它们分为两种基本类型：

离散型随机变量

即在一定区间内变量取值为有限个，或数值可以一一列举出来。例如某地区某年人口的出生数、死亡数，某药治疗某病病人的有效数、无效数等

连续型随机变量

即在一定区间内变量取值有无限个，或数值无法一一列举出来。例如某地区男性健康成人的身长值、体重值，一批传染性肝炎患者的血清转氨酶测定值等。

详细分析

表示方法

随机试验结果的量的表示。例如掷一颗骰子出现的点数，电话交换台在一定时间内收到的调用次数，随机抽查的一个人的身高，悬浮在液体中的微粒沿某一方向的位移，等等，都是随机变量的实例。一个随机试验的可能结果（称为基本事件）的全体组成一个基本空间 $\Omega$ （见概率）。随机变量 $X$ 是定义于 $\Omega$ 上的函数，即对每一基本事件 $\omega \in \Omega$ ，有一数值 $X(\omega )$ 与之对应。以掷一颗骰子的随机试验为例，它的所有可能结果，共6个，分别记作 ${\displaystyle \omega _{1))$ , ${\displaystyle \omega _{2))$ , ${\displaystyle \omega _{3))$ , ${\displaystyle \omega _{4))$ , ${\displaystyle \omega _{5))$ , ${\displaystyle \omega _{6))$ ，这时， ${\displaystyle \Omega =\{\omega _{1},\omega _{2},\omega _{3},\omega _{4},\omega _{5},\omega _{6}\))$ ，而出现的点数这个随机变量 $X$ ，就是 $\Omega$ 上的函数 $X(\omega k)=k$ ， $k=1,2,\ldots ,6$ 。又如设 ${\displaystyle \Omega =\{\omega _{1},\omega _{2},\ldots ,\omega _{n}\))$ 是要进行抽查的 $n$ 个人的全体，那么随意抽查其中一人的身高和体重，就构成两个随机变量 $X$ 和 $Y$ ，它们分别是 $\Omega$ 上的函数： $X(\omega k)=$ “ $\omega k$ 的身高”， $Y(\omega k)=$ “ $\omega k$ 的体重”， $k=1,2,\ldots ,n$ 。一般说来，一个随机变量所取的值可以是离散的（如掷一颗骰子的点数只取1到6的整数，电话台收到的调用次数只取非负整数），也可以充满一个数值区间，或整个实数轴（如液体中悬浮的微粒沿某一方向的位移）。

研究方法

在研究随机变量的性质时，确定和计算它取某个数值或落入某个数值区间内的概率是特别重要的。因此，随机变量取某个数值或落入某个数值区间这样的基本事件的集合，应当属于所考虑的事件域。根据这样的直观想法，利用概率论公理化的语言，取实数值的随机变量的数学定义可确切地表述如下：概率空间 $(\Omega ,F,p)$ 上的随机变量 $X$ 是定义于 $\Omega$ 上的实值可测函数，即对任意 $\omega \in \Omega$ ， $X(\omega )$ 为实数，且对任意实数 $x$ ，使 $X(\omega )\leq x$ 的一切 $\omega$ 组成的 $\Omega$ 的子集 ${\displaystyle \{\omega :X(\omega )\leq x\))$ 是事件，也即是 $F$ 中的元素。事件 ${\displaystyle \{\omega :X(\omega )\leq x\))$ 常简记作 ${\displaystyle \{X\leq x\))$ ，并称函数 $F(x)=p(X\leq x)$ ， $-\infty <x<\infty$ ，为 $X$ 的分布函数。设 $X$ , $Y$ 是概率空间 $(\Omega ,F,p)$ 上的两个随机变量，如果除去一个零概率事件外， $X(\omega )$ 与 $Y(\omega )$ 相同，则称 $X=Y$ 以概率1成立，也记作 $p(X=Y)=1$ 或 $X=Y$ ,α.s.（α.s.意即几乎必然）。

有些随机现象需要同时用多个随机变量来描述。例如对地面目标射击，弹着点的位置需要两个坐标才能确定，因此研究它要同时考虑两个随机变量，一般称同一概率空间 $(\Omega ,F,p)$ 上的 $n$ 个随机变量构成的 $n$ 维向量 $X=(x_{1},x_{2},\ldots ,x_{n})$ 为 $n$ 维随机向量。随机变量可以看作一维随机向量。称 $n$ 元 ${\displaystyle x_{1},x_{2},\ldots ,x_{n))$ 的函数为 $X$ 的（联合）分布函数。又如果 $(x_{1},x_{2})$ 为二维随机向量，则称 $x_{1}+ix_{2}(i^{2}=-1)$ 为复随机变量。随机变量的独立性　独立性是概率论所独有的一个重要概念。设 ${\displaystyle x_{1},x_{2},\ldots ,x_{n))$ 是 $n$ 个随机变量，如果对任何 $n$ 个实数 ${\displaystyle x_{1},x_{2},\ldots ,x_{n))$ 都有即它们的联合分布函数 $F(x_{1},x_{2},\ldots ,x_{n})$ 等于它们各自的分布函数 $F1(x_{1}),F2(x_{2}),\ldots ,Fn(x_{n})$ 的乘积。则称 ${\displaystyle x_{1},x_{2},\ldots ,x_{n))$ 是独立的。这一定义可以直接推广到每一 $xk$ （ $k=1,2,\ldots ,n$ ）是随机向量的情形。独立性的直观意义是： ${\displaystyle x_{1},x_{2},\ldots ,x_{n))$ 中的任何一个取值的概率规律，并不随其中的其他随机变量取什么值而改变。在实际问题中通常用它来表征多个独立操作的随机试验结果或多种有独立来源的随机因素的概率特性，因此它对于概率统计的应用是十分重要的。

从随机变量（或向量） ${\displaystyle x_{1},x_{2},\ldots ,x_{n))$ 的独立性还可以推出：设 $Bk$ 是 $xk$ 取值的空间中的任意波莱尔集， $k=1,2,\ldots ,n$ 。设 ${\displaystyle x_{1},x_{2},\ldots ,x_{n))$ 是独立的，则它们中的任意个都是独立的。但逆之即使其中任何 $n-1$ 个是独立的，也不保证 ${\displaystyle x_{1},x_{2},\ldots ,x_{n))$ 是独立的。又如果 $fj(x),i=1,2,\ldots ,n$ ，是 $n$ 个连续函数或初等函数(或更一般的波莱尔可测函数)，则从 ${\displaystyle x_{1},x_{2},\ldots ,x_{n))$ 的独立性可推出 $f1(x_{1}),f2(x_{2}),\ldots ,fn(x_{n})$ 也独立。如果随机变量(随机向量)序列 $x_{1},x_{2},\ldots ,x_{n},\ldots$ 中任何有限个都独立，则称之为独立随机变量（随机向量）序列。关于随机变量的矩、特征函数、母函数及半不变量，分别见数学期望、方差、矩及概率分布。