概率论基础

1、概率基础知识

1.1 引言

先做两个简单的试验：
试验1：一个盒子中有十个完全相同的白球，从中任意摸出一个；
试验2：盒子中有十个完全相同的球，其中五个白球，五个红球。

对于试验1，在球没有取出之前，我们就能确定取出的必定是白球。这种试验，根据试验开始的条件应可以确定实验的结果。
而对于试验2，在球没有取出之前，我们从试验开始时的条件不能确定试验的结果(即取出的是白球还是黑球)，也就是说一次试验的结果在试验之前是无法确定的。
对于后一种试验，似乎没有什么规律可言，但是，实践告诉我们，若从盒子中反复多次取球(每次取出一球，记录其颜后放回)，那么可以观察到这样的事实：试验次数n相当大时，出现白球的次数n白和出现黑球的次数n红是很接近的，其比值n白/n红会逐渐稳定于?，这个事实是可以理解的，因为盒子里的白球数等于红球数，从中任意摸出一个，取得白球或红球的"机会"应该是平等的。
于是，我们面对着两种类型的试验。试验1代表的类型在试验之前就能断定它的结果，这种试验所对应的现象叫确定现象。
比如："早晨，太阳从东方升起"
"边长为a,b的矩形，其面积为ab"
…
过去我们所学的各门课程基本上都是用来处理和研究这类确定现象的。
试验2所代表的类型，它有多于一种可能的结果，但在一次试验之前会出现那种结果，应一次试验而言，没有规律可言，但是?quot;大数次"的重复这个试验，试验结果又遵循某些规律(这些规律我们称之为"统计规律")，这类试验叫做随机试验。其代表的现象叫随机现象。
比如："某地区的年降雨量"
"打靶时弹着点离靶心的距离"
"电话交换台单位时间内收到的用户的呼唤次数"
…
概率论和数理统计就是研究随机现象的统计规律的数学分科。

1.2 随机事件与样本空间

我们在前面已经介绍了随机试验，现在再进一步明确其含义。
一个试验如果满足下述条件：
(1) 试验可以在相同条件下重复进行
(2) 试验的所有结果是明确知道的，并且不止一个
(3) 每次试验总是出现一个可能的结果，但在一次试验之前却不能确定会出现哪一个结果
则称这样的试验是一个随机试验。简称试验。
随机试验的每一个可能的结果，称为基本事件(样本点)。它们的全体称作样本空间。用Ω表示。Ω中的点(基本事件或称样本点)常用ω表示。
例如，
在前面的试验2中：ω1={取得白球}，ω2={取得红球}，则Ω={ω1、ω2}
测量某地水温，令t={测得的水温猼℃},则Ω={1,2，…100}
一个盒子中有十个完全相同的球，分别标以号码1,2，…，10，从中任取一球。令i={取得的球的号码为i},则Ω={1,2，3,4，5,6，7,8，9,10}

在随机试验中，有时我们更加关心带有某些特征的事件是否发生。(比如在购买时，是否中奖，是否摸出红球等等)
在随机试验中，我们可以研究
A={球的号码为6}
B={球的号码为偶数}
C={球的号码小于等于5}
这些事件是否发生。其中A是一个基本事件，而B和C都是由多个基本事件组成的，称为复杂事件。无论是基本事件，还是复杂事件都叫随机事件。简称事件。
习惯上用大定字母A，B，C,…表示事件。
在试验中，若出现A中包含的基本事件ω，则称作A发生。并记作ω�A
Ω表示全体基本事件，而随机事件是由具有某些特征的基本事件所组成，所以从集合论的观点看，一个随机事件不过是样本空间中的一个子集。
Ω是由所有基本事件组成的。因而在任一次试验中，必然要出现Ω中的一个基本事件ω，即ω�A，也就是说在试验中Ω必然会发生。所以用Ω表示一个必然事件。另外，Φ用来表示不可能事件。

事件的关系与运算：
1．如果事件A发生必然导致事件B发生，则称B包含A。记作AB
2．如果有AB和BA同时成立，则称事件A与事件B相等。记作A=B
3． "事件A与事件B中至少有一个发生"这样的事件称作事件A与事件B的和(并)。记作A+B
4． "事件A与事件B同时发生"这样的事件称作事件A与事件B的积(交)。记作AB
5． "事件A发生而B不发生"这样的事件称为A与B的差。记作A-B
6．若事件A、B不能同时发生，即AB=Φ，则称A与B是互不相容事件(互斥事件)
7．若A是一事件，令=Ω-A，则称是A的对立事件(逆事件)。即A与中必有一个发生，但不会同时发生。

例：设A、B、C是Ω中的随机事件。则
事件"A与B发生，C不发生"可表示为：
事件"三个事件中到少有两个发生"可表示为：AB+BC+CA
事件"三个事件中恰好有二个发生"可表示为：
事件"三个事件中有不多于一个事件发生“"可表示为：
应注意的是其表示方法并不唯一!

运算规律：
交换律 A+B=B+A AB=BA
结合律 A+(B+C)=(A+B)+C (AB)C=A(BC)
分配律 (A+B)C=AC+BC

例：袋中有十个完全相同的球，分别标以1到10的号码，从中任取一球，设
A={取得球的号码是偶数}
B= {取得球的号码是奇数}
C= {取得球的号码小于5}
问下述运算分别表示什么事件：
(1) A+B 必然事件(取得的球的号码是偶数或是奇数)
(2) AB 不可能事件(取得的球的号码既是偶数以是奇数)
(3) AC 取得的球的号码为2或4
(4) 取得的球的号码为5或7或9
(5) 取得的球的号码为6或8或10

1.3 概率与频率

在试验2中，我们已经知道它是一个随机试验，并且样本空间则Ω={ω1、ω2}，其中ω1={取得白球}，ω2={取得红球}是基本事件。虽然在一次试验中不能肯定是ω1或ω2发生，但是我们可以问在一次试验中某个事件(比如ω1)发生的可能性是多大？由对称性，很自然地可以推定在一次试验中ω1出现的可能性是0.5，因为我们已经知道盒子中白球和红球的数量相同，都是5个。
下面给出概率的定义。
定义：随机事件A发生可能性大小的度量(数量)称为A发生的概率。记作P(A)
对于一个随机事件来说，它发生的可能性大小的度量是由它自身决定的。是客观存在的。就好象是一根木棒有长度，一块土地有面积一样。概率是随机事件发生可能性大小的度量，是随机事件自身的属性。
一个根本的问题是：如何出一个给定的随机事件发生可能性大小的度量----概率？
在试验2中，因为知道了盒子中的白球数等于红球数，都是5个，才推定P(ω1)=0.5。如果不知道盒子中的白球数和红球的数量呢？实践告诉我们，若反复多次地从盒子中取球(取后放回)，随着试验次数的增大，比值n白/n会稳定在1/2附近。
称比值n白/n为事件ω1在n次试验中出现的频率。
频率当然在一定程度上反映了ω1发生的可能性的大小。尽管每作一串(n次)试验所得的频率可能各不相同，但是只要n相当大，和P(ω1)会非常"靠近"的。
因此概率是可以通过频率来"测量"的，或者说频率是概率的一个近似。如前面说的试验2，即使事先不知道盒子中的白球数和红球数，经过反复多次的试验后，如果频率稳定在0.5附近，那么就可以断定盒子中的白球数和红球数相等，进一步得到P(ω1)=0.5
类似的试验很多。如蒲丰(Buffon)和皮尔逊(Pearson)曾分别投掷一枚质地均匀对称的硬币，其结果如下表。

试验者	次数	出现正面的次数	频率
蒲丰	4040	2048	0.5069
皮尔逊	12700	6019	0.5016
皮尔逊	24000	12012	0.5006

那么，如何看待频率与概率的关系呢？举例来说，给出一要木棒，谁都不怀疑它自身具有"客观的"长度。长度是多少？我们可以用尺或其它手段来测量，无论尺或仪器多么精密，测得的数值多少带有误差，而且每次测量的值可以有差异。但测得的值是稳定在要棒"真实"长度值附近的。事实上，人们也是把测得的值当做是要棒的真实长度(这个类比不仅帮助我们去理解概率与频率之间的关系，而且还揭示了更深刻的事实：概率与长度、面积等变量一样应具有"测度"的性质)。因此在实际应用中，当试验次数足够多时，常用事件A的频率来代替其概率。由频率出发所定义的A的概率常称为统计概率。
统计概率指出，任一事件A的概率P(A)是存在的。在实际问题中，即使P(A)不知为何值，但可取事件A出现的频率作为它的近似值。这是统计概率的长处。但它也有不足之处。当我们取频率为近似值时，并不能肯定试验的次数该取多少为好，因为我们没有理由认为N+1次试验比N次试验所行的频率更逼近所求的概率。而且当试验次数增多时，很难保证试验的条件完全一样。例如在掷硬币试验中，很难保证每次抛出的角度，高度等等条件都是一样的。
那么有什么方法来确定事件的概率吗？

1.4 古典概型

对于一个事件A，如何寻求它的概率P(A)是概率论的一个基本课题。让我们首先讨论一类最简单的随机试验，它具有如下特征：
(1) 样本空间的元素(即基本事件或样本点)只有有限个。
不妨设为n个。记作ω1，ω2，…ωn 且两两互不相容(即ωiωj=Φ)。
(2)每个基本事件的发生是等可能的。即
P(ω1)=P(ω2)=…=P(ωn)=1/n
这种等可能的数学模型曾经是概率论发展初期的主要研究对象，现在就称这种数学模型为古典概型。它在概率论中有很重要的地位。一方面，因为它比较简单，许多概念既直观又容易理解，另一方面，它以概括了许多实际问题，有很广泛的应用，如前面所说的试验2及掷硬币都是古典概型。

对于古典概型，样本空间为对任一个随机事件A，若A是k个基本事件的和，则

例1：在盒子中有十个相同的球，分别标以号码1,2，…，10，从中任取一球，求此球的号码为偶数的概率。
解1：令i={所取球的号码为i} ,则Ω={1,2，3,4，5,6，7,8，9,10}
所以样本空间总数为10。设A={所取球的号码为偶数}
则A={2,4，6,8，10}。所以A中含有的基本事件数为5。从而
P(A)=5/10=1/2
解2：设A={所取球的号码为偶数}，则 ={所取球的号码为奇数}
则样本空间Ω={A，}。由等可能性即得P(A)=1/2

例2：一套五卷的选集随机地放在书架上，求各册自左至右或自右至左恰好成12345顺序的概率
解：设A={自左至右或自右至左恰好成12345顺序}，显然A中含有的基本事件数(对A有利的基本事件数)为2
基本事件总数为5!=120
P(A)=1/60
例3：一批产品共100件，其中次品有3件，今从这批产品中接连抽取两次，每次抽取一件，(1)不放回抽样：第一次取1件不放回，第二次再抽一件。(2)放回抽样：第一次取1件检查后放回，第二次再抽一件。求第一次抽到正品，第二次抽到次品的概率
解：(1)不放回抽样。
设A={第一次抽到正品，第二次抽到次品}
样本空间总数：100×99 (注意是排列，不是组合)
A中所含基本事件数：97×3
所以 P(A)=97/3300
(2)放回抽样。
设A={第一次抽到正品，第二次抽到次品}
样本空间总数：100×100
A中所含基本事件数：97×3
所以 P(A)=291/10000
例4：(分房问题)设有n个人，每个人都等可能地被分配到N个房间中的任意一间去住(n≤N)。求下列事件的概率：
(1) 指定的n个房间各有一人住
(2) 恰有n个房间其中各住一人
解：因为第个人有N个房间可供选择，所以n个人住的方式共有Nn种(基本事件总数)。它们是等可能的。
在(1)中，指定的n个房间各有一人住，其中所含的基本事件数为：n! ，所以P=n!/Nn
在(2)中，n个房间可在N个房间中任意选取，其总数有，对选定的n个房间有n!种分配方式，所以恰好有n个房间其中各住一人的概率为

"分房问题"是个非常有用的问题。例如，如果将"人"理解为"粒子"，"房间"理解为粒子所处的能级(能量状态)，那么"分房问题"所描述的模型就是统计物理学中的麦克斯威-波尔兹曼统计。如果这n 个"人"(粒子)是不可分辨的，那么上述模型即对应于玻-爱因斯坦统计。若粒子不分辨，且每个"房间"最我只能放一个"粒子"，这时就是费米-狄拉克统计。这三种统计在物理学中有各自的适用范围。
例5：(生日问题)某班级有n个人(n≤365)，问至少有二人的生日相同的概率是多少？
解：假定一年按365天计算。把365天当作365个房间，那么就可用上例的结果。这时"n个人的生日全不相同"就相当于"恰有n个房间其中各住一人"
令A={n个人中至少有二个人的生日相同}，则：={n个人的生日全不相同}
由上例结果知 P()=
于是，P(A)=1- P()=1- (N=365)
在此例中，如果直接计算P(A)则会很麻烦，而利用对立事件求解就简单多了。这是概率计算中常用的手段。
注意下列表格给出的不同人数所对应的概率值，当班级中人数为23时，就有半数以上的班级会发生"至少有二人的生日相同"这一事件，而当人数达到50时，其发生的概率竟达到97%，这比实际想象中的数值要大得多。

n	10	20	23	30	40	50
P(A)	0.12	0.41	0.51	0.71	0.89	0.97

古典概型具有三条基本性质：
1．非负性：对任一事件A，有P(A)≥0
2．规范性：对必然事件Ω，有P(Ω)=1
3．有限可加性：若事件A1，A2，…，An两两互不相容，则P(A1+A2+...+An)=P(A1)+P(A2)+...+P(An)

一般地，对任意事件A，有以下结论成立：
a) 0≤P(A)≤1 P(Φ)=0 P(Ω)=1
b) P(A)=1-P()
c) 有限可加性：若事件A1，A2，…，An两两互不相容，则P(A1+A2+...+An)=P(A1)+P(A2)+...+P(An) (可推广为无限(可列)可加)
d) 若B A，则P(A-B)=P(A)-P(B)；P(A)≥P(B)
e) P(A+B)=P(A)+P(B)-P(AB)；P(A+B)≤P(A)+P(B)

1.5 条件概率与事件的独立性

在实际问题中，除了要知道事件A的概率P(A)以外，通常还要知道在某个特定事件B发生的条件下，事件A发生的概率，这种在B发生的条件下A发生的概率被称为条件概率。记作P(A|B)。
如，"你要能考60分，我就能考100分"
"你喝了这杯，我就把这瓶喝了"
…
定义：如果A，B是两个随机事件，且P(B)>0，在事件B发生的条件下，事件A发生的条件概率P(A|B)定义为

由此定义知，对任意两个事件A，B，若P(B)>0，则P(AB)=P(B)P(A|B) 或 P(AB)=P(A)P(B|A) 此公式称为乘法公式。
应注意到P(AB)与P(A|B)之间的差别：P(AB)为A与B同时发生的概率，即A与B都已发生；而P(A|B)表示的是在B发生的条件下A发生的概率值。此时B尚未发生!

例1：在50件产品中，有一等品45件，二等品2件，废品3件。现从这50件产品中任意抽取一件，每件是否被抽到是等可能的。问：(1)抽到的是废品的概率为多少？(2)已知抽到的是非一等品，那么是废品的概率以是多少？
解：设A={抽以废品} B={抽到非一等品}，显然
P(A)=3/50=0.06 P(B)=5/50=0.1 P(AB)=P(A)=3/50=0.06
所以 P(A|B)=3/5=0.6
例2：甲、乙两城市都位于长江下游，根据一百余年来的气象记录，知道甲、乙两城市一年中雨天分别占20%和18%，而两地同时下雨占12%。问：
(1) 乙市下雨，甲市也下雨的概率是多少
(2) 甲市下雨，乙市也下雨的概率是多少
(3) 甲、乙两市中到少有一个下雨的概率是多少
解：设A={甲市下雨}，B={乙市下雨}，根据题意知：
P(A)=0.20 P(B)=0.18 P(AB)=0.12
则：P(A|B)=P(AB)/P(B)=0.12/0.18=0.67
P(B|A)=P(AB)/P(A)=0.12/0.20=0.60
P(A+B)=P(A)+P(B)-P(AB)=0.20+0.18-0.12=0.26

下面介绍全概率公式。
例3：一袋中有8只白球，2只黑球。依次作不放回抽球两次，问第二次抽到的是黑球的概率为多少？
解：设A={第一次抽到黑球} B=={第二次抽到黑球}，由于连续作两次抽取，所以"第二次抽到黑球"是由事件"第一次抽到黑球，同时第二次也抽到黑球"和事件"第一次抽到白球，而第二次抽到黑球"组成。即：B=AB+B
根据概率的性质(有限可加性)知，P(B)=P(AB+B)=P(AB)+P(B) (注意AB与B互不相容)，于是，有
P(B)=P(AB)+P(B)=P(A)P(B|A)+P()P(B|)=

此题中所用的公式即为全概率公式。一般地，
设事件A1，A2，…，An互不相容，且A1+A2+…+An= ，则对任一事件B，(全概率公式)

例4：发报台分别以概率0.6和0.4发出信号"."和"-"。由于通讯系统受到干扰，当发出n号房时间"."时未必收到"."，而是分别以0.8和0.2的概率收到"."和"-"。同理，在发出"-"时，收报台也分别以概率0.9和0.1收到"-"和"."。问：
(1) 收到"."的概率是多少 (2) 收到"."，发出的确实是"."的概率是多少
解：设A={发出"."}，B={收到"."}，则
P(B)=P(AB)+P(B)= P(A)P(B|A)+P()P(B|)=0.6×0.8+0.4×0.1=0.52
P(A|B)=P(AB)/P(B)=P(A)P(B|A)/P(B)=0.6×0.8/0.52=0.923

例5：某工厂有四条流水线生产一种产品，该四条流水线的产量分别占总产量的15%，20%，30%和35%。又这四条流水线的次品率依次为5%，4%，3%和2%。今从出厂产品中任抽取一件产品，问恰好是次品的概率是多少？
解：设A={任抽取一件，恰好是次品}
Bi={任抽取一件，恰好是第i条流水线生产的产品},于是
P(A)= =0.15×0.05+0.20×0.04+0.30×0.03+0.35×0.02=3.25%

1.6 事件的独立性

根据乘法公式P(AB)=P(A)P(B|A)(或P(AB)=P(B)P(A|B))，可以知道P(AB)≠P(A)P(B)。如果P(AB)=P(A)P(B)的话，则应有P(B)=P(B|A)(或P(A)=P(A|B))，那么P(B)=P(B|A)有着什么含义呢？它表明B发生的概率并不依赖于A是否发生，即A与B无关。这就是所谓的事件的独立性的含义。
定义：任意两个事件A，B，若有P(AB)=P(A)P(B)成立，则称事件A、B是相互独立的。
例1：一个家庭有若干个孩子。假设生男生女是等可能的。设A={家庭中男孩女孩都有}，B={最多有一个女孩}，若(1)该家庭中有二个小孩(2)有三个小孩，试讨论事件A与B的独立性。
解：(1) 该家庭中有二个小孩，用字母b表示男孩，字母g表示女孩，则样本空间Ω为：
Ω={(b，b)，(b，g)，(g，b)，(g，g)}
根据题意，A={(b，g)，(g，b)}，B={(b，b)，(b，g)，(g，b)}
于是 AB={(b，g)，(g，b)}
则：P(A)=1/2, P(B)=3/4，P(AB)=1/2
显然P(AB)≠P(A)P(B)所以，事件A与事件B并不相互独立。
(2)与( 1)采用相同的方法，因为家庭中有三个孩子，则样本空间Ω为：
Ω={(b,b,b),(b,b,g),(b,g,b),(b,g,g),(g,g,g),(g,g,b), (g,b,g), (g,b,b)}
根据题意，
A={ (b,b,g),(b,g,b),(b,g,g), (g,g,b),(g,b,g),(g,b,b)}
B={(b,b,b),(b,b,g),(b,g,b),(g,b,b)}
AB={(b,b,g),(b,g,b),(g,b,b)}
则：P(A)=3/4, P(B)=1/2，P(AB)=3/8
显然P(AB)=P(A)P(B)所以，事件A与事件B相互独立。
例2：两射手彼此独立地同时射击同一目标，设甲射中(事件A)的概率为P(A)=0.9，乙射中(事件B)的概率为P(B)=0.8，求两人各发射一弹而射中目标的概率。
解I：由题意知，A，B两事件相互独立，则
P(A+B)=P(A)+P(B)-P(AB)=P(A)+P(B)-P(A)P(B)=0.9+0.8-0.9×0.8=0.98

对于三个事件A，B，C，如果
P(AB)=P(A)P(B)
P(AC)=P(A)P(C)
P(BC)=P(B)P(C)
P(ABC)=P(A)P(B)P(C)
同时成立，则称事件A、B、C相互独立。
…
可以将独立的概念推广为n个事件独立。

1.7 贝努利概型

下面我们用事件的独立性来研究一类重要的概率模型。
如果我们一次抛n枚相同的硬币，求事件"恰好出现k次正面"的概率Pn(k),可以用另一种等价的方式进行：每次抛一枚，共抛n次。显然，这n次抛掷的结果是互相独立的。因而，如果把相同条件下抛掷一枚硬币看作是一次试验，就意味着n次试验是互相独立的。
一般地，如果试验E只有二个可能的结果，A与，并且P(A)=p，P()=1-p=q,(0<p<1)，把E独立地重复n次的试验构成了试验，这个试验称作n重贝努利试验。有时简称贝努利试验或称为贝努利概型。
显然，"n重贝努力试验中事件A出现k次"这一事件的概率为：

例1：某学校的校乒乓球队与系乒乓球队要进行对抗赛，校队的实力强于系队，当一个校队队员与一个系队队员比赛时，校队队员获胜的概率为0.6，现在，校队与系队商量对抗赛的方式，共有三种方案可供选择：(1)3局2胜制(2) 5局3制(3) 7局4胜制。问：对系队来说，哪种方案最为有利？
解：设系队获胜的人数为ξ，则三种方案中系队获胜的概率分别为：

显然，第一种方案对系队来说最为有利。
例2：某车间有10台同类型的机床。每台机床配备的电动机功率为10千瓦。已知每台机床工作时，平均每小时实际开动12分钟，且开动与否互相独立。现因电力紧张，供电部门只能提供50千瓦的电力。问这10台机床能正常工作的概率为多少？
解：设10台机床中正在开动着的机床台数为ξ，则事件"这10台机床能正常工作"的概率可以表示为：P(ξ≤5)。
注意到每台机床只有"开动"与"关闭"两种状态，每台开动与否互相独立。这是一个10重的贝努利概型。
于是：

2 随机变量及其分布

2.1 离散型随机变量及其分布

在"贝努利概型"一节中讨论"在n重贝努力试验中事件A出现k次"的概率时，曾令ξ={n重贝努力试验中事件A出现的次数}，此时事件"在n重贝努力试验中事件A出现k次"可表示为ξ=k。从而有。在上面的讨论中知道，ξ会取什么值在每次试验之前是不能确定的，因为它是依赖于随机试验的结果的，也就是说它的取值是随机的。因此人们常称这种变量为随机变量。
再如，抛掷一枚硬币可能出现正面，也可能出现反面。现在约定：若试验结果为正面，则记为1。若试验结果为反面，则记为0。于是：，这也是一个随机变量。
定义：定义在样本空间上，取值于R，且只取有限个或可列个值的变量ξ=ξ(ω)称为一维(实值)离散型随机变量。简称离散型随机变量
例1：观察某电话总机在[0,t]时间内收到的呼唤次数，
令ωk={某电话总机在[0,t]时间内收到呼唤k次}。则样本空间Ω={ω1，, ω2，…，ωn,…},
设ξ={某电话总机在[0,t]时间内收到的呼唤次数}
则ξ(ωk)=k k=0,1,2,…
例2：令ωk={某厂某年出厂的电视机在一年中出现故障k次}
则样本空间={ω1，, ω2，…，ωn,…}
设ξ={某厂某年出厂的一台电视机在一年中出现故障的次数}
则ξ(ωk)=k k=0,1,2,…
事件"某厂某年出厂的一台电视机在一年中出现故障的次数多于k次"则可表示为{ξ>k}={ωk+1，, ωk+2，…}
ξ的取值范围为0,1,2,…。在试验之前并不能断定ξ会取那一个值，但我们可以知道ξ(ω0)、ξ(ω1)、…(即ξ=0、ξ=1，…)这些事件发生的概率 (在总体中所占的比例)，事实上，可以把这些电视机一年中发生故障次数的分布情况列成下表的形式：

这对研究和改进电视机的质量是非常有用的。
一般地，设随机变量ξ取值ai(i=1,2,…)且P(ξ=ai)=pi
习惯上写成或，称其为随机变量的分布列或分布律或分布。
例3：以n=5的贝努力试验为例。设事件A在一次试验中出现的概率为p，ξ="5次试验中事件A出现的次数"，则ξ的分布列为

根据概率的定义知，任一随机变量的分布列都具有以下的性质：(1)(2)
反之，任意一个具有以上性质的数列{pi }都有资格作为某一个随机变量的分布列。
分布列不仅给出了ξ=k的概率P(ξ=k)，而且对于任意的事件(a≤ξ≤b)发生的概率均可由分布列算出。由此可知，ξ取各种值的概率都可由它的分布列通过计算得出。因此我们说分布列全面地描述了(离散型)随机变量的统计规律。
对于n重贝努利试验，事件A出现的次数ξ是一个随机变量，其分布列人们给起了个容易记的名字：二项分布。记为：
称其为二项分布是因为Pk恰好是二项式(p+q)n的展开式中的第k+1项的系数。一个随机变量的分布列若是二项分布，也称该随机变量服从二项分布。
在二项分布中，若n=1，那么k只能到值0和1。这时有分布列这个分布称为0-1分布或两点分布。它是二项分布的特例。
下面再介绍一种重要的分布。
在研究"某电话交换机在单位时间内收到的呼唤次数"、"某公共汽车站在单位时间内来该站乘四的乘客数"、"宇宙中单位体积内星球个数"、"耕地中单位面积上杂草的数量"、"母鸡的年产蛋量"等等随机变量时，实践表明该随机变量的统计规律近似地为
这个分布称为参数为的泊松(Poisson)分布。记为P()

（3）
（4）若　（ξ与其期望的偏离程度比与其它任何值的偏离程度来得都小）

2.2 离散型随机变量函数的概率分布
设f(x)是一个函数，所谓随机变量X的函数f(X)是指这样的随机变量Y：当X取值x时，Y取值y=f(x)，记作Y＝f(X)。
对于离散型随机变量X，如果X的分布列是：

则Y＝f(X)的分布列是：

如果f(xk)的值全不相等，则上表就是Y的分布列。如果f(xk)中的值有相等的，则应把那些相等的值合并起来，同时把对应的概率相加，即得随机变量Y的分布列。
例1：已知随机变量X的分布为 (1)求参数k （2）求Y＝X2和Y＝2X－1的分布列
解：（1）根据分布列的性质知：
0.2+0.3+0.4+k=1
所以：　k=0.1
(2) (a) Y＝X2

所以Y的分布列为：

(b)Y=2X-1(请自已完成)

2.3 连续型随机变量及其分布
2.3.1　随机变量及分布函数
前面我们研究了离散型随机变量，在那里随机变量只取有限个或可列个值，这当然有很大的局限性。在许多随机现象中出现的一些变量，如"测量某地气温"、"某型号显象管的寿命"等等它们的取值就可以充满某个区间或区域。如同离散型随机变量一样，这些变量的取值是随着试验的结果的变化而变化的，因而在试验之前是不确定的。概率论的任务是要研究它们的统计规律，那么，对这种一般的随机变量如何来描述其规律呢？
定义：定义在样本空间上，取值于实数域的函数ξ(ω)称为样本空间Ω上的（实值）随机变量，并称F(x）=p{ξ(ω)<x}是随机变量ξ(ω)的概率分布函数。简称分布函数或分布。
2.3.2　连续型随机变量
定义：若ξ(ω)是随机变量，F（x）是它的分布函数，如果对任意的x，函数F（x）有

则称ξ(ω)为连续型随机变量，相应的F（x）为连续型分布函数。同时，f(x)称为是F（x）的概率密度或简称密度。
连续型分布密度函数f(x)具有以下性质：

任一函数f(x)如果具有以上二上性质即可成为概率密度函数并因此生成一个分布函数F（x）
3．

几何意义：ξ(ω)落在区间[x1,x2)中的概率恰好等于[x1,x2)上由曲线围成的曲边梯形的面积。
整个曲线下的面积为1。
此外，对于p(x)的连续点而言，必有

例1：设随机变量ξ具有概率密度.试确定常数K，并求p{ξ>0.1}
解：由于于是ξ具有概率密度，所以有=0.7408

下面介绍几个重要的连续型随机变量的分布。
（1）均匀分布
设连续型随机变量ξ在有限区间(a,b)内取值，且其概率密度为，则称ξ在区间（a,b）上服从均匀分布。
在区间(a,b)上服从均匀分布的随机变量具有下述意义的等可能性，即它落在此区间中任意等长度的子区间内的可能性是相同的，或者说它落在子区间内的概率只依赖于子区间的长度而与子区间的位置无关。
事实上，对于任一长度为l的子区间(c,c+l),有

例2：设电阻的阻值R是一个随机变量，均匀分布在900欧姆到1100欧姆之间，求R的概率密度及R落在950到1050之间的概率。
解：按题意，R的概率密度为
故，
（2）正态分布
设连续型随机变量X的概率密度为其中μ、σ＞0为常数，则称X服从参数为μ、σ的正态分布或高斯分布，记为
有关正态分布的详细讨论请单击这里
（3）指数分布
若随机变量X具有概率密度其中为常数，则称X服从参数为的指数分布。
例3：已知某电子管的寿命X服从指数分布，其概率密度为,求这种电子管能使用1000小时以上的概率。
解：

概率论基础

发布评论取消回复

最近发表

热门文章

标签列表