第一章概率与统计

(知识拓展)

一、数学史话

1.我们的世界充满或然性
  一块龟壳被烈火焚烧,即将龟裂,你知道会出现几条裂纹吗?一枚随意抛掷的硬币即将着地,你知道哪一面向上吗?一个新的黎明即将到来的时候,《晨报》告诉你:降水概率为60%,你知道自己是否要带雨伞吗?从古老的占卜,到现代的生活,每个人都以某种方式接触到或然性法则.
  描述概率世界的统计学存在于我们所到之处:初次心脏病发作的人有三分之一未能存活;一次DNA匹配的机会是千亿分之一;在美国10桩婚姻中有4桩以离婚告终;射击选手的平均环数,民意测验和天气预报等等,到处充满着统计规律.
  著名的物理学家格纳曾说过数学之有效是无法理解的.数学为什么会如此有效?我们还是让哲学家去讨论吧.对于我们只要记住伽利略说的话就行了:大自然是一本书,这本书是用数学写的,不借助于它们就一个字也不懂,没有它们就只会在黑暗的迷宫中踯躅.
  对于以上的随机性事件,就需要我们用随机数学来研究.新教材增加了概率与统计的基本内容,让大家初步认识随机数学
  2.随机数表
  一个有理性的19世纪的人肯定会认为出版一本随机数的书是愚蠢到了极点.
                                     --阿尔佛雷德·博克
  即使在今天大多数人也会认为一本都是数字的书,而且是毫无规律的数的书是毫无用处的,然而,一旦你接受了统计学,就会发现这是很必要的,我们不妨看看随机数表的历史
  1920年,列昂纳德·H·C·提珀特先生,要向他的同事们演示他的新的统计思想,这就需要大量的随机数据,提珀特先生就把一些写了数字的卡片放在一个布袋里,然后像摸彩券似的把他们摸出来,但是很遗憾,这种方法被证明是过于笨拙,而且卡片的混合也不足以保证随机性.时至今日,我们仍可以想象提珀特先生手提布袋进行演讲的辛劳.
  近年来在借助于人工随机样本检验各种统计理论中,已经花费了极其大量的劳动!
                                       --卡尔·毕尔生
  1927年,剑出版社出版了一本曾由提珀特先生随机排列的41600个数字的表,这些数据是随机取自人口普查教区面积的数字.也就是从这开始统计学家走上了一条寻找随机数的道路.
  1938数学R·A·费歇尔斯发表了15000个初充随机数字,选自对数展开的第1519位小数.这些数字是通过一个涉及两副纸牌的程序获得的。
  1939年,M·G·肯德尔和巴秉顿·史密斯发表了一张包含100000个数字的表,是由一台用旋转圆盘制作的机器随机排序的.这个圆盘分为十个扇形,当圆盘旋转时,十个扇形之一被一闪光的氖光灯瞬时照亮.
  1955年,RAND公司发表了一个文件,标题为具有100000正规叛离的一百万个随机数字,是由一个电子轮盘赌转向轮的随机脉冲所产生的.
  随着计算机的发展,数学家受蒙特卡洛的启发,冯·诺伊曼提出一个生成随机数的算术程序:一个被称为平方取中的算法,它从一个字长为N的数开始进行平方,取中间的NN 1数字作为第一组,然后对这个数平方,取中间NN 1个数字作为第二组,……遗憾的是,这个方法被发现是一个贫乏的随机数源,可能由于原来 数字的选取不当而无效.例如,从四位数3729出发,施以平方产生数14379264,其中间数字是3792,与我们开始的四个数字相同.
  现在随机数的生成元主要有四种类型:
   基于模算术或除后余数的同余生成元;
   使用计算机存储信息的二进制结构的生成元;
   基于数论的生成元;
   基于斐波那契序列.
  研究仍在继续--寻找更好的生成元,更快的生成元,以及周期更长的生成元.

二、趣味数学

1.假如你是经理,你将如何决策?
  统计资料表明,每年国庆节某商场内的促销活动可获得效益2万元,商场外的促销活动如果不遇到下雨天气可获得经济效益10万元,遇到雨天则要损失4万元.已知当天的降水概率40%,假设你是商场经理,你将如何决策?

【思路】

作出决策,先要求出商场外促销经济效益这个随机变量的概率分布,再求出它的期望,然后与商场内促销的经济效益进行比较,最后作出正确的决策.
  

 2.布丰问题:平行线、火柴棍与
  18世纪,法国科学家布丰提出一个问题:在纸上很多间距为火柴长度的平行线,然后向这张纸扔一根火柴棍,问火柴棍与平行线相交的概率是多少?

【思路】

如图11设火柴长为2,其中点到最近的一条平行线的距离为 ,半根火柴棍在垂直方向的上的投影长为 火柴棍与平行线的夹角为

  现在,利用概率论的有关知识,进行计算机模拟和数值分析,已发展成为一种新的数值计算方法--蒙特卡罗方法.

3.关于肇事嫌疑人的概率问题.
  一位出租车司机涉嫌一起夜间肇事逃逸事故.已知在这个城市里,有绿色蓝色两家出租车公司.
   在这个城市里,85%的出租车是绿色,15%是蓝色.
   一位目击者认定肇事出租车是蓝色.法庭在与出事当夜相同的环境下测试了目击者的可信度,并得出结论,在80%的时间里,目击者能正确识别两种颜色中的一种,在20%的时间里不能.
  与该事故有牵连的出租车是蓝色而不是绿色的概率是多少?
  在审判当中,这是一个非常严肃的决策时刻,但是大部分人不能正确估计客观的概率,仅凭目击者的认定下断语,一个有代表的答案是大约80%.而正确的答案是大约41%

【评析】

心理学家丹尼尔·卡内曼和艾莫斯·特弗斯基曾经研究了这个例子,本题错误的原因在于过于相信直觉,而忽略了两种出租车的比率.正确的分析是:如果有共100辆出租车,则可能被判定为蓝色的有85×20%15×80%29辆,正确判定为蓝色的有15×80%12辆,判定为蓝色的概率是12/29≈41%

三、竞赛园地

怎样用期望来证明平均数问题呢?因为期望在某种意义上就是加权平均数,要求期望就要先列其分布列,利用期望的定义来进行计算和论证,下面举一例说明.
  例设有一付纸牌共有 张,其中有3张王牌,任意地洗牌,且牌的所有可能的分布是等概率的,洗好牌后从顶上开始一张接一张地翻牌,直至翻到第二张王牌出现时为止,证明所翻过的纸牌的平均数是

【证明】