第一章概率与统计
(知识拓展)
一、数学史话
1.我们的世界充满或然性 一块龟壳被烈火焚烧,即将龟裂,你知道会出现几条裂纹吗?一枚随意抛掷的硬币即将着地,你知道哪一面向上吗?一个新的黎明即将到来的时候,《晨报》告诉你:降水概率为60%,你知道自己是否要带雨伞吗?从古老的占卜,到现代的生活,每个人都以某种方式接触到或然性法则. 描述概率世界的统计学存在于我们所到之处:初次心脏病发作的人有三分之一未能存活;一次DNA匹配的机会是千亿分之一;在美国10桩婚姻中有4桩以离婚告终;射击选手的平均环数,民意测验和天气预报等等,到处充满着统计规律. 著名的物理学家格纳曾说过数学之有效是无法理解的.数学为什么会如此有效?我们还是让哲学家去讨论吧.对于我们只要记住伽利略说的话就行了:“大自然是一本书,这本书是用数学写的,不借助于它们就一个字也不懂,没有它们就只会在黑暗的迷宫中踯躅.” 对于以上的随机性事件,就需要我们用随机数学来研究.新教材增加了概率与统计的基本内容,让大家初步认识随机数学. 2.随机数表 “一个有理性的19世纪的人肯定会认为出版一本随机数的书是愚蠢到了极点.” --阿尔佛雷德·博克 即使在今天大多数人也会认为一本都是数字的书,而且是毫无规律的数的书是毫无用处的,然而,一旦你接受了统计学,就会发现这是很必要的,我们不妨看看随机数表的历史. 1920年,列昂纳德·H·C·提珀特先生,要向他的同事们演示他的新的统计思想,这就需要大量的随机数据,提珀特先生就把一些写了数字的卡片放在一个布袋里,然后像摸彩券似的把他们摸出来,但是很遗憾,这种方法被证明是过于笨拙,而且卡片的混合也不足以保证随机性.时至今日,我们仍可以想象提珀特先生手提布袋进行演讲的辛劳. “近年来在借助于人工随机样本检验各种统计理论中,已经花费了极其大量的劳动!” --卡尔·毕尔生 1927年,剑桥出版社出版了一本曾由提珀特先生随机排列的41600个数字的表,这些数据是随机取自人口普查教区面积的数字.也就是从这开始统计学家走上了一条寻找随机数的道路. 1938年数学家R·A·费歇尔和F·雅特斯发表了15000个初充随机数字,选自对数展开的第15至19位小数.这些数字是通过一个涉及两副纸牌的程序获得的。 1939年,M·G·肯德尔和B·巴秉顿·史密斯发表了一张包含100000个数字的表,是由一台用旋转圆盘制作的机器随机排序的.这个圆盘分为十个扇形,当圆盘旋转时,十个扇形之一被一闪光的氖光灯瞬时照亮. 1955年,RAND公司发表了一个文件,标题为具有100000正规叛离的一百万个随机数字,是由一个电子轮盘赌转向轮的随机脉冲所产生的. 随着计算机的发展,数学家受蒙特卡洛的启发,冯·诺伊曼提出一个生成随机数的算术程序:一个被称为“平方取中”的算法,它从一个字长为N的数开始进行平方,取中间的N或N 1数字作为第一组,然后对这个数平方,取中间N或N 1个数字作为第二组,……遗憾的是,这个方法被发现是一个贫乏的随机数源,可能由于原来 个数字的选取不当而无效.例如,从四位数3729出发,施以平方产生数14379264,其中间数字是3792,与我们开始的四个数字相同. 现在随机数的生成元主要有四种类型: 基于模算术或除后余数的同余生成元; 使用计算机存储信息的二进制结构的生成元; 基于数论的生成元; 基于斐波那契序列. 研究仍在继续--寻找更好的生成元,更快的生成元,以及周期更长的生成元.
二、趣味数学
1.假如你是经理,你将如何决策? 统计资料表明,每年国庆节某商场内的促销活动可获得效益2万元,商场外的促销活动如果不遇到下雨天气可获得经济效益10万元,遇到雨天则要损失4万元.已知当天的降水概率40%,假设你是商场经理,你将如何决策?
【思路】
要作出决策,先要求出商场外促销经济效益这个随机变量的概率分布,再求出它的期望,然后与商场内促销的经济效益进行比较,最后作出正确的决策.
2.布丰问题:平行线、火柴棍与 . 18世纪,法国科学家布丰提出一个问题:在纸上画很多间距为火柴棍长度的平行线,然后向这张纸扔一根火柴棍,问火柴棍与平行线相交的概率是多少?
【思路】
如图1-1设火柴棍长为2,其中点到最近的一条平行线的距离为 ,半根火柴棍在垂直方向的上的投影长为 ,火柴棍与平行线的夹角为 ,
现在,利用概率论的有关知识,进行计算机模拟和数值分析,已发展成为一种新的数值计算方法--蒙特卡罗方法.
3.关于肇事嫌疑人的概率问题. 一位出租车司机涉嫌一起夜间肇事逃逸事故.已知在这个城市里,有“绿色”和“蓝色”两家出租车公司. 在这个城市里,85%的出租车是绿色,15%是蓝色. 一位目击者认定肇事出租车是蓝色.法庭在与出事当夜相同的环境下测试了目击者的可信度,并得出结论,在80%的时间里,目击者能正确识别两种颜色中的一种,在20%的时间里不能. 与该事故有牵连的出租车是蓝色而不是绿色的概率是多少? 在审判当中,这是一个非常严肃的决策时刻,但是大部分人不能正确估计客观的概率,仅凭目击者的认定下断语,一个有代表的答案是大约80%.而正确的答案是大约41%.
【评析】
心理学家丹尼尔·卡内曼和艾莫斯·特弗斯基曾经研究了这个例子,本题错误的原因在于过于相信直觉,而忽略了两种出租车的比率.正确的分析是:如果有共100辆出租车,则可能被判定为蓝色的有85×20%+15×80%=29辆,正确判定为蓝色的有15×80%=12辆,判定为蓝色的概率是12/29≈41%。
三、竞赛园地
怎样用期望来证明平均数问题呢?因为期望在某种意义上就是加权平均数,要求期望就要先列其分布列,利用期望的定义来进行计算和论证,下面举一例说明. 例设有一付纸牌共有 张,其中有3张王牌,任意地洗牌,且牌的所有可能的分布是等概率的,洗好牌后从顶上开始一张接一张地翻牌,直至翻到第二张王牌出现时为止,证明所翻过的纸牌的平均数是
【证明】
|