第六章 统计学中的基本概念
§6.1 引言
§6.2 若干基本概念
§6.3 若干统计问题
习题六
第七章 估计
§7.1 最大似然估计
§7.2 矩估计
§7.3 估计的无偏性
§7.4 无偏估计的优良性
§7.5 估计的相合性
§7.6 估计的渐近分布
§7.7 置信区间和置信限
习题七
第八章 假设检验
§8.1 问题的提法
§8.2 NP引理和似然比检验
§8.3 单参数模型中的检验
§8.4 广义似然比检验和关于正态总体参数的检验
§8.5 关于比率的检验
§8.6 拟合优度检验
习题八
第九章 回归分析
§9.1 引言
§9.2 一元线性回归
§9.3 多元线性回归
§9.4 多元线性回归中的参数检验
§9.5 预测和控制
*§9.6 模型检验
*§9.7 变量选择
§9.8 方差分析
*§9.9 逻辑斯谛回归
习题九
第十章 统计决策和贝叶斯分析简介
§10.1 统计决策问题概述
§10.2 贝叶斯统计
§10.3 先验分布的确定
习题十
习题答案与提示
附表1 标准正态分布数值表
附表2 t分布临界值表
附表3 χ2分布临界值表
附表4 F分布临界值表
附表5 柯氏检验临界值表
参考文献
名词索引
第二版前言
本书第二版对第一版进行了少量修改和补充,改动不大.概率论部分主要修订内容是: 修改了个别不妥的文字和不正确的数字;举例说明强大数律与大数律的差别;对于初学者来说过于困难的几道习题,有的予以删除,有的予以改换.统计学部分主要是对原书中的笔误做了改正,对某些地方的表达方式做了一些修正,使得表达更精确和通顺.另外,由于统计学是面向实际应用的学科,近年来出现许多新方法,十分热门和流行.在第六章中,我们介绍了“大数据”这一方向,阐明它与统计学的关系,希望引起读者对这一当今热门对象的关注.在回归分析变量选择部分,我们还介绍了近年出现的Lasso方法,希望引起关注.
另外,考虑到现今许多高等院校理工类本科“概率论与数理统计”课程已改为“概率论”和“统计学”两门课程,本次修订我们将全书分为概率论分册和统计学分册,以满足课程改革的需要.
我们要特别强调的是,第二版和第一版一样,是为高等学校各专业本科学生学习“概率论与数理统计”而编写的教材,只要求学生预先学过“微积分”和“线性代数”的基础知识,不要求较深的数学知识(如实变函数、测度论).但有一些内容打上*号或小字排印,这些内容或者难度较大,或者涉及较深的数学知识,均不属于教学大纲的范围,只供有余力的学生进一步学习时参考.
陈家鼎 郑忠国
2015年11月
第一版前言
概率论是研究自然界、人类社会及技术过程中随机现象的数量规律的一门数学.数理统
计学则是以概率论为指导,研究如何有效地收集和分析数据,以对所考查的问题进行推断或
预测,直至为采取一定的决策和行动提供依据和建议.随着现代科学技术的迅速发展和人类
生活条件的不断改进,概率论和数理统计学得到了蓬勃的发展.二者不仅形成了系统的理论
,而且在自然科学、人文社会科学、工程技术及经济管理等方面有越来越广泛的应用.很多
院校都开设“概率论”课、“数理统计”课或“概率统计”课.
最近几年我们二人一直担任北京大学数学科学学院为全校本科生开设的基础课程——“概率论”
和“数理统计”的教学工作.这两门课各有60学时,学生来自文科、理科和医科的多个不
同院系.本书正是在我们讲稿的基础上经过修改、扩充而成的,其中第一章至第五章由陈家
鼎编写,第六章至第十章由郑忠国编写.
我们在编写过程中参考了国内外已有的特别是近十年出版的多部优秀教材(见本书的参
考文献),注意吸收这些教材中好的讲法和具体例子.我们在编写中注意了下面三点:
(1) 恰当处理逻辑严谨性与生动直觉的关系,使学生既有严谨的抽象思维能力又有概率统计
的直觉与对随机性的想象力.通过各方面的例子介绍有关的概念、方法和定理的实际含义,注意引导
学生的思维从直觉和想象上升到科学的抽象.例如,既介绍了概率的“频率定义”和“主观
定义”,又介绍了“公理化定义”,说明后者是在前者基础上的科学抽象.先介绍随机变量
的直观含义和直观描述,然后介绍随机变量的严格定义.在介绍数学期望时先用加权平均的
思想介绍离散型随机变量的期望,然后对一般的随机变量用离散型随机变量逼近的办法定义
期望.对每个定理都给出确切的论述,能不用测度论证明的尽量写出证明,但由于教学时数的
限制,许多证明打上*号或用小字排印,不要求学生掌握.例如,对“两个随机变量之和的期望等于两个随机变
量的期望之和”这一重要定理,我们在正文中只叙述了结论,但其详细证明则放在附录里小
字排印.对“中心极限定理”和有关充分统计量的“因子分解定理”则不叙述证明.
(2) 认真贯彻理论联系实际的原则.既要使学生掌握概率和统计的基本理论,又要使学生认
识这些理论如何灵活运用于实际,从而培养学生解决实际问题的能力.要做到这一点,必须
要用心地列举贴近时代生活的,使学生感兴趣的多方面的应用例子.本书努力朝这个方向做
.除了叙述日常生活、工业、商业、医学及管理等方面的典型应用例子(包括一些著名例子)
外,还介绍一些较复杂的灵活应用例子.例如,第一章中作为独立试验序列的应用,介绍了
乒乓球赛制的概率分析;第二章讲述随机变量取值的分散性时,除了“方差”外还介绍了经济学
中常用的“基尼系数”;在讲述正态分布的性质之后,介绍了当今工业质量管理工作中广泛
关注的“6σ”;第九章中作为回归分析的应用介绍了高考作文评分的监控方法,等等
.
本书特别注重对理论联系实际的难点进行化解.例如,对“假设检验”,避免单纯从逻辑推
理进行论述,着重从多方面的应用实例说明假设检验问题的提法、零假设的设置及两类错误的概
率.把实际中的检验问题分成两大类: 决策性检验问题和显著性检验问题.有些检验问题
强调控制第一类错误的概率(例如第八章例1.4),有些检验问题则重点在控制第二类错误的
概率(例如第八章例1.5).本书还用一定篇幅介绍p值的概念和用法.又如,介绍“回归分析
”的应用时把自变量分为两类: 可控制的和不可控制的,把自变量和反应变量之间的关系
分为两类: 因果关系和非因果性的相关关系.本书还特别关注数据的来源和变量的性质
.
(3) 在叙述方法与内容编排上注意基本内容与进一步内容、重点与非重点的界限,力求做到
层次分明,便于教和学.我们认为,大学教材应比教学大纲规定的多一些,更应比课堂实际
讲授的多一些.这样做有利于教师根据实际情况灵活掌握,有利于学生课外阅读,使有余力的学生可以选学更多的东西.本书中凡打*
号和小字排印的部分均不是基本内容,不要求学生掌握.有些内容虽未标上*号也非小字排印
,教师也可根据实际情况确定为非基本内容.
本教材虽是按两学期的教学安排(“概率论”课一学期,“数理统计”课一学期)编写的,但
是也可作为一学期的“概率统计”课的教材.作为后者使用时,应选定书中最基本的部分.
笔者建议选择下列内容:
第一章(不含§1.7),第二章(不含§2.8),第三章(不含§3.7,§3.8),第四章§4.2和§4.3
的部分内容,第五章的§5.1,第六章,第七章的§7.1,§7.5,第八章的§8.1,§8.2,
§8.4中关于正态总体参数的检验方法,§8.6中的χ2检验,第九章的§9.1,§9.2及§9.3至§9.5中方法的应用部分,第十章的§10.1.
北京大学出版社刘勇和曾琬婷同志对本书的出版付出了辛勤的劳动,我们在此向他们表示感
谢.
由于我们水平有限,本书一定有不少缺点和谬误,欢迎读者和专家批评指正.
陈家鼎 郑忠国
2007年6月于北京大学数学科学学院
本书第一版自出版以来得到了读者的广泛好评,本次修订保持了第一版的特色,并把全书分为概率论分册和统计学分册。本册是统计学分册,强调了统计学的数据处理的功能。
陈家鼎,北京大学数学科学学院教授、博士生导师,曾任北京大学统计系主任,数学科学学院副院长、中国概率统计学会理事长、中国统计学会副会长,主编的教材《数理统计学讲义》获国家教委优秀教材一等奖;郑忠国,北京大学数学科学学院教授、博士生导师。
本书系统论述概率和统计的概念、方法、理论及其应用,不仅提供了这个学科领域的基本内容,而且叙述了在日常生活、自然科学、技术科学、人文社会科学及经济管理等各方面的应用例子。本书恰当处理了逻辑严谨性与生动直觉的辩证关系,使学生既有严谨的抽象思维能力,又对随机现象具有直觉想象力;认真贯彻理论联系实际,应用举例贴近时代生活。
本书第一版自出版以来得到了读者的广泛好评,本次修订保持了第一版的特色,并把全书分为概率论分册和统计学分册,以迎合目前许多高等院校将"概率论与数理统计"课程分为"概率论"课程和"数理统计"课程的需要,其中概率论分册强调了随机现象在社会生活和科学技术中的广泛性及所具有的内在规律,统计学分册则强调了其数据处理的功能。