第一章 多元统计分析概述
第一节 引言
第二节 大数据时代与大数据
第三节 应用背景
第四节 计算机在统计分析中的应用
第二章 多元正态分布的参数估计与假设检验
第一节 引言
第二节 基本概念
第三节 多元正态分布的参数估计
第四节 均值向量的检验
第五节 协差阵的检验
思考与练习
第三章 多元线性回归模型
第一节 引言
第二节 线性模型的参数估计
第三节 线性模型的检验
第四节 预测
第五节 回归分析应用中应注意的问题
第六节 实证分析
思考与练习
第四章 聚类分析
第一节 引言
第二节 相似性的量度
第三节 系统聚类分析法
第四节 k-均值聚类分析法
第五节 有序样品的聚类分析法
第六节 实例分析
思考与练习
第五章 判别分析
第一节 引言
第二节 距离判别法
第三节 贝叶斯判别法
第四节 费希尔判别法
第五节 实例分析
思考与练习
第六章 主成分分析
第一节 引言
第二节 主成分分析模型
第三节 主成分的性质
第四节 主成分方法应用中应注意的问题
第五节 实例分析
思考与练习
第七章 因子分析
第一节 引言
第二节 因子分析模型
第三节 因子分析应用中应注意的问题
第四节 实例分析
思考与练习
第八章 相应分析
第一节 引言
第二节 列联表分析
第三节 相应分析的基本理论
第四节 相应分析中应注意的几个问题
第五节 实例分析与计算实现
第六节 结语
思考与练习
第九章 典型相关分析
第一节 引言
第二节 典型相关的基本理论
第三节 样本典型相关分析
第四节 典型相关分析应用中的几个问题
第五节 实例分析
思考与练习
第十章 多变量的可视化分析
第一节 引言
第二节 条形图
第三节 面积图
第四节 散点图
第五节 高低图
第六节 箱图
第七节 双轴图
思考与练习
附录I 数据表
附录II 常用统计表
参考文献
前 言
随着互联网(Internet)的日益普及,各行各业都开始采用计算机及相应的信息技术进行管理和决策,这使得各企事业单位生成、收集、存储和处理数据的能力大大提高,数据量与日俱增,大量复杂信息层出不穷。大数据时代已经到来,数据产生的经济效益愈发凸显。然而,大量信息在给人们带来方便的同时也带来一系列问题。比如:信息量过大,超过了人们掌握、消化的能力;一些信息真伪难辩,从而给信息的正确应用带来困难;信息组织形式的不一致性导致难以对信息进行有效的统一处理;在公共的网络环境之中,用户隐私的保护,不仅需要法律支持,更需要社会公认的数据标准和规范;等等。因此,我们将面临着复杂数据的处理问题,特别是研究客观事物中多个变量(或多个因素)之间相互依赖的统计规律性,它的重要理论基础之一是多元统计分析。多元统计分析是统计学中一个非常重要的分支,具有很广泛的应用性,它在自然科学、社会科学和经济学等各领域中得到了越来越广泛的应用,是一套非常有用的数据处理方法。为了能更好的从统计学的角度解决这些问题,我们组织编写了《应用多元统计分析》这本书,并且作为“教育部统计学类专业教学指导委员会”推荐系列教材之一。
按照国家级教材规划要求,本书的编写力求以统计思想为主线,以SPSS软件为工具,深入浅出地介绍各种多元统计方法的应用。其基本框架是:第一章为概述,第二章和第三章介绍多元正态总体的参数估计和假设检验、多元线性回归模型,第四章至第九章介绍常用的多元统计方法,这些方法包括聚类分析、判别分析、主成分分析、因子分析、相应分析、典型相关分析,第十章介绍多变量的可视化分析等。
在本书的编写过程中,我们根据经济和管理类的专业要求,突出以下特点:
第一,把握统计实质,贯穿统计思想。注重统计思想的讲述,在多元统计方法的应用上把握实质,从实际问题入手,在不失严谨的前提下,淡化统计方法本身的数学推导,体现统计学的实用性。
第二,应用SPSS软件,实现统计计算。根据多元统计固有的特点,我们选用在我国广泛流行的SPSS软件作为计算工具。在每一章的最后,都要讲述所介绍的多元统计方法在SPSS软件中的实现。这样将SPSS软件的学习和案例分析有机结合,不仅使得学生在实践运用中学习了SPSS软件的操作方法,而且还使学生对多元统计分析的意义有深入的体会。
第三,加强统计理论,完成统计实践。根据实际介绍的统计方法,我们将编写的习题分为两类:一类是继续巩固和加强统计理论和方法,包括基本概念和基本思路训练的习题;另一类是针对实际问题,培养学生结合统计方法独立解决实际问题的能力和素质的习题。
为了提高学生的学习兴趣和学习的效率,考虑到不同的使用对象和教学特点,对部分内容可根据实际情况进行选讲。
本书第一、四、五、九章由厦门大学朱建平教授编写,第六、七章由广东财经大学林海明教授编写,第八章由厦门大学刘云霞副教授编写,第二、三章由东北石油大学辛华副教授编写,第十章由东北石油大学任晓萍助理教授编写。本书由朱建平教授担任主编并进行统稿和总纂。
本书在编写和出版过程中,得到了厦门大学数据挖掘研究中心、厦门大学管理学院MBA中心、广东财经大学经济学院、东北石油大学数学与统计学院、浙江工商大学现代商贸流通体系协同创新中心和北京大学出版社的支持,潘丽娜编辑为本书的组稿、编辑做了大量的工作,在此表示衷心感谢!编写一本好的教材并不容易,尽管我们努力想奉献给读者一本满意的书,但仍有达不到读者各方面要求的地方。书中难免有疏漏或错误之处,恳请读者多提宝贵意见,以便今后进一步修改与完善。
本书的编写得到了国家社会科学基金重大项目《大数据与统计学理论的发展研究》(13&2D148)的资助。
编者
2017年7月
本书力求以统计思想为主线,以SPSS软件为工具,深入浅出地介绍各种多元统计分析方法的理论和应用。本书特点是,将SPSS软件的学习和案例分析有机结合,不仅使学生在实践中学习了SPSS软件的操作方法,而且还使学生对多元统计分析的意义有深入的体会。
厦门大学经济学院教授、博士生导师,统计系主任、厦门大学数据挖掘研究中心主任。主要研究方向数理统计、数据挖掘、计量经济学。
本书是统计学专业“应用多元统计分析”教材,本书把握统计实质,贯穿统计思想。注重统计思想的讲述,在多元统计方法的应用上把握实质,从实际问题入手,在不失严谨的前提下,淡化统计方法本身的数学推导,体现统计学的实用性。本书的一大特点是应用SPSS软件,实现统计计算。另外,根据实际介绍的统计方法,将编写的习题分为两类:一类是继续巩固和加强统计理论和方法,包括基本概念和基本思路训练的习题;另一类是针对实际问题,培养学生结合统计方法独立解决实际问题的能力和素质的习题。本书可作为统计专业本科生教材,同时也适合自学多元统计分析的读者阅读参考。本书主要内容包括:多元分析概述、多元正态分布的参数估计、多元正态分布均值向量和协差阵的检验、判别分析、聚类分析、主成分分析、因子分析、相应分析、典型相关分析等。