目录
第一章 SPSS与社会科学调查研究
第二章 SPSS基本知识
第三章 数据录入
第四章 SPSS数据文件的编辑与管理
第五章 数据变换
第六章 频次表与描述统计分析
第七章 交互表与关联分析(Crosstabs的应用)
第八章 引入其他变量后的交互分析
第九章 子总体均值比较与检验(Means和TTest的应用)
第十章 方差分析(OneWay ANOVA)
第十一章 相关分析(Correlate过程)
第十二章 线性回归分析(Linear Regression)
第十三章 Logistic回归分析
第十四章 SPSS统计图形
附录一 Stata简介
附录二 本书各章例题对应Stata命令示范
前言
SPSS是英文“Statistical Package for the Social Science”(社会科学统计软件包)的缩写。20世纪60年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS,同时成立了SPSS公司,并于1975年在芝加哥组建了SPSS公司总部。1984年SPSS公司推出了世界上第一个统计分析软件微机版本SPSS/PC+。SPSS最初的几个版本都是在DOS系统下运行的,虽然功能比较强,但在用户界面、输入、输出环境等方面并不十分理想。80年代末,微软公司推出Windows操作系统后,SPSS迅速推出相应的Windows版本。由于MS Windows的普及,SPSS公司于1992年、1993年、1994年相继推出了可在Windows系统下运行的5.0、6.0、6.1版本。1995年微软发布了32位操作系统Windows 95,此后微软又多次发布新的操作系统,包括Windows XP、Windows 7以及最新的Windows 10等多个32位或64位操作系统。与之相应,1997年以来,SPSS公司也在不断升级优化其统计软件,推出了8.0至18.0等版本。2009年IBM公司收购了SPSS公司,并将其更名为IBM SPSS Statistics(以下仍简称SPSS),在对用户界面和一些统计模块进行了较大的升级和调整后,推出了IBM SPSS Statistics 19.0,当前最新版本为IBM SPSS Statistics 24.0(2016年发布)。本书的撰写即是在Windows 10专业版64位操作系统下,使用最新的24.0版本软件进行操作演示的,而使用其他操作系统(如Mac OS)或使用SPSS旧版软件的用户也可以参考本教材学习。
随着SPSS版本的不断升级,其统计分析的功能也不断更新和完善,目前SPSS的主要功能有样本数据的描述和预处理、描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、假设检验(包括参数检验、非参数检验及其他检验)、生存分析、时间序列分析、多重响应等几大类,每类中又包括若干统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS也有专门的绘图系统,可以根据数据类型和研究需要绘制各种统计图形。
SPSS和SAS、BMDP并称为国际上最有影响的三大统计软件。目前SPSS已被广泛应用于社会学、经济学、政治学、心理学、管理学、市场营销、医学统计等众多领域,因其全面的统计分析功能,强大的建模、评估和自动化功能,以及前沿的大数据分析功能,得到了各界的认可和好评。中英文期刊发表的很多研究论文使用SPSS软件作为其统计分析的工具,而全球最大的信息技术和业务解决方案公司IBM全资收购SPSS公司,也足见其在商务统计中的重要作用。
SPSS数据分析教程前言本书着重介绍如何使用SPSS对量化数据进行描述和分析,涉及的数据类型包括研究者或机构就某一具体问题以问卷采集的方式获得的原始数据,也包括基于已有研究或成果的汇总数据,以及由学术机构实施的大型综合社会调查数据(如“中国家庭追踪调查”数据)。
本书基本内容如下:
内容一:SPSS与社会科学调查研究。本部分内容对应书中第一章,在概要性地介绍了量化社会科学研究的基本步骤后,指明了SPSS在研究环节中起到的重要作用。
内容二:数据分析前的准备。本部分内容对应书中第二章至第五章,包括SPSS基本知识、数据录入、数据文件的编辑与管理、数据变换等内容。在相应章节中,将具体演示如何打开/录入数据文件,如何运行统计程序、检查及清理数据,以及如何完成进一步分析所需的数据转换。
内容三:数据描述与展示。本部分包括书中第六章“频次表与描述统计分析”、第十四章“SPSS统计图形”。统计分析的第一步是对数据进行描述和展示。如多少人对工作感到满意?他们的性别、年龄构成如何?基于数据描述性统计分析结果,可以进一步对数据进行核查,如果在统计结果中发现有人年龄大于150岁,或者有人月收入超过几百万等明显的错误,便可以进行相应的纠正或删除。在呈现数据分析结果时,一张准确的统计图可能胜过大段的文字叙述,而且可以更为直观地呈现结果,快速传递信息,本书最后一章将专门介绍各类统计图形的制作方法。
内容四:推论统计方法。当前,几乎所有的量化社会科学研究所使用的数据均为有一定代表性的抽样调查数据,因此,在研究分析中,更为重要的是检验基于样本数据分析得到的结论能否推论到其所代表的总体。例如,通过药物临床试验证实某新型药物的效果,我们不仅希望知道其对于参与者(样本)的有效性,更重要的是认证这一新药是否对所有同类对象均显著有效,即能否推论到总体。对于此类问题,我们可以借助SPSS对数据进行统计检验。第九章“子总体均值比较与检验”将主要介绍假设检验的操作方法与结果分析。在相关分析的部分章节中,也会结合案例展示统计检验。
内容五:相关分析。科学研究的根本目的就在于探察现象背后客观稳定的规律,这一规律可以表述为一组共变关系,也可以更为精确地表述为因果关系。比如在市场营销中,我们会关心广告投放与产品销售额之间的关系,以便在未来决策时更接近“最佳”支出费用。又如在政策研究中,我们会关心某地政治、经济、社会等诸多因素对当地人口预期寿命的影响,进而有针对性地改进当地福利水平。诸如此类问题,都需要在对现象测量的基础上,通过操作化手段生成研究所需变量,并将问题表述为变量关系的假设,在此基础上进一步借助统计软件探索现象背后可能的规律。主要根据由低到高的变量测量水平,本书第七章和第八章介绍交互表与关联分析以及引进其他变量后的交互分析,第十章至第十三章依次为方差分析、相关分析、线性回归分析以及Logistic回归分析。
学习数据分析的最好方法是进行实际操作,在本书中,我们将提供一些真实的数据,并使用这些数据一步步地展示操作方法,你会得到以下问题的答案:男性比女性工作更快乐吗?三大地区的收入差距怎么样?上大学的生活成本在不同性别/家庭背景的学生之间有什么样的差异?等等。
与其他同类教材或SPSS的操作类书籍相比,本书作者力图以简明、扼要、直观的方式,展示SPSS分析的基本原理与操作,并在展示过程中将统计原理与SPSS数据分析相结合。好的数据分析是理论、经验、技术、好奇心等的综合。SPSS作为一个强有力的统计分析工具,能够帮助我们更好地通过数据分析寻求对社会现象的解释,从数据分析中得出更有说服力的结论。
本书的主要内容架构,得益于2002年起作者为北京大学社会学系本科生开设的数据分析课程、2007年上海人民出版社出版的《SPSS基础教程》以及2014年北京大学出版社出版的《SPSS基础分析教程》。多年的课堂教学以及与学生的互动,使我受益良多,面对那些来自全国的优秀学子,唯有不断改进和提高自己的教育水平,才是对得起他们的唯一选择。面对SPSS软件版本的不断升级,以及之前教材中的一些疏漏在教学过程中不断被发现,重新编写一本教材,便是我们的选择。
本书以简明、扼要、直观的方式展现了SPSS分析的基本原理与操作,适合作为社会学、管理学、新闻学、统计学等相关专业的本科教材,也可供对社会调查研究感兴趣的读者阅读。
刘爱玉,女,现为北京大学社会学系教授,博士生导师,北京大学社会调查研究中心主任。主要从事劳动社会学、经济社会学、组织社会学、人力资源开发与管理等方面的研究。
田志鹏,男,现为北京大学社会学系博士研究生,研究方向为经济社会学、劳动社会学。
本书着重介绍如何使用统计软件SPSS对量化数据进行描述和分析,主要包括SPSS与社会科学调查研究、数据分析前的准备、数据描述与展示、推论统计方法以及相关分析五部分内容。本书力图以简明、扼要、直观的方式,展现SPSS分析的基本原理与操作,涵盖了常见的频次表与描述统计分析、交互表与关联分析、多变量交互分析、子总体均值比较与检验、方差分析、相关分析和线性回归分析,以及高级统计知识和Logistic回归分析。本书适合作为社会学、统计学、管理学等相关专业的本科教材,也可供对社会调查研究感兴趣的读者阅读。