卫明真

2020-08-17   阅读量: 6897

SPSS

SPSS数据文件的特点以及结构和定义方法

扫码加入数据分析学习群

一、SPSS数据文件的特点

(1)SPSS数据文件是一种有结构的数据文件,它由数据结构和内容两部分组成,

(2)数据结构是对SPSS中各列变量及其属性的描述,主要记录数据变量的名称、类型、变量宽度、小数位数、变量名标签、变量值标签、缺失值、显示宽度、对齐方式和计量尺度等必要信息,

(3)数据的内容才是那些待分析的具体数据。

(4)相关概念:个案(或记录)、变量、变量值。

个案:数据编辑窗口中的一行称为一个个案Case)或记录(Record),所有个案组成SPSS数据文件的内容。

变量:数据编辑窗口的一列称为一个变量(Variable),每个变量都有一个名字,称为变量名,它是访问和分析SPSS每个变量的唯一标志。 SPSS数据文件的结构就是对每个变量及相关特征的描述。

变量值:单元格中的具体数值。

创建SPSS数据文件的方法

基于上述特点,建立SPSS数据文件时应完成两项任务:

(1)描述数据的结构:在数据编辑器窗口的变量视图界面定义变量的各个属性,如:变量名,类型、变量宽度、小数位数、变量名标签、变量值标签、缺失值、显示宽度、对齐方式和度量尺度等等。

(2)录入编辑数据:在数据编辑器窗口的数据视图界面中录入已定义各变量的变量值,即原始数据。

二、SPSS数据的结构和定义方法

SPSS数据的结构是对SPSS每列变量及其相关属性的描述,主要包括变量名、数据类型、变量宽度、变量名标签、变量值标签、显示宽度、缺失值、对齐方式、计量尺度等信息。

1、变量名:

变量名是变量访问和分析的唯一标志。在定义SPSS数据结构时应首先给出每列变量的变量名。变量的命名规则如下:

1.首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符。SPSS允许用汉字作为变量名。

2.SPSS12.0版本以前,变量名的字符个数最好不多于8个;变量名不区分大小写字母。

3. SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如VAR00001,VAR00012等。变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL,BY,AND,NOT,OR等。

4.变量名最好与其代表的数据含义相对应,每个变量名必须具有唯一性。

2、变量类型

变量类型是指每个变量取值的类型。

SPSS中有三种基本变量类型:

(1)数值型

(2)字符型(String)

(3)日期型(Date)

(1)数值型

•数值型是SPSS最常用的变量类型,其变量取值通常由阿拉伯数字和其它特殊符号(圆点、逗号、美元符号)等组成。如工资、年龄、产量、考试成绩等需要定义为数值型变量。

•SPSS关于数值型变量提供了五种不同的数据显示方法:

(1)标准型(Numeric)

(2)科学记数法型(Scientific Notation)

(3)逗号型(Comma)

(4)圆点型(Dot)

(5)美元符号型(Dollar)

其中的标准型( Numeric )是SPSS默认的变量类型。

默认的显示宽度为8位,小数位默认为2位。

(2)字符型(String)

•字符型也是SPSS较常用的变量类型,其变量取值由一个字符串(字母、汉字或数字)组成。字符型变量其取值不能够进行算术运算,如职工号码、姓名、地址、性别、职称等变量都可以定义为字符型。

•注意:字符型数据在SPSS命令处理过程中应用一对双引号括起来,但在输入数据时不应输入双引号,否则双引号将会作为字符型数据的一部分。

(3)日期型(Date)

•日期型数据用来表示日期或者时间,如生日、成立日期等变量可以定义为日期型数据。显示格式:dd-mmm-yyyy;mm/dd/yyyy等等,其中

•“dd”是用两位数来表示日期。“ddd”是用三位数来表示从元月一日算起的日数。

•“mm”是用数字表示的月份数。“mmm”是用英文月份单词的前三个字母表示的月份。

•“yy” 是用两位数来表示的年份。“yyyy” 是用四位数来表示的年份。

•“hh”表示小时;“mm”表示分;“ss”表示秒。

敬请期待下回讲解


添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
49.1742 7 2 关注作者 收藏

评论(0)


暂无数据

推荐课程