第节 Frequencies程
411 功
412 实例操作
第二节 Descriptives程
421 功
422 实例操作
第三节 Explore程
431 功
432 实例操作
第四节 Crosstabs程
441 功
442 实例操作
摘性分析原始数进行描述性分析统计工作出发点统计学系列基描述指标仅解资料特征启发作进步深入分析通调摘性分析诸程完成许统计学指标计量资料完成均数标准差标准误等指标计算计数等级资料完成构成率等指标计算χ2 检验章介绍操作方法
第节 Frequencies程
411 功
调程进行频数分布表分析频数分布表描述性统计中常方法外数分布趋势进行初步分析
412 实例操作
[例41]调查100名健康女学生血清总蛋白含量(g)表试作频数表分析
743 788 688 780 704 805 697 712 735 805
795 756 750 788 720 720 720 743 712 720
750 735 788 743 758 650 743 712 697 680
735 750 720 643 758 803 697 743 735 735
758 758 688 765 704 712 812 750 704 680
704 720 765 743 765 776 673 720 750 743
735 795 735 747 650 765 816 754 727 727
672 765 727 704 772 688 673 673 673 727
758 735 750 727 735 735 727 816 703 743
735 795 704 765 727 772 843 750 765 704
4121 数准备
激活数理窗口定义血清总蛋白含量变量名X然输入血清总蛋白含量原始数结果见图41
4122 统计分析
激活Statistics菜单选Summarize中Frequencies命令项弹出Frequencies话框(图42)现欲血清总蛋白含量值进行频数表分析话框左侧变量列表中选x点击钮进入Variable(s)框时点击Format钮弹出Frequencies:Format话框Order by栏中四选项:Ascending values根数值升序作频数分布Descending values根数值降序作频数分布Ascending counts根频数少升序少作频数分布Descending counts根频数少降序少作频数分布Page Formal栏中定义结果输出格式例选Ascending values项点击Continue钮返回Frequencies话框
点击Statistics钮弹出FrequenciesStatistics话框(图43)点击相应项目求系统作频数表分析基础附带作种统计指标描述特进行水百分位数计算例求计算四分位数(Quartiles)均数(Mean)中位数(Median)众数(Mode)总(Sum)标准差(Stddeviation)方差(Variance)全距 (Range)值(Minimum)值(Maximum)标准误(SEmean)偏度系数(Skewness)峰度系数(Kurtosis)选点击Continue钮返回Frequencies话框
点击Charts钮弹出FrequenciesCharts话框户选两种图形直条图(Bar chart)适非连续性变量直方图(Histogram)适连续性变量例求变量x绘制直方图选择Histogram项求绘制正态曲线(With normal curve)点击Continue钮返回Frequencies话框点击OK钮
4123 结果解释
输出结果窗口中统计数:
系统变量x原始数作频数分布表Value原始值Frequency频数Percent组频数占总例数百分Valid percent组频数占总例数效百分Cum Percent组频数占总例数累积百分
接着输出基统计指标中均数7366 标准误0039 中位数7350 众数7350 标准差0394 方差0155 峰度系数0034 峰度系数标准误0478 偏度系数006 偏度系数标准误0241 全距2000 值6430 值8430 25位数7120 50位数7350 75位数7580100观察值缺失值
系统输出带正态曲线直方图(图44)图中见数基呈现正态分布形状
述容知系统未特指定情形频数分布表原始数值逐作频数分布日常需等距分组组数保持8~15组求符调Frequencies程命令前先原始数进行算术处理:已知值6430值8430全距2000求分成10组起点64组距02选Transform菜单Recode项Into Different Variable命令项弹出Recode Into Different Variable话框中选x点击钮进入Numeric Variable®Output Variable框Output Variable栏Name处输入x1点击Change钮表示新生成变量名x1点击Old and New Values钮弹出Recode Into Different VariableOld and New Values话框Old value栏选Range项输入第分组数值范围:64~6599New value栏输入新值:64点击Add钮组范围应新值逐输入点击Continue钮返回Recode Into Different Variable话框点击OK钮完成系统原数库中生成新变量x1时调Frequencies程命令输出等距分组组数10频数分布表
第二节 Descriptives程
421 功
调程变量进行描述性统计分析计算列出系列相应统计指标原始数转换成标准Z分值存入数库谓Z分值指某原始数值均值高低少标准差单位高正值低负值相等零
422 实例操作
[例42]调查20名男婴出生体重(克)资料试作描述性统计
2770 2915 2795 2995 2860 2970 3087 3126 3125 4654
2272 3503 3418 3921 2669 4218 3707 2310 2573 3881
4221 数准备
激活数理窗口定义男婴出生体重变量名X然输入男婴出生体重原始数
4222 统计分析
激活Statistics菜单选Summarize中Descriptives命令项弹出Descriptives话框(图45)现欲男婴出生体重进行描述性分析话框左侧变量列表中选x点击钮进入Variable(s)框例求原始数转换成z分值选Save standardized value as variables项
点击Options钮弹出DescriptivesOptions话框(图46)框中指标意义请读者参阅章第节选项目点击 Continue钮返回Descriptives话框点击OK钮
4223 结果解释
结果输出窗口中统计数:均数3188450 标准误140681 标准差629146 方差395824997 峰度系数0118 峰度系数标准误0992 偏度系数0732 偏度系数标准误0512 全距2382000 值2272 值4654 效例数100缺失值
外系统zx变量名原始数转换成标准z分值存放原数库中(图47)例已知均数3188450 标准差629146原始值2770Z分值 066511原始值2770Z分值 110078新变量具均值0标准差1特征变量标准化程
第三节 Explore程
431 功
调程变量进行更深入详描述性统计分析称探索性统计般描述性统计指标基础增加关数特征文字图形描述显更加细致全面助户思考数进行进步分析方案
432 实例操作
[例43]表30名10岁少身高(cm)资料试作探索性分析
4321 数准备
激活数理窗口定义少身高变量名X然定义变质SEX作性分组序输入少身高原始数变量SEX中男孩输入1女孩输入2
4322 统计分析
激活Statistics菜单选Summarize中Explore项弹出Explore话框(图48)现欲少身高资料进行分组探索性分析话框左侧变量列表中选x点击钮进入Dependent List框选sex点击钮进入Factor List框
点击Statistics钮弹出ExploreStatistics话框(图49)选项:
1Descriptives:输出均数中位数众数5修正均数标准误方差标准差值值全距四分位全距峰度系数峰度系数标准误偏度系数偏度系数标准误
2Mestimators:作中心趋势粗略似然确定输出四权重似然确定数
3Outliers:输出五值五值
4Percentiles:输出第5102550759095位数
5Grouped Frequency tables:输出分组例数数值范围表
例全部选择点击Continue钮返回Explore话框
点击Plot钮弹出ExplorePlot话框(图410)Boxplot栏选Factor levels together项求组进行箱图绘制Descriptive栏选Stemandleaf项求作茎叶情形描述点击Continue钮返回Explore话框点击OK钮
4323 结果解释
结果输出窗口中统计数:
先输出男孩数15例缺失值均数1329中位数13265修正均数1330944均数95置信区间1300706~1327294标准误13192方差261043标准差51092值1214值1409全距195四分位全距68偏度系数04239偏度系数标准误05801峰度系数04961峰度系数标准误11209
接着输出四权重作中心趋势粗略似然确定数伴长拖尾称分布数带极端数值数粗略似然确定数代均数中位数结果更准确系统进行数茎叶情形描述系统指出男孩身高资料中数值茎12叶1实该数值1214四数值茎12叶8999实数值1292128219001293
接着输出百分位数:第5位数1214第10数12548第25位数1292第50位数1326第75位数136第90位数1406输出五数五数:五数14091404137413601358五数12141282129012921293
输出频数分布表
部分系统输出女孩资料分析结果意义述
外户求系统输出箱图图中方箱四分位数中心粗线中位数两端线值值
第四节 Crosstabs程
441 功
调程进行计数资料某等级资料列联表分析分析中二维n维列联表(RC表)资料进行统计描述χ2 检验计算相应百分数指标外计算四格表确切概率(Fisher’s Exact Test)单双侧( OneTail TwoTail)数似然检验(Likelihood Ratio)线性关系MantelHaenszelχ2 检验
442 实例操作
[例44]两组白鼠诱发鼻咽癌动物实验中组单纯亚硝胺鼻注组附加维生素B12 生癌率表问两组生癌率差?
动物分组
生癌鼠数
未生癌鼠数
合计
生癌率(%)
亚硝胺组
亚硝胺+B12组
52
39
19
3
71
42
732
929
合计
91
22
113
805
4421 数准备
激活数理窗口定义变量名:count频数变量(行列应频数值)group组变量(行)test试验结果变量(列)序输入相应变量(图412)
4422 统计分析
进行计数资料分析前应频数变量值进行加权处理先激活Data菜单 选Weight Cases项弹出Weight Cases话框选Weight cases by选变量count点击钮进入Frequence Variable框中点击OK钮完成加权
激活Statistics菜单选Summarize中Crosstabs项弹出Crosstabs话框(图413示)Crosstabs话框中选group点击钮进入Row(s)框选test点击钮进入Column(s)框点击Statistics钮弹出CrosstabsStatistics话框(图414) 中Chisquare读者熟悉χ2 检验实际研究中变量间赖强度特征需考虑χ2 值列联强度度量户根实际需选择相关指标:
1定距变量关联指标
Correlations:作列联表行列两变量Pearson相关系数作伴组秩次Spearman相关系数
2定类变量关联指标
Contingency coefficient:列联系数值 界0~1间中N总例数
Phi and Cramer's V:ψ系数 描述相关程度四格表χ2 检验中界1~1间RC表χ2 检验中界0~1间Cramer's V 界0~1间中k行数列数较实际数
Lambda:λ值变量预测中反映例缩减误差值1时表明变量预测应变量0时表明变量预测应变量差
Uncertainty coefficient:确定系数熵标准例缩减误差值接1时表明变量信息程度前变量值接0时表明变量信息前变量关
3定序变量关联指标
Gamma:γ值 P序子数Q异序子数界0~1间观察实际数集中左角右角时值1
Somers'D:Somers'D值 T独立变量存分偶中序子数超异序子数例
Kendall's taub:Kendall τ TV1变量序V2变量子数 TV2变量序V1变量子数Kendall τ值界1~1间
Kendall's tauc:Kendall τ m行数列数较实际数Kendall τ值界1~1间
4指标
Kappa:部致性系数
Eta:Eta值方值认应变量受素影响致方差例
Risk:相危险度
点击Cells钮弹出CrosstabsCells话框(图415)定义列联表单元格中需计算指标Observed实际观察数Expected理数Row行百分数Column列百分数Total合计百分数Raw实际数理数差值Standardized实际数理数差值理数Adj Standardized标准误确立单元格残差选择点击Continue钮返回Crosstabs话框点击OK钮
4423 结果解释
结果输出窗中系统先输出四格表资料包括实际观察数理数行百分数列百分数合计百分数
接着输入关统计数Pearson χ2值647766P值001092认亚硝胺+B12组生癌率较高校正χ2值528685P值002149MT检验χ2值 642034P值001128理数8177需作精确概率计算(果四格表中理频数5时Crosstabs命令会动进行Fisher精确概率计算)
部致性系数021731Pearson相关系数Spearman相关系数均023943
第组第二组相危险性RR值21%左右(021053)认第二组生癌相危险性第组475倍
文档香网(httpswwwxiangdangnet)户传
《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
该内容是文档的文本内容,更好的格式请下载文档