- 1. 第五章 市场调查的数据分析市场调查数据分析的基本方法
假设检验法
方差分析法
聚类分析法
判别分析法
- 2. 5.1 市场调查数据分析的基本方法频数、频率分析
数据集中趋势分析
算术平均数
中位数
众数
数据分散趋势分析
全距(极差)
四分位差
标准差
- 3. 5.1.1 频数、频率分析(1)例1:假设有样本数据ABCDEFGHIJ112214653322611223254334413314335413456424635352112114662634551322763662365118415336463495132522262103252341445
- 4. 5.1.1 频数、频率分析(2)
- 5. 5.1.1 频数、频率分析(3)
- 6. 5.1.2 算术平均数未分组数据的平均数计算
分组数据的平均数计算
上例的计算结果
- 7. 5.1.3 中位数的计算(1)未分组数据的中位数计算
对所有数据进行排序,当数据量为奇数时,取中间数为中位数,当数据量为偶数时,取最中间两位数的平均数为中位数。上例中数据量为100,是偶数,所以应取排序后第50位数和第51位数的平均值作为中位数。第50位数是3,第51位数也是3,所以中位数为3。
- 8. 5.1.3 中位数的计算(2)分组数据的中位数计算
下式中L为中位数所在组的下限值,fm为中位数所在组的组频数, Sm-1为至中位数组时累计总频数,h为组距。
- 9. 5.1.3 中位数的计算(3)例2:假设有分组数据如下(销售额单位为万元)年销售额组中值商店数目累计频数80-90853390-10095710100-1101051323110-120115528120-130125230合计30
- 10. 5.1.3 中位数的计算(4)依据公式
例2的中位数为
- 11. 5.1.4 众数的计算未分组数据的众数为出现次数最多的数。
分组数据的众数依据下式计算获得。
表达式中△1表示众数所在组与前一组的频数差,△2表示众数所在组与后一组的频数差。依据公式,例2分组数据的众数为104.29万元。
- 12. 5.1.5 全距(极差)的计算全距指的是样本数据中最大值与最小值之间的距离,因而也叫极差。例1中最小值为1,最大值为6,因而全距为6-1=5。
- 13. 5.1.6 四分位差的计算四分位差是一种按照位置来测定数据离散趋势的计量方法,它只取决于位于样本排序后中间50%位置内数据的差异程度。即第一个四分位与第三个四分位数据之间的差异。例2的四分位差计算过程如下
- 14. 5.1.7 标准差的计算(1)未分组数据的标准差计算
- 15. 5.1.7 标准差的计算(2)分组数据的标准差的计算
- 16. 5.2 市场调查数据的假设检验参数假设检验
U检验
t检验
非参数检验
- 17. 5.2.1 U检验当样本容量大于30时,可以采用U检验。
均值检验
百分比检验
双样本平均数差异的检验
双样本百分比差异的检验
- 18. 均 值 检 验(U)假设有
选取统计量
设定显著性水平 查表得到
根据U的计算结果,比较U的绝对值与 的大小。若有 则接
受H0,否则拒绝H0 。
- 19. 百 分 比 检 验(U)假设有
选取统计量
设定显著性水平 查表得到
根据U的计算结果,比较U的绝对值与 的大小。若有 则接
受H0,否则拒绝H0 。
- 20. 双样本平均数差异的检验(U)假设有
选取统计量
设定显著性水平 查表得到
根据U的计算结果,比较U的绝对值与 的大小。若有 则接
受H0,否则拒绝H0 。
- 21. 双样本百分比差异的检验(U)假设有
选取统计量
设定显著性水平 查表得到
根据U的计算结果,比较U的绝对值与 的大小。若有 则接
受H0,否则拒绝H0 。
- 22. 5.2.2 t检验当样本容量小于30时,不可以使用U检验,而需要使用t检验。
均值检验
均值差异的检验
百分比差异的检验
- 23. 均 值 检 验(t)假设有
选取统计量
设定显著性水平 查表得到
根据t的计算结果,比较t的绝对值与 的大小。若有
则接受H0,否则拒绝H0 。
- 24. 均值差异的检验(t)假设有
选取统计量
设定显著性水平 查表得到
根据t的计算结果,比较t的绝对值与 的大小。若有
则接受H0,否则拒绝H0 。
- 25. 百分比差异的检验(t)假设有
选取统计量
设定显著性水平 查表得到
根据t的计算结果,比较t的绝对值与 的大小。若有
则接受H0,否则拒绝H0 。
- 26. 5.2.3 非参数检验(X2)在市场调查中常获得一些量表数据,对量表数据求取平均数与方差都是毫无意义的。对量表数据的处理更适宜于采用非参数检验方法。非参数检验中常用的方法是X2检验。 X2检验的统计量是
上述统计量中, 表示第 类别在样本中实际出现的次数,表示期望出现的次数, 为类别数。
- 27. 5.3 市场调查的方差分析单因素方差分析
双因素方差分析
- 28. 5.3.1 单因素方差分析(1)单因素方差分析研究一个因素在不同水平下对研究对象影响的显著性。单因素方差分析的数据表如下:试验数试验水平A1A2…An1…2……………M…平均值…
- 29. 5.3.1 单因素方差分析(2)单因素方差分析的一般形式方差来源平方和自由度方差F组间方差组内方差方差总和
- 30. 5.3.1 单因素方差分析(3)单因素方差分析的数学计算表达式
- 31. 5.3.1 单因素方差分析(4)例试验点月销售量(吨)包装1包装2包装3115151921010123912164511165161217合计556080
- 32. 5.3.1 单因素方差分析(5)
- 33. 5.3.1 单因素方差分析(6)查表求得 的值。比较 与 的大小。若有 ,则认为因素无显著性影响。反之则认为影响较显著。本例中n=3, m=5。
- 34. 5.3.2 双因素方差分析(1)双因素方差分析分析两个同时存在的因素在不同水平状态下独立作用对分析对象的影响的显著性。双因素分析的常用数据表因 素 A行总计观察值A1A2…As因
素
BB1…B2…………………Br…列总计…
- 35. 5.3.2 双因素方差分析(2)双因素方差分析表方差来源平方和自由度方差F因素A因素B误差总计
- 36. 5.3.2 双因素方差分析(3)双因素方差分析的数学表达式
- 37. 5.3.2 双因素方差分析(4)例销 地销 量行总计包装A1包装A2包装A3B120192160B216151445B39101130B487621列总计535152156(总)
- 38. 5.3.2 双因素方差分析(5)
- 39. 5.3.2 双因素方差分析(6)
- 40. 5.3.2 双因素方差分析(7)查表求得 的值。比较 与 、 的大小。若有 ,则认为因素A无显著性影响;反之则认为影响较显著。若有 ,则认为因素B无显著性影响;反之则认为影响较显著。
- 41. 5.4 因子聚类分析距离聚类法
最短距离法
最长距离法
相关系数聚类法
- 42. 5.4.1 最短距离聚类法(1)计算样本间距离,并列出初始距离矩阵。
选取初始距离矩阵中的最小值,并对该值对应的样本进行类合并。
根据最小值原则计算新合并样本与其他样本之间的距离,列出新的距离矩阵。
重复上述步骤,直至所有样本被全部合并为一类。
- 43. 5.4.1 最短距离聚类法(2)例
假设有样本数据如下,请对样本进行分类。样本序号样本式样样本包装样本性能14442366363342455122
- 44. 5.4.1 最短距离聚类法(3)初始距离矩阵
- 45. 5.4.1 最短距离聚类法(4)
- 46. 5.4.2 最长距离聚类法(1)计算样本间距离,并列出初始距离矩阵。
选取初始距离矩阵中的最小值,并对该值对应的样本进行类合并。
根据最大值原则计算新合并样本与其他样本之间的距离,列出新的距离矩阵。
重复上述步骤,直至所有样本被全部合并为一类。
- 47. 5.4.2 最长距离聚类法(2)同上例
初始距离矩阵
- 48. 5.4.2 最长距离聚类法(3)
- 49. 5.4.3 相关系数聚类法(1)被聚类的对象 、 的相关系数可以由下式计算获得
- 50. 5.4.3 相关系数聚类法(2)样本相关系数表X1X2X3X4X5X6X7X1--0.530.470.380.680.530.64X20.53--0.600.480.650.700.42X30.470.60--0.670.570.440.52X40.380.480.67--0.360.780.50X50.680.650.570.36--0.590.62X60.520.700.440.780.59--0.52X70.640.420.520.500.620.52--
- 51. 5.4.3 相关系数聚类法(3) 找出每列中最大的相关系数X1X2X3X4X5X6X7X1--0.530.470.380.680.530.64X20.53--0.600.480.650.700.42X30.470.60--0.670.570.440.52X40.380.480.67--0.360.780.50X50.680.650.570.36--0.590.62X60.520.700.440.780.59--0.52X70.640.420.520.500.620.52--
- 52. 5.4.3 相关系数聚类法(4)找出各列最大相关系数中的最大值X1X2X3X4X5X6X7X1--0.680.64X2--X3--X40.67--0.78X50.68--X60.700.78--X7--
- 53. 5.4.3 相关系数聚类法(5)合并X2、 X3、 X4、 X6。
重复上述步骤,合并X1、 X5、 X7。X1X5X7X1--0.680.64X50.68--0.62X70.640.62--
- 54. 5.5 因子判别分析判别分析法的目的是判别给定样本是否属于假定的类型。判别分析法的核心是建立判别函数。常用的判别函数为多元线性判别函数。其形式如下
- 55. 5.5.1 判别函数的建立(1)例
假设有下列原始数据,请建立判别函数,判别假定的分组是否正确。产品各指标表相应评价值产品款式X1产品包装X2产品性能X3预定销售组A1987210743763464558666855预定销售组B75368243914510452
- 56. 5.5.1 判别函数的建立(2)第一步:计算A、B两组相应指标数据平均值
- 57. 5.5.1 判别函数的建立(3)第二步:计算组间平均值的差。
即有
- 58. 5.5.1 判别函数的建立(4)第三步:计算A、B两组资料的离差矩阵。
- 59. 5.5.1 判别函数的建立(5)第四步:计算离差矩阵CA、 CB的共变异矩阵。
- 60. 5.5.1 判别函数的建立(6)第五步:计算A、B两组资料的联合共变异矩阵。
- 61. 5.5.1 判别函数的建立(7)第六步:求联合共变异矩阵U的逆矩阵U-1。
- 62. 5.5.1 判别函数的建立(8)第七步:求判别方程的系数b。
- 63. 5.5.1 判别函数的建立(9)第八步:根据上述系数矩阵建立判别函数。
根据判别表达式可知:
产品款式对分组判别的影响最为显著,产品包装其次,而产品的性能对判别的影响不显著。
- 64. 5.5.1 判别函数的建立(10)第九步:求判别函数Yc临界值。
- 65. 5.5.1 判别函数的建立(11)第十步:判别分组的正确性。预分组别判别值实际组别预估准确性A2.4800A正确A2.6416A正确A1.8846A正确A1.6199A正确A2.1690A正确A2.1239A正确B1.3687B正确B0.6393B正确B0.4334B正确B1.1276B正确
- 66. 5.5.1 判别函数的建立(12)第十一步:判别检验。
故接受原假设。