文档库 最新最全的文档下载
当前位置:文档库 › 第3章 统计数据的描述与显示

第3章 统计数据的描述与显示

第3章 统计数据的描述与显示
第3章 统计数据的描述与显示

第三章统计数据的描述与显示

统计指标分三类、绝对指标、相对指标和平均指标

绝对指标反映客观事物的实际总量,

相对指标反映事物在不同时间、地点所形成的对比关系

平均指标反映同类事物数量特征的一般水平

第一节绝对指标与相对指标

一绝对指标

(一)绝对指标的意义和种类

反映社会、经济现象整体规模和水平的指标一般都以绝对数形式表示,称为绝对指标

绝对指标按时间特征分为时点指标和时期指标

时点指标反映现象在某一时刻的状态,如人数,银行存款余额等

时期指标指在一段时期的某一范围内变化总量如出生人口数、产品产量等

(二)绝对指标的计量单位

1实物单位2、价值单位3、劳动单位

二相对指标说明一个数值与另外一个数值之间相对比所形成的数量关系,其基本计算方法是两个绝对指标之比。

1、结构相对指标是部分与总体的同一指标之比,

2、比较相对指标是两个同类现象指标之比,可用倍数或者百分数表示

3、强度相对指标,是两个有联系但性质不同的指标之比,多数情况

下,其计算单位是复合型

4、动态相对指标,是同一事物不同时间的指标比

第二节集中趋势的测定

一、众数

是指在一个数据集合中出现次数最多的数

M0=L+△1/(△1+△2)*d

二中位数第(n+1)/2个 M e=L+∑f/2-S m-1/f m*d

三算数平均数

又称均值,是集中趋势最主要的测度值

四几何平均数

N个变量值连乘积的n次方根,通常用G表示

五平均思想是统计学的核心

平均是指客观事物的一般状况,狭义的平均大体通常说的集中趋势,概念相当,通过算数平均、几何平均、众数、中位数等常用方法而得到反映事物一般数量水平的平均数;广义的平均数则通过大量观察而得到的对事物的大体认识和对一般特征的把握。

在统计分析中就有大量的方法为了反映事物的一般水平

如算术平均数、序时平均数、相对数、弹性系数、相关系数、指数、回归方程等都是平均思想的提现

统计方法认识事物有2个前提。同质性和变异性。同质性主要靠平均方法提现

变异靠变异指标提现。

第三节离散程度的确定

一、极差成为全距数列最大值与最小值之差。

二平均差是数据值与算数平均差之差绝对值的平均数

三方差和标准差

方差是各变量值对均值离差的平方的平均数用σ代替

标准差是方差的平方根

四离散系数也称变异系数或标准差系数用来比较平均水平不同的两组数据的差异程度。

五成数标准差

第四节统计数据的显示

一、统计表

主要方法和形式用途:一是伴随文章支持文章中的观点,二是组织数据

组成部分:(1)表头、(2)表体(3)表尾

二、统计图

(一)条形图(二)线图(三)圆形图

描述统计与推断统计

描述统计与推断统计-心理学统计与测量经典习题1 第一章描述统计 名词解释 1.描述统计(吉林大学2002研) 答:描述统计主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。具体内容有:数据如何分组,如何使用各种统计表与统计图的方法去描述一组数据的分组及分布情况,如何通过一组数据计算一些特征数,减缩数据,进一步显示与描述一组数据的全貌。 2.相关系数(吉林大学2002研) 答:相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标。作为样本的统计量用r表示,作为总体参数一般用ρ表示。相关系数不是等距的度量值,因此在比较相关程度时,只能说绝对值大者比绝对值小者相关更密切一些,而不能进行加减乘除。 3.差异系数(浙大2003研) 答:差异系数,又称变异系数、相对标准差等,它是一种相对差异量,为标准差对平均数的百分比。其公式如下: 常用于:①同一团体不同观测值离散程度的比较;②对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。 4.二列相关(中科院2004研) 答:如果两列变量均属于正态分布,其中一列变量为等距或等比的测量数据,另一列变量虽然也是正态分布,但被人为地划分为两类。求这样两列变量的相关用二列相关。 5.集中量数与差异量数(浙大2000研,苏州大学2002研) 答:集中趋势和离中趋势是次数分布的两个基本特征。数据的集中趋势就是指数据分布中大量数据向某方向集中的程度,离中趋势是指数据分布中数据彼此分散的程度。用来描述一组数据这两种特点的统计量分别称为集中量数和差异量数。 6.中位数(南开大学2004研) 答:中位数,又称中点数,中数,是指位于一组数据中较大一半和较小一半中间位置的那个数,用Md或Mdn来表示。 7.品质相关(华东师大2002研)

第2章统计数据的描述

第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表; (3) 绘制一张条形图,反映评价等级的分布。 解:(1)由于表中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频数)频率% A1414 B2121 C3232 D1818

E1515 合计100100 (3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel练习题。即得到如下的条形图: 700716728719685709691684705718 706715712722691708690692707701 708729694681695685706661735665 668710693697674658698666696698 706692691747699682698700710722 694690736689696651673749708727 688689683685702741698713676702 701671718707683717733712683692 693697664681721720677679695691 713699725726704729703696717688 (1)利用计算机对上面的数据进行排序;

统计学第二章 统计数据的收集、整理与显示试题及答案

第二章统计数据的收集、整理与显示 二、单项选择题 1、人口普查的调查单位是(C )。 A、每一户 B、所有的户 C、每一个人 D、所有的人 2、对一批商品进行质量检验,最适宜采用的调查方法是(B )。 A、全面调查 B、抽样调查 C、典型调查 D、重点调查 3、下列调查中,调查单位与填报单位一致的是(D )。 A、企业设备调查 B、人口普查 C、农村耕畜调查 D、工业企业生产经营现状调查 4、抽样调查与重点调查的主要区别是(D )。 A、作用不同 B、组织方式不同 C、灵活程度不同 D、选取调查单位的方法不同 5、先对总体中的个体按主要标志加以分类,再以随机原则从各类中抽取一定的单位进行调查,这种抽样调查形式属于( D )。 A、简单随机抽样 B、等距抽样 C、整群抽样 D、类型抽样 6、对某省饮食业从业人员的健康状况进行调查,调查单位是该省饮食业的(D )。 A、全部网点 B、每个网点 C、所有从业人员 D、每个从业人员 7、调查时限是指(B )。 A、调查资料所属的时间 B、进行调查工作的期限 C、调查工作登记的时间 D、调查资料的报送时间 8、对某市全部商业企业职工的生活状况进行调查,调查对象是(B )。 A、该市全部商业企业 B、该市全部商业企业的职工 C、该市每一个商业企业 D、该市商业企业的每一名职工 9、作为一个调查单位(D )。 A、只能调查一个统计标志 B、只能调查一个统计指标 C、可以调查多个统计指标 D、可以调查多个统计标志 10、某市规定2018年工业经济活动成果年报呈报时间是2019年1月31日,则调查期限为( B )。 A、一天 B、一个月 C、一年 D、一年零一个月 11、统计分组对总体而言是( B ) A、将总体区分为性质相同的若干部分 B、将总体区分为性质不同的若干部分 C、将总体单位区分为性质相同的若干部分 D、将总体单位区分为性质不相同的若干部分 12、按某一标志分组的结果表现为( B )

第三章 调查数据的描述分析

第三章调查数据的描述分析 对整理后的调查数据进行统计分析,首先是认识数据的特征。由于指标是描述总体数量特征的具体表现,故调查数据特征的认识表现为指标的设计与计算。设计什么样的指标取决于所要认识的数据特征。本章讨论的数据特征主要有三个方面,即数据间的数量关系特征、数据分布的集中趋势特征和离中趋势特征,相应地,设计的指标有三类,分别为相对指标、平均指标和变异程度指标。这些指标的计算和运用构成了本章的主要内容。 第一节相对指标分析 一、相对指标的概念与作用 将两个有联系的数据值进行对比形成的相对数,称为相对指标,它反映着事物内部或事物间的数量关系特征。例如:将实际完成的数值与计划任务数值对比,可反映计划执行的进度和完成的程度;将不同时间上的同类数据值对比,可反映现象变化的快慢程度,等等。 > 相对指标通过对比不同数据值,将现象总体数量上的绝对差异抽象化,从而使那些由于规模不同,条件不同,无法直接对比的现象找到可比较的基础,化不可比为可比。从这个意义上讲,相对指标在统计分析中的运用主要表现在比较分析中。 多数相对指标采用无名数如系数、倍数、成数、百分数、千分数等表示;但也有相对指标采用名数表示,如流动资金周转率指标用“次”表示。 二、常用相对指标及其计算方法 (一)反映数据结构特征的相对指标

1.结构相对指标 结构相对指标,是总体的部分数值与总体全部数值的比值,需在数据值分组的基础上计算,通常又称为比重,习惯用百分数表示。其计算公式为: %100?= 总体的全部数值 总体的各组数值 结构相对指标 【例】某一项城市住房问题的研究中,调查数据值统计整理如表3-1所示: 表3-1 甲城市家庭对住房状况的评价 应该注意到,同一总体各组的结构相对数值之和等于100%。 在调查数据的分析中,结构相对指标除了能够反映总体内部的结构状态特征,揭示事物的性质外,还可用来说明总体中各个部分对总体的影响程度,即可以用来寻找主要影响因素。 ( 2.比例相对指标 比例相对指标,是同一总体内某一部分数值与另一部分数值的比值,也是在数据分组的基础上计算。如果说结构相对指标反映的是部分与整体的数量关系,那么,比例相对指标反映的则是部分与部分间的数量关系。比例相对指标的计算公式为: 总体中另一部分数值 总体中某一部分数值 比例相对指标= 比例相对指标既可用百分数表示,也可用一比几或几比几的形式表示。

Excel 在描述统计中的应用

第三节Excel 在描述统计中的应用 在使用Excel 进行数据分析时,要经常使用到Excel 中一些函数和数据分析工具。其中,函数是Excel 预定义的内置公式。它可以接受被称为参数的特定数值,按函数的内置语法结构进行特定计算,最后返回一定的函数运算结果。例如,SUM 函数对单元格或单元格区域执行相加运算,PMT 函数在给定的利率、贷款期限和本金数额基础上计算偿还额。函数的语法以函数名称开始,后面是左圆括号、以逗号隔开的参数和右圆括号。参数可以是数字、文本、形如TRUE 或FALS E 的逻辑值、数组、形如#N/A 的错误值,或单元格引用。给定的参数必须能产生有效的值。参数也可以是常量、公式或其它函数。 Excel 还提供了一组数据分析工具,称为“分析工具库”,在建立复杂的统计分析时,使用现成的数据分析工具,可以节省很多时间。只需为每一个分析工具提供必要的数据和参数,该工具就会使用适宜的统计或数学函数,在输出表格中显示相应的结果。其中的一些工具在生成输出表格时还能同时产生图表。如果要浏览已有的分析工具,可以单击“工具”菜单中的“数据分析”命令。如果“数据分析”命令没有出现在“工具”菜单上,则必须运行“安装”程序来加载“分析工具库”。安装完毕之后,必须通过“工具”菜单中的“加载宏”命令,在“加载宏”对话框中选择并启动它。

一、描述统计工具 (一)简介:此分析工具用于生成对输入区域中数据的单变量分析,提供数据趋中性和易变性等有关信息。 (二)操作步骤: 1.用鼠标点击工作表中待分析数据的任一单元格。 2.选择“工具”菜单的“数据分析”子菜单。 3.用鼠标双击数据分析工具中的“描述统计”选项。 4.出现“描述统计”对话框,对话框内各选项的含义如下:输入区域:在此输入待分析数据区域的单元格范围。一般情况下Excel 会自动根据当前单元格确定待分析数据区域。分组方式:如果需要指出输入区域中的数据是按行还是按列排列,则单击“行”或“列”。 标志位于第一行/列:如果输入区域的第一行中包含标志项(变量名),则选中“标志位于第一行”复选框;如果输入区域的第一列中包含标志项,则选中“标志位于第一列”复选框;如果输入区域没有标志项,则不选任何复选框,Excel 将在输出表中生成适宜的数据标志。 均值置信度:若需要输出由样本均值推断总体均值的置信区间,则选中此复选框,然后在右侧的编辑框中,输入所要 使用的置信度。例如,置信度95%可计算出的总体样 本均值置信区间为10,则表示:在5%的显著水平下总 体均值的置信区间为( X -10, X +10)。

第二章数据收集、整理与显示

第二章数据搜集、整理与显示 Ⅰ.学习目的 本章阐述统计数据搜集、整理与显示的理论与方法,通过学习,要求: 1.了解统计数据的类型及其搜集方法; 2.了解普查、统计报表、抽样调查、重点调查等各种统计调查组织形式的特点及其适用场合; 3.掌握统计分组方法;4能够编制分布数列;5.能够运用各种统计图表。 Ⅱ.课程内容要点 第一节数据的搜集 一、数据搜集 数据是人们对现象进行调查研究所搜集、整理、分析和解释的事实和数字,是对客观现象进行计量的结果。 数据搜集就是根据统计研究预定的目的和任务,运用相应的科学的调查方法与手段,有计划、有组织地搜集资料的过程。 数据的计量尺度有四种 定类尺度是按照某种属性对客观事物进行平行分类或分组的一种测度,定类尺度的值是以文字表述的,可以用数值标识,但仅起标签作用。 定序尺度是把各类事物按一定特征的大小、高低、强弱等顺序排列起来,构成定序数据。它是对事物之间等级或顺序差别的一种测度。定序尺度不仅可以测度类别差,还可以测度次序差,并可比较大小,但其序号仍不能进行加减乘除计算。 定距尺度是对事物类别或次序之间间距进行的一种测度。定距尺度不仅

能区分事物的类别、进行排序、比较大小,而且可以精确地计量大小的差异,可以进行加减运算,没有绝对零点。 定比尺度是对事物之间比值的一种测度,定比尺度能区分类别、排序、比较大小、求出大小差异、可采用加减乘除运算,具有绝对零点。 从不同方面数据划分为不同类型。 根据数据反映的现象的特征不同,可以归结为两类:品质数据(亦称定性数据)和数量数据(亦称定量数据)。品质数据是由定距尺度和定比尺度计量所形成的数据,数量数据是由定距尺度和定比尺度计量所形成的数据。 根据数据反映的现象的时间不同,可以将数据分为横截面数据和时间序列数据。横截面数据是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。时间序列数据是指在不同时间对同一总体的数量表现进行观察而获得的数据。 根据数据的搜集方法,可以将数据分为观察数据和实验数据。 根据数据的来源渠道,可以将数据分为直接数据和间接数据。 二、数据搜集的方法 数据搜集的方法有直接观察法、报告法(通讯法)、采访法、登记法和实验设计调查法。 三、统计调查的形式 普查是一种非经常性的全面调查,通过普查可以掌握大量、详细、全面的资料。 统计报表制度是依照国家有关法规自上而下地统一布置,按照统一的表式、统一的项目、统一的报送时间和程序,自下而上地逐级地定期地提供统计资料的一种调查方式。 抽样调查是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据所获得的样本数据,对调查对象总体特征作出科学推断。 重点调查是在调查对象中,只选择一部分重点单位进行的非全面调查。重点调查的前提是必须存在重点单位。 典型调查是从众多的调查研究对象中,有意识地选择若干个具有代表性的典型单位进行深入、周密、系统地调查研究。典型调查有解剖麻雀型和划类选典型两种类型。

第四章统计数据的描述

第四章统计数据的描述 (一)判断题 1、以最低限度为任务提出的计划指标,计划完成程度以不超过100%为好。() 2、全国人均国民生产总值,属于强度相对数。() 3、标志总量是指总体单位某一数量标志值的总和。() 4、在计算相对指标时,分子、分母可以互换的相对指标唯一只有强度相对数。() 5、某企业工人劳动生产率,计划提高5%,实际提高10%,则劳动生产率的计划完成程度为%。() 6、权数的实质是各组单位数占总体单位数的比重。() 7、在算术平均数中,若每个变量值减去一个任意常数a,等于平均数减去该数a。() 8、各个变量值与其平均数离差之和可以大于0,可以小于0,当然也可以等于0。() 9、各个变量值与任意一个常数的离差之和可以大于0,可以小于0,当然也可以等于0。 () 10、各个变量值与其平均数离差的平方之和一定等于0。() 11、各个变量值与其平均数离差的平方之和可以等于0。() 12、各个变量值与其平均数离差的平方之和为最小。() 13、已知一组数列的方差为9,离散系数为30%,则其平均数等于30。() 14、交替标志的平均数等于P。() 15、对同一数列,同时计算平均差和标准差,两者数值必然相等。() 16、平均差和标准差都表示标志值对算术平均数的平均距离。() 17、某分布数列的偏态系数为,说明它的分布曲线为左偏。() (二)单项选择题 1、某种商品的年末库存额是()。 A. 时期指标和实物指标

B. 时点指标和实物指标 C. 时期指标和价值指标 D. 时点指标和价值指标 2、绝对指标的基本特点是计量单位都是() A. 无名数 B. 有名数 C. 复名数 D. 无名数和有名数 3、相对指标数值的表现形式有() A. 无名数 B. 有名数 C. 复名数 D. 无名数和有名数 4、相对指标数值的大小() A. 随总体范围扩大而增大 B. 随总体范围扩大而减小 C. 随总体范围缩小而减小 D. 与总体范围大小无关 5、人口自然增长率,属于() A. 结构相对数 B. 比较相对数 C. 强度相对数 D. 比例相对数 6、平均数反映了总体分布的()。 A. 集中趋势 B. 离中趋势 C. 长期趋势

统计学答案第3章

二、选择题 1 落在某一特定类别或组中的数据个数称为()。 A.频数 B.频率 C.频数分布表 D.累积频数 2 一个样本或总体中各个部分的数据与全部数据之比称为()。 A.频数 B.频率 C.比例 D.比率 3 样本或总体中各不同类别数值之间的比值称为()。 A.频数 B.频率 C.比例 D.比率 4 将比例乘以100得到的数值称为()。 A.频率 B.百分数 C.比例 D.比率

5 下面的哪一个图形最适合于描述结构性问题()。 A.条形图 B.饼图 C.雷达图 D.直方图 6 下面的哪一个图形适合于比较研究两个或多个样本或总体的结构性问题()。 A.环形图 B.饼图 C.直方图 D.茎叶图 7 将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为()。 A.单变量值分组 B.组距分组 C.等距分组 D.连续分组 8 组中值是()。 A.一个组的上限与下限之差 B.一个组的上限与下限之间的中点值 C.一个组的最小值 D.一个组的最大值

9 下面的图形中最适合描述一组数据分布的图形是()。 A.条形图 B.箱线图 C.直方图 D.饼图 10 对于大批量的数据,最适合描述其分布的图形是()。 A.条形图 B.茎叶图 C.直方图 D.饼图 11 对于小批量的数据,最适合描述其分布的图形是()。 A.条形图 B.茎叶图 C.直方图 D.饼图 12 对于时间序列数据,用于描述其变化趋势的图形通常是()。 A.条形图 B.直方图 C.箱线图 D.线图 13 为描述身高与体重之间是否有某种关系,适合采用的图形是()。 A.条形图 B.对比条形图 C.散点图 D.箱线图

统计数据的整理和显示习题

第三章统计数据的整理和显示习题 一、填空题 1.统计数据分组的关键在于。 2.一般说来,统计分组具有三方面的作用:(1) ;(2);(3)。 3.根据分组标志的不同,统计分组可以有分组和分组。 4.按每个变量值分别列组所编制的变量分布数列叫,其组数等于。 5.在组距式数列中,表示各组界限的变量值叫。各组中点位置上的变量值叫。 6.组距式变量数列,根据各组的组距是否相等可以分为和。 7.已知一个数列最后一组的下限为900,其相邻的组中值为850,则最后一组的上限和组中值分别为和。 8.统计资料的表现形式主要有和。 9.从形式上看,统计表主要由、、和四部分组成;从内容上看,统计表由和两部分组成。 10.统计数据整理就是对搜集得到的进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的的工作过程。 11.数据的预处理是数据整理先行步骤,它是在对数据分类或分组之前对和所做的必要处理,包括对数据的、和。 12.直方图是用——的宽度和高度来表示频数分布的图形。 13.雷达图是一种的图示方法。 二、单项选择题 1.统计分组的关键问题是( ) A确定分组标志和划分各组界限B确定组距和组数 C确定组距和组中值D确定全距和组距 2.要准确地反映异距数列的实际分布情况,必须采用( ) A次数B累计频率C频率D次数密度 3.按品质标志分组,分组界限的确定有时会发生困难,这是由于( ) A组数较多B标志变异不明显C两种性质变异间存在过渡形态D分组有粗有细4.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( ) A260 B 215 C 230 D 185 5.下列分组中按品质标志分组的是( ) A人口按年龄分组B产品按质量优劣分组 C企业按固定资产原值分组D乡镇按工业产值分组 6.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于( ) A简单分组B平行分组C复合分组D再分组 7.用组中值代表各组内的一般水平的假定条件是( ) A各组的次数均相等B各组的组距均相等 C各组的变量值均相等D各组次数在本组内呈均匀分布 8.对统计总体按两个及以上标志分组后形成的统计表叫( ) A简单表B简单分组表C复合分组表D汇总表 9.对某地区的全部商业企业按实现的销售额多少进行分组,这种分组属于( )

统计学第三章练习题

第三章数据分布特征的描述 一、填空题 3.1.1 是指一组数据向其中心值靠拢的倾向。 3.1.2 加权算术平均数受两个重要因素的影响,一个是;另一个是各组变量值出现的。 3.1.3 计算比率的平均数时,如果已知比率及其基本计算式的分母资料,则采用。 3.1.4 计算比率的平均数时,如果已知比率及其基本计算式的分子资料,则采用。 3.1.5 是计算平均比率或平均发展速度最适用的一种方法。 3.1.6 是指一组数据中出现次数最多的变量值。 3.1.7 是指将按大小顺序排列的一组数据划分为四等分的三个变量值。 3.1.8 是指将按大小顺序排列的一组数据划分为10等分的9个变量值。 3.1.9 在数据分布呈时,算术平均数、众数和中位数三者相等。 3.1.10 是指非众数组的频数占总频数的比率。 3.1.11 上四分位数与下四分位数之差的简单算术平均数称为。 3.1.12 各个变量值与其算术平均数离差的绝对值的平均数称为。 表 3.1.13 总体方差是各个数据与其的离差平方的平均数,通常以2示。 3.1.14 皮尔逊测度法就是利用算术平均数与众数的关系来测度数据分布的一种方法。 3.1.15 是指用标准差的三次方除三阶中心矩计算偏态系数的一种方法。 二、单项选择题(在每小题的3个备选答案中选出1个正确答案,并将其字母填在题干后面的括号内。) 3.2.1 先将一组数据的变量值按一定顺序排列,然后取某一位置的变量值来反映这些数据的一般水平,把这个特殊位置上的数值看作是平均数,称为()A.数值平均数B.位置平均数C.离散系数 3.2.2 算术平均数反映的是数据分布的什么特征

A .集中趋势 B .离散趋势 C .偏态趋势 3.2.3 根据算术平均数的性质,下列表达式正确的是 ( ) A .0)(=∑-f x x B . 0x x f -=? C .2()0x x f -=? 3.2.4 如果分布数列中各变量值呈几何级数变化或频率分布极不对称,计算平均数的常用方法是 ( ) A .算术平均法 B .几何平均法 C .调和平均法 3.2.5 用各组的组中值代表其实际数据计算算术平均数时,通常假定 ( ) A .各组数据在组内是均匀分布的 B .各组次数相等 C .各组数据之间没有差异 3.2.6 当数据分布为右偏分布时,算术平均数与中位数、众数的关系表现为 ( ) A .o e M M x << B .e o x M M << C .o e x M M << 3.2.7 离散程度测度指标中,受极端值影响最大的是 ( ) A .平均差 B .标准差 C .全距 3.2.8 平均差与标准差的主要区别在于 ( ) A .说明问题的角度不同 B .对离差的数学处理方法不同 C .计算对象不同 3.2.9 标准差系数消除了 ( ) A .总体单位数多少的影响 B .平均数大小和计量单位的影响 C .离散程度的影响 3.2.10 直接使用标准差比较分析两个同类总体平均数的代表性,其前提条件是 ( ) A .两个总体的标准差应该相等 B .两个总体的平均数应该相等 C .两个总体的离差平方和应该相等 3.2.11 下列指标中,实际应用最广泛的离散程度测度指标是 ( ) A .平均差 B .标准差 C .离散系数 3.2.12 皮尔逊测度法就是利用算术平均数与众数的关系来测度数据分布的

第3章数据分布特征的统计描述习题

1 第三章 数据分布特征的统计描述 思考与练习 一、选择题 1.有n 辆汽车在同一距离的公路上行驶的速度资料,确定汽车平均每小时行驶速度的平均数公式是:( C ) A . n x ∑B .∑∑f xf C .∑x n 1D .∑∑x m m 2.权数对加权算术平均数的影响,取决于(B ) A. 权数所在组标志值的大小; B. 权数的大小; C. 各组单位数的多少; D. 总体单位数的多少 3.是非标志不存在变异时,意味着:(B ,C ) A. 各标志值遇到同样的成数; B. 所有单位都只具有某种属性 C. 所计算的方差为0; D. 所计算的方差为0.25 4.能够综合反映总体各个单位标志值的差异,对总体标志变异程度作全面客观评定的指标有(A ,C ) A.方差 B.算术平均数 C.标准差 D.全距 二、判断题 1.甲乙两地,汽车去程时速20公里,回程时速30公里,其平均速度为25公里。 [答]错。本题应采用调和平均法计算平均速度。 2.权数起作用的前提是各组的变量必须互有差异。 [答]对。 3.变量同减某个数再同除于另一数然后求其方差,其方差等于原方差乘于除数的平方。 [答]对。 4.与平均数相比,中位数比较不受极端值的影响。 [答]对。 三、计算题 1.甲乙两企业生产三种产品的单位成本和总成本资料如下表,试比较哪个企业的平均成本高,并分析其原因。 [解] 甲企业的平均成本210030001500660019.4118210030001500340 152030 ++= ==++

乙企业的平均成本 3255150015006255 18.2895 325515001500342 152030 ++ === ++ 由上面的计算得知,甲企业的平均成本高于乙企业。 因为乙企业单位成本低的A产品生产的数量多,占总成本一半以上,即成本低的产品相对权数大,而甲企业生产单位成本低的A产品数量少,仅占总成本的31.8%(=2100/6600)。由于权数的作用,乙企业的平均成本低于甲企业。 2.甲、乙两市场农产品价格及成交量资料如下表,试比较哪个市场的平均价格高,并分析其原因。 [解] 甲市场的平均价格 1.2 2.8 1.5 5.5 1.375 1.2 2.8 1.54 1.2 1.4 1.5 ++ === ++ 乙市场的平均价格 1.22 1.41 1.51 5.3 1.325 44 ?+?+? === 由上面的计算得知,甲市场农产品的平均价格高高于乙市场。 因为价格低的甲产品在甲市场成交额少,仅占21.8%(=1.2/5.5);而在乙市场的成交额大,占45.3%(=2.4/5.3),由于权数的作用,甲市场的平均价格高于乙市场。 3.某企业工人平均月工资为1440元,月收入少于1280元的占一半,试估计众数,并对该企业工人工资的分布情况做一简要说明。 [解] 由题中可知,企业工人月工资的中位数=1280 所以众数≈1440-3×(1440-1280)=960 所以众数<中位数<平均数,则该企业的月工资分布为右(正)偏,说明该企业工人的月工资分布中出现极大值,即出现有人拿到高额的工资,导致月工资分布呈右偏。 4.某城市对3000户居民户均月消费支出进行调查,得到下表资料。

数据的统计描述和分析

第十章 数据的统计描述和分析 数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计是以概率论为基础的一门应用学科。 数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息的数值来体现数据样本总体的规律。描述性统计就是搜集、整理、加工和分析统计数据,使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。它是统计推断的基础,实用性较强,在统计工作中经常使用。 面对一批数据如何进行描述与分析,需要掌握参数估计和假设检验这两个数理统计的最基本方法。 我们将用Matlab 的统计工具箱(Statistics Toolbox)来实现数据的统计描述和分析。 §1 统计的基本概念 1.1 总体和样本 总体是人们研究对象的全体,又称母体,如工厂一天生产的全部产品(按合格品及废品分类),学校全体学生的身高。 总体中的每一个基本单位称为个体,个体的特征用一个变量(如x )来表示,如一件产品是合格品记0=x ,是废品记1=x ;一个身高170(cm )的学生记170=x 。 从总体中随机产生的若干个个体的集合称为样本,或子样,如n 件产品,100名学生的身高,或者一根轴直径的10次测量。实际上这就是从总体中随机取得的一批数据,不妨记作n x x x ,,,21 ,n 称为样本容量。 简单地说,统计的任务是由样本推断总体。 1.2 频数表和直方图 一组数据(样本)往往是杂乱无章的,作出它的频数表和直方图,可以看作是对这组数据的一个初步整理和直观描述。 将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一个阶梯形的图,称为直方图,或频数分布图。 若样本容量不大,能够手工作出频数表和直方图,当样本容量较大时则可以借助Matlab 这样的软件了。让我们以下面的例子为例,介绍频数表和直方图的作法。 例1 学生的身高和体重

第三章、统计数据的简单描述

第三章、统计数据的简单描述 一、单项选择题(在每小题的四个备选答案中,选出一个正确答案) 1. 在总量指标中,综合性最强的统计指标是()。 A. 实物指标 B. 价值指标 C. 劳动量指标 D. 标准实物量指标 2.“某年中国人均收入是美国人均收入的1/3”,这一指标是()。 A. 平均指标 B.比例相对指标 C.比较相对指标 D.强度相对指标 3. 我国国有工业企业产值占全部工业产值的比重,这一指标是()。 A. 结构相对指标 B. 比例相对指标 C. 比较相对指标 D. 动态相对指标 E. 强度相对指标 4. 我国1999年的税收收入是20年前的5倍,这一指标是()。 A. 结构相对指标 B. 比例相对指标 C. 比较相对指标 D. 动态相对指标 E. 强度相对指标 5. 某厂1996年完成产值2000万元,1997年计划增长10%,实际完成2310万元,超额完成计划()。 A. 5.5% B. 5% C. 115.5% D. 15.5% 6. 将比较的基数确定为10,计算出来的相对数是()。 A. 系数 B. 成数 C. 百分数 D. 千分数 E. 倍数 7. 以一个企业为总体,该企业报告期职工人数200人,全年工资总额2500万元,则()。 A.企业职工人数是总体标志总量,工资总额是总体单位总量 B.企业职工人数是总体单位总量,工资总额也是总体单位总量 C.企业职工人数是总体标志总量,工资总额也是总体标志总量 D.企业职工人数是总体单位总量,工资总额是总体标志总量 8. 在相对指标中,用有名数形式表现的统计指标是()。 A. 结构相对指标 B. 比例相对指标 C. 比较相对指标 D. 动态相对指标 E. 强度相对指标 9.在总量指标中,指标数值与时间长短直接相关的是() A. 时期指标 B. 时点指标 C. 平均指标 D. 相对指标 10. 某地区2008年年平均人数为1000万人,商业零售企业4000个,则商业网点密度指标为()

第三章 统计数据的描述习题

一、单项选择题 反映社会经济现象发展总规模、总水平的综合指标是()。 A、质量指标 B、总量指标 C、相对指标 D、平均指标 总量指标按反映时间状况的不同,可分为()。 A、数量指标和质量指标 B、时期指标和时点指标 C、总体单位总量和总体标志总量 D、实物指标和价值指标 由反映总体各单位数量特征的标志值汇总得出的指标是()。 A、总体单位总量 B、总体标志总量 C、质量指标 D、相对指标 反映不同总体中同类指标对比的相对指标是()。 A、结构相对指标 B、比较相对指标 C、强度相对指标 D、计划完成程度相对指标 计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()。 A.小于100% B.大于100% C.等于100% D.小于或大于100% 下列相对数中,属于不同时期对比的指标有()。 A、结构相对数 B、动态相对数 C、比较相对数 D、强度相对数 7、权数对算术平均数的影响作用,实质上取决于()。 A.作为权数的各组单位数占总体单位数比重的大小 B.各组标志值占总体标志总量比重的大小 C.标志值本身的大小 D.标志值数量的多少 8、对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算各自的()来比较。 A.标准差系数 B.平均差 C.全距 D.均方差 9、某企业2003年完成产值2000万元,2004年计划增长10%,实际完成2310万元,计划完成程度相对数为()。 A、105.5% B、105% C、115.5% D、15.5% 10、在什么条件下,简单算术平均数和加权算术平均数计算结果相同()。 A、权数不等 B、权数相等 C、变量值相同 D、变量值不同

数据的统计描述和分析

第十章数据的统计描述和分析 数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计是以概率论为基础的一门应用学科。 数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息的数值来体现数据样本总体的规律。描述性统计就是搜集、整理、加工和分析统计数据,使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。它是统计推断的基础,实用性较强,在统计工作中经常使用。 面对一批数据如何进行描述与分析,需要掌握参数估计和假设检验这两个数理统计的最基本方法。 我们将用Matlab的统计工具箱(Statistics Toolbox)来实现数据的统计描述和分析。 § 1 统计的基本概念 1.1总体和样本 总体是人们研究对象的全体,又称母体,如工厂一天生产的全部产品(按合格品及废品分类),学校全体学生的身高。 总体中的每一个基本单位称为个体,个体的特征用一个变量(如x)来表示,如 一件产品是合格品记X =0,是废品记x =1;一个身高170(cm)的学生记X = 170。 从总体中随机产生的若干个个体的集合称为样本,或子样,如n件产品,100名 学生的身高,或者一根轴直径的10次测量。实际上这就是从总体中随机取得的一批数 据,不妨记作x1,x2 ,L ,x n,n称为样本容量。 简单地说,统计的任务是由样本推断总体。 1.2频数表和直方图 一组数据(样本)往往是杂乱无章的,作出它的频数表和直方图,可以看作是对这组数据的一个初步整理和直观描述。 将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一个阶梯形的图,称为直方图,或频数分布图。 若样本容量不大,能够手工作出频数表和直方图,当样本容量较大时则可以借助Matlab这样的软件了。让我们以下面的例子为例,介绍频数表和直方图的作法。 例1学生的身高和体重 学校随机抽取100名学生,测量他们的身高和体重,所得数据如表 身高体重身高体重身高体重身高体重身高体重 172 75 169 55 169 64 171 65 167 47 171 62 168 67 165 52 169 62 168 65 166 62 168 65 164 59 170 58 165 64 160 55 175 67 173 74 172 64 168 57 155 57 176 64 172 69 169 58 176 57 173 58 168 50 169 52 167 72 170 57 166 55 161 49 173 57 175 76 158 51 170 63 169 63 173 61 164 59 165 62 167 53 171 61 166 70 166 63 172 53 173 60 178 64 163 57 169 54 169 66 178 60 177 66 170 56 167 54 169 58 173 73 170 58 160 65 179 62 172 50

第2章统计数据的描述

第二章统计数据的描述 一、单项选择题 1.下列中,最粗略、计量层次最低的计量尺度是() A.间隔尺度 B.顺序尺度 C.比例尺度 D.列名尺度 2.将全国人口按“民族”划分为汉、白、彝、回、藏…..,这里使用的计量尺度是() A.比例尺度 B.列名尺度 C.间隔尺度 D.顺序尺度 3.某个人对某一事物的态度可以划分为非常同意、同意、保持中立、不同意、非常不同意,这里使用的计量尺度是() A.列名尺度 B.间隔尺度 C.顺序尺度 D.比例尺度 4.下列中,计量层次的最高、最精确的计量尺度是() A.比例尺度 B.间隔尺度 C.顺序尺度 D.列名尺度 5.下列调查方式中,只能调查一些最基本、最一般现象的调查方式是() A.抽样调查 B.重点调查和典型调查 C.统计报表 D.普查 6.实际中应用最为广泛的一种调查方式是() A.重点调查 B.统计报表 C.普查 D.抽样调查 7.某城市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是() A.抽样调查 B.典型调查 C.重点调查 D.普查 8.一次性调查是指() A.只做过一次的调查 B.调查一次以后不再调查 C.间隔一段时间在进行一次调查 D.只隔一年就进行一次的调查 9.在统计分析中,对累积的次数分配用得最直接的是() A.供给曲线 B.需求曲线 C.洛伦茨曲线 D.边际需求曲线 10.专门用来衡量和反映收入分配平均程度的统计指标是() A.基尼系数 B.可决系数 C.相关系数 D.离散系数 11.一般认为,基尼系数在()之间是比较恰当的。

A.0.1— —0.4 C.— —0..8 12.一般认为,基尼系数等于( )是收入分配不公平的警戒线。 A.0.2 B.0.6 C. 利用公式计算众数的基本假定之一是众数组的频数在该组内呈( ) A.正态分布 分布 C.均匀分布 D.偏态分布 14.计算中位数时,假定中位数所在组的频数在该组内呈( ) A.左偏分布 B.正态分布 C.右偏分布 D.均匀分布 15.反映数据分布集中趋势的最主要的测度值是( ) A.众数 B.中位数 C.均值 D.几何平均数 16.各个变量值与均值的离差之和( ) A.大于0 B.小于0 C.等于0 D.等于一个不为0的常数 17.各个变量值与均值的离差平方和( ) A.为最大 B.为最小 C.为0 D.为一个不为0的常数 18.下列中,专门用来衡量众数代表性大小的离散程度测度值是( ) A.异众比率 B.四分位差 C.方差或标准差 D.极差 19.下列中,专门用来衡量中位数代表性大小的离散程度测度值是( ) A.方差和标准差 B.内距 C.异众比率 D.平均差 20.下列中,适用于列名数据的集中趋势测度值是( ) A.众数 B.中位数 C.均值 D.几何均值 21.描述数据离散程度最简单的测度值是( ) A.平均差 B.方差和标准差 C.极差 D.四分位差 22.经验法则表明,当一组数据呈对称分布时,大约有95%的数据在( )范围之内。 A.σ±X B.σ2±X C.σ3±X D.σ4±X 23.用来对两组数据的差异程度进行比较的统计分析指标是( ) A.基尼系数 B.标准差系数 C.相关系数 D.可决系数 24.测定数据分布偏斜程度需要计算( )

第3章 数据分布特征的统计描述习题

第三章 数据分布特征的统计描述 思考与练习 一、选择题 1.有n 辆汽车在同一距离的公路上行驶的速度资料,确定汽车平均每小时行驶速度的平均数公式是:( C ) A . n x ∑ B .∑∑f xf C .∑x n 1 D .∑∑x m m 2.权数对加权算术平均数的影响,取决于( B ) A. 权数所在组标志值的大小; B. 权数的大小; C. 各组单位数的多少; D. 总体单位数的多少 3.是非标志不存在变异时,意味着:( B ,C ) A. 各标志值遇到同样的成数; B. 所有单位都只具有某种属性 C. 所计算的方差为0; D. 所计算的方差为0.25 4.能够综合反映总体各个单位标志值的差异,对总体标志变异程度作全面客观评定的指标有( A ,C ) A.方差 B.算术平均数 C.标准差 D.全距 二、判断题 1.甲乙两地,汽车去程时速20公里,回程时速30公里,其平均速度为25公里。 [答]错。本题应采用调和平均法计算平均速度。 2.权数起作用的前提是各组的变量必须互有差异。 [答]对。 3.变量同减某个数再同除于另一数然后求其方差,其方差等于原方差乘于除数的平方。 [答]对。 4.与平均数相比,中位数比较不受极端值的影响。 [答]对。 三、计算题 1.甲乙两企业生产三种产品的单位成本和总成本资料如下表,试比较哪个企业的平均成本高,并分析其原因。 [解] 甲企业的平均成本210030001500660019.4118210030001500340 152030 ++= ==++

乙企业的平均成本 3255150015006255 18.2895 325515001500342 152030 ++ === ++ 由上面的计算得知,甲企业的平均成本高于乙企业。 因为乙企业单位成本低的A产品生产的数量多,占总成本一半以上,即成本低的产品相对权数大,而甲企业生产单位成本低的A产品数量少,仅占总成本的31.8%(=2100/6600)。由于权数的作用,乙企业的平均成本低于甲企业。 2.甲、乙两市场农产品价格及成交量资料如下表,试比较哪个市场的平均价格高,并分析其原因。 [解] 甲市场的平均价格 1.2 2.8 1.5 5.5 1.375 1.2 2.8 1.54 1.2 1.4 1.5 ++ === ++ 乙市场的平均价格 1.22 1.41 1.51 5.3 1.325 44 ?+?+? === 由上面的计算得知,甲市场农产品的平均价格高高于乙市场。 因为价格低的甲产品在甲市场成交额少,仅占21.8%(=1.2/5.5);而在乙市场的成交额大,占45.3%(=2.4/5.3),由于权数的作用,甲市场的平均价格高于乙市场。 3.某企业工人平均月工资为1440元,月收入少于1280元的占一半,试估计众数,并对该企业工人工资的分布情况做一简要说明。 [解] 由题中可知,企业工人月工资的中位数=1280 所以众数≈1440-3×(1440-1280)=960 所以众数<中位数<平均数,则该企业的月工资分布为右(正)偏,说明该企业工人的月工资分布中出现极大值,即出现有人拿到高额的工资,导致月工资分布呈右偏。 4.某城市对3000户居民户均月消费支出进行调查,得到下表资料。

统计数据的描述

第二章统计数据的描述 在对一组统计数据的分布变化进行深入研究之前,我们首先研究一组数据的特征。为了比较精确地描述一组统计资料的特征,需要使用一些统计指标来描述它。一组数据的统计特征通常包括以下四个方面: 1、集中趋势,也称作中心位置。即表示一组数据的中心位置的数据点是在什么地方,也就是数据位置的度量。 2、离散性。即一组数据的分散程度,也就是数据散布的范围。 3、倾斜度。一组数据所描述的曲线既可以是左右对称的,也可能是倾斜的,即通过曲线最高点的垂线把曲线分为两半,是左右对称还是并不对称。 4、尖削度。这就是一组数据所描绘的曲线顶部的峰态特征。根据一组数据所描绘的曲线顶部既可能是尖峰状的,也可能是扁平状的。即使根据两组数据所描绘的曲线具有相同的中心位置和离散程度,但它们的尖削度也可能是不一样的。 在管理科学中,我们最感兴趣的常常是数据的集中趋势和离散程度,本章就主要介绍度量这两个特征的统计量。 第一节数据集中趋势的度量 一组数据的集中趋势通常用平均数、中位数和众数等来表示。这些统计量均称为平均指标。它表明同类社会经济现象的各单位的某一数量指标在一定时间、地点等条件下达到的平均水平。 平均指标的特点是将一组数据中各个数据之间的差异抽象化,用一个指标来代表各个数据的一般水平,它反映了一组数据中各个数据的典型水平、中心位置或集中趋势。 一、平均数 管理统计中常用的平均数有算术平均数、调和平均数和几何平均数等几种。但这里我们主要介绍算术平均数。算术平均数又称均值,常用x来表示。根据计算方法的不同,算术平均数又可分为简单算术平均数和加权算术平均数。 1、简单算术平均数 简单算术平均数的计算公式如下: x x x x N x N N i i N = +++ == ∑121 式中:N 是数据的个数; 21

相关文档
相关文档 最新文档