文档库 最新最全的文档下载
当前位置:文档库 › 统计学概念复习提纲

统计学概念复习提纲

1.国势学派:阿亨瓦尔(德)创造和使用了“统计学”一词,并沿用至今。
2.政治算术学派:威廉配第(英)《政治算术》是产生英国政治经济学和统计学之母的科学。自觉或不觉得地把统计学建立在先进哲学思想上;将先进的科学方法,包括数学、逻辑学、经济学和会计核算等,引进政治算术并加以改造,从而初步形成一个由大量观察法、图示法、分组法、比较法和平均数法所构成的统计方法体系;不仅为现代统计学奠定了基础,对人口学、保险学也作出了卓越的贡献。
3.数理统计学派:凯特勒(比利时)进一步将国势学派、政治算术和概率论综合,最终形成近代统计学。

总体:研究对象的集合体
总体单位:研究对象中个体
关系:总体单位构成总体,总体包含总体单位
举例:广东GDP和全国GDP

1.品质标志:用文字表示总体单位的品质或属性。
2.数量标志:用可运算的数字表示总体单位的数量特征。
3.中性标志:用随机数字表示的标志,既不是不同质也不是不同值。

指标和标志的关系
1.联系→汇总关系(表现为许多总体单位的某一数量标志值汇总起来就是指标),转化关系(由于一个客观现象是作为统计总体还是总体单位,可以随统计研究任务的变换而变换)。
2.不同→反映的客观范围不同。指标是说明总体数量特征的,即指标具有明显的可衡量性,或称数量性,因此统计指标都是用数字表达或表现的;标志是说明总体单位特征的名称,可以表现为品质特征,也可以表现为数量特征。

1.时期指标:反映现象在一段时间内的总规模或总水平,其指标数值是可以累加的,指标数值的大小与时期长短有直接关系。如“年销售收入”是12个月销售收入的总和。
2.时点指标:反映现象在某一时刻上的总水平或总状况,不同时间上的指标数值相加无意义,因而指标数值的大小与时期长短无直接关系。如某年末库存量是指12月31日那一天的库存量,它不可能是12个月每个月库存量的总和。

商务统计资料的整理:一般分为审核、分组、汇总和编统计表四个步骤。

统计分组:根据实物内在的特点和统计研究的任务,对所要研究的对象总体依照一定的标志划分为若干个部分(组)的一种统计方法。其关键在于正确地选择分组标志。

分配数列:统计分组和汇总后,将各组次数依分组顺序,一次编排而形成的数列叫频数分配数列。分配数列必须具备的两个要素:1.组别(即按分组标志划分的各个组) 2.分配在各组的总体单位数(频数或次数)。

现象的分布特征:1.丘形分布或钟形分布(中间大两头小,正态分布、左偏、右偏分布)

2.U形分布(两头大中间小,如幸福感/人口死亡率按年龄的分布) 3.J形分布与倒J形分布(洛伦茨曲线)

相对数:两个有联系的数据对比计算的比率。其计量单位的表现形式一般为百分数、千分数、系数、倍数和成数等。

动态相对数表格数据填写:
环比发展速度=第二年的出口总值/第一年的出口总值
环比增长速度=该年环比发展速度-100%
定基比发展速度=该年的出口总值/第一年的出口总值
定基比增长速度=该年定基比发展速度-100%
增长1%的绝对值=该年的出口总值*1%

平均数:将总体中各单位某一数量标志的不同数值抽象化,用来反映同一总体数量标志的一般水平。其具备这些特点:1.同质性 2.代表性 3.抽象性 4.集中性

加权算术平均数=[(各组标志值X * 各组次数f)总和]/总次数f

众数:指总体中重复出现次数最多的那个变量值,可以用来说明该总体的一般水平,优点是不受极端值影响。公式:众数Mo=众数组的下限L+[众数组次数f与其前一组次数之差f-1/(2*众数组次数f-前一组次数f-1 - 后一组次数f+1)]*众数组组距i

中位数:是所有按大小排列的数据中处于中间位置的数值,它将所有数据一分为二,正好有一般的数据比中位数小,也正好有一半数据比中位数大,优点是它根据位置确定,不受极端值影响。公式:中位数Me=所在组下限L+[(次数之和/2 - 所在组前一组的累计次数Sm-1)/所在组的次数fm]*所在组组距i

算术平均数、众数和中位数的关系
1.次数分布单峰对称 : 三个数相等
2.次数分布为左偏(负偏斜): 算术平均数<中位数<众数
3.次数分布为右偏(正偏斜): 算术平均数>中位数>众数

首位折半公式:[(A1/2)+A2+A3+...+(An/2)]/(n-1)

时期数列和时点数列的区别:时期数列反映现象在一段时间内的总规模和总水平,特点是不同时期可以相加;时点数列反映现象在某一时刻上的状态,特点是不同时期不能相加。

序时平均数与静态平均数区别:序时平均数将数据在不同时间的差异抽象化,是由时间数列计算的序时平均数,可以反映一段时间内现象发展的一般水平;静态平均数是将数据在同一时间的差异抽象化,是由变量数列计算的一般平均数。

离散度:反映总体内各单位某一标志值差异程度的综合指标,或说反映某组特定数据之间差别程度的一个量。
离散度与平均数的区别:平均数将总体中的各个数据差异抽象掉了,而离散度全面反映事务的差异性。

标志变动度(离散度)的作用:1.可以说明平均数的代表程度大小(离散大则代表性小) 2.可以用来研究某一总体标志值的均衡性和稳定性 3.离散度的测量在选择最优样本和控

制误差等方面起着重要作用。
常用的有:1.极差和四分位差 2.平均差、标准差、方差 3.偏斜度。

标准差:6=厂[(未知量x - 平均数X)的平方的求和*频数f/总次数]

离散系数:以离散度与其相对应的算术平均数相比而得到的一个相对指标。公式:离散系数V6=(离散度6/算术平均数X)*100% 当平均数X1≠平均数X2时,必须计算离散系数。

交替标志:可以把研究对象简单划分为两部分或两组的标志,是或否等。p+q=1
交替标志的算术平均数计算:p/(p+q)=p
交替标志的标准差计算:厂(pq) 或 厂[p(1-p)]

中心极限定理:1.当总体很大时,无论它呈现何种分布,只要样本容量n足够大,那么样本平均数的抽样分布必定趋近于正态分布;2.从正态总体中抽取的全部可能样本,无论样本容量有多大,样本平均数的抽样分布必定遵从于正态分布;3.即使是非正态分布总体,只要样本容量n≥30,其抽样分布必定趋近于正态分布;4.抽样分布的平均数等于总体平均数。

中心极限定理的作用:当我们要根据样本统计量推断总体参数时,不必考虑总体的分布形态,只需要运用正态分布理论,用样本的资料通过推断抽样分布的平均数,来估计总体平均数。

区间估计:有一些区间估计值组成的一个数值范围。是对总体参数可能落入的一个数值范围作出适当地估计。

区间估计值的表现:?

置信度:与一个区间估计相联系的概率。概率越大,置信度越大。用1-a(阿法)表示。
置信区间:总体参数可能所属范围。
置信限:置信区间的界限,有上限和下限之分。X(平均数)±Z(查表值)*6/厂n

指数:商务管理分析和统计分析中常用的分析方法,是常用的一种指标。

广义指数:反映社会经济现象变动程度或差异程度的指标,是测定一个变量对于另一个特定变量的变动情况的比较指标,包括了一切动态相对数和某些比较相对数。

狭义指数:指那些由不同计量单位度量的事务所构成的复杂总体的变动程度或差异程度的指标,其中“复杂总体”是指不能直接相加的由多因素所组成的总体,可以认为测定复杂总体变动程度的狭义指数是一种特殊的相对数。

指数化因素:指数所要研究的因素;
同度量因素:使不同度量的事务转化为同一度量事务的媒介因素,作用是使原来不能直接相加的现象过渡到可以相加。



























相关文档