文档库 最新最全的文档下载
当前位置:文档库 › 统计学期末复习重点分析

统计学期末复习重点分析

统计学期末复习重点分析
统计学期末复习重点分析

统计学期末复习重点

一、选择、填空、判断题型:

1、统计一词通常有三种含义:即统计工作、统计资料、统计学。

2、统计学的特点:数量性、总体性、具体性。

3、就一次统计活动来讲,一个完整的认识过程一般可分为统计调查、统计整理

和统计分析三个阶段。

4、标志可分为品质标志和数量标志。

5、统计调查是统计工作中的基础环节。

6、统计调查工作要力求达到准确性和及时性这两个基本要求。

7、统计调查按调查对象所包括范围不同,可分为全面调查和非全面调查。

8、统计调查的组织形式分为统计报表制度和专门调查。

9、统计调查按登记事物的连续性不同,分为经常调查和一时调查。

10、统计整理的关键是统计分组,统计分组的工作是正确的选择分组标志。

11、统计分组的三方面作用是分别从类型分组、结构分组和分析分组角度来

说明的。

12、根据分组标志的不同,分配数列可分为两种:品质分配数列(简称品质

数列);变量分配数列(简称变量数列)。品质数列由各组名称和次数组成。

变量数列也是由各组名称(由变量值表示)和次数(或频率)组成。

13、组距数列根据组距是否相等,分为等距数列和异距数列两种。

14、次数分布有三种主要类型:钟型分布、U型分布,J型分布。

15、总量指标按其反映的内容不同,分为总体单位总量和总体标志总量。

16、总量指标按其反映时间状况不同,分为时期指标和时点指标。

17、根据客观现象的性质不同,5年计划指标数值的规定有水平法和累计法。

18、注意两个对比指标的可比性

19、平均指标能反映总体变量值的集中趋势。

20、动态数列由两个基本要素构成:一个是资料所属的时间;另一个是各时间上的统计指标数值,习惯上称之为动态数列中的发展水平。

21、如果掌握的权数资料是基本公式的母项数值,则采用算术平均数形式;如果掌握的权数资料是基本公式的子项数值,则采用调和平均数形式。

22、动态数列按统计指标的性质不同,可以分为绝对数动态数列、相对数动态数列、平均数动态数列三种。

23、保证数列中各个指标之间的可比性,就成为编制动态数列应遵守的基本原则。

24、动态数列影响因素按其性质和作用大致归为:长期趋势(T)、季节变动(S

)、循环变动(C)、不规则变动(I)。。

25、统计指数按照说明现象的范围不同,分为个体指数和总指数。

26、按照统计指标的内容不同,分为数量指标指数和质量指标指数。

27、编制指数的一般原则:编制数量指标指数用基期质量指标作同度量因素;编制质量指标指数用报告期数量指标作同度量因素。

二、名词解释:

1、统计学是研究大量社会现象(主要是经济现象)的总体数量方面的方法论科

学。P5

2、统计调查是按照统计任务的要求,运用科学的调查方法,有组织地向社会实

际搜集各项原始资料的过程。P19

3、统计整理根据统计研究的任务,对原始资料进行加工汇总,以得出反映事物

总体综合特征的资料的工作过程。P39

4、总体,亦称统计总体,是指客观存在的,在同一性质基础上结合起来的许多

个别单位的整体。构成总体的这些个别单位成为总体单位。P11

5、统计指标是反映统计总体数量特征的科学概念和具体数值。分为数量指标和

质量指标。P14

6、普查是专门组织的一次性的全面调查。P32

7、统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干

个组成部分的一种统计方法。P42

10、次数分配或分配数列在统计分组的基础上,将总体的所有单位按组归类整理,形成总体中各个单位在各组间的分布,称为次数分配或分配数列。P48

11、总量指标是反映社会经济现象在一定时间、地点、条件下的总规模或总水平的统计指标。P69

12、平均指标是说明同质总体内某一数量标志在一定历史条件下一般水平的综合指标。P86

13、标志变动度是指总体中各单位标志值差别大小的程度,又称离散程度或离中程度。P112

15、动态数列将一系列同类的统计指标,按时间的先后顺序排列,就形成一个动态数列或称时间数列。P132

16、狭义指数指不能直接相加和对比的复杂社会经济现象综合变动程度的相对数。P188

三、简答题型:

1、统计的三种含义的联系。

(1)统计工作与统计资料是过程与成果的关系;

(2)统计学和统计工作之间存在着理论和实践的辩证关系。

2、标志与指标的区别与联系P12

区别:(1)说明对象不同

(2)表现形式不同

联系:(1)汇总关系

(2)变换关系

3、统计调查方案包括哪些项基本内容?

(1)确定调查目的;

(2)确定调查对象和调查单位;

(3)确定调查项目;

(4)确定调查时间和调查期限;

(5)制定调查的组织实施计划。

4、简述时期指标和时点指标的不同特点。

(1)时期指标的数值是连续计数的,时点指标的数值是间断计数的;

(2)时期指标具有累加性,时点指标不具有累加性;

(3)时期指标数值的大小受时期长短的制约,时点指标数值的大小与时点间的间隔长短无直接的关系。

5、简述时期数列和时点数列的不同特点。

时期数列的特点:

(1)数列中各个指标的数值是可以相加的,即相加具有一定的经济意义;(2)数列中每一个指标值的大小与所属的时期长短有直接的联系;

(3)数列中每个指标的数值,通常是通过连续不断的登记而取得的。

时点数列的特点:

(1)数列中各个指标的数值是不能相加的,相加不具有实际经济意义;(2)数列中每一个指标数值的大小与其时间间隔长短没有直接联系;(3)数列中每个指标的数值,通常是通过一定时期登记一次而取得的。

四、公式与计算题题型:

第三章:

一、相对指标的种类及其计算

(一)计划完成相对指标 (同一个总体,分子分母不能换) (二) 结构相对指标 (同一个总体,分子分母不能换;比重,比率)

(三) 比例相对指标 (同一个总体,分子分母可换)

(四) 比较相对指标(类比相对指标) (两个总体之间比较,分子分母可换)

① 比较标准是一般对象,分子与分母的位置可以互换。 ② 比较标准(基数)典型化,分子与分母的位置不能互换。 (五) 强度相对指标 (两个总体之间比较,分子分母可换) (六)动态相对指标 (分子分母不可换)

基期 —— 作为对比标准的时间

报告期—— 同基期比较的时期,也称计算期

二、算术平均数 P87 (重点计算题,其他的平均数不做要求)

100%

实际完成数

计划完成相对数计划数

=

?100%

总体某部分数值结构相对数总体全部数值

=

?=

总体中某部分数值比例相对数总体中另一部分数值

100%

某条件下的某类指标数值比较相对数另一条件下的同类指标数值

=

?=

某一总量指标数值

强度相对数另一性质不同但有一定联系的总量指标数值

100%

报告期水平动态相对数基期水平

=

?

1、算术平均数的基本公式

2、简单算术平均数

3、单项数列的加权算术平均数 例题:

设某厂职工按日产量分组后所得组距数列如下,据此求平均日产量。

4、算术平均数的数学性质

=

总体标志总量算术平均数总体单位总数

X X n

∑=

X f X f

?∑=

∑)(62.82164

13550

千克平均日产量==

?=

∑∑f

f X X

① 各个变量值与算术平均数离差之和等于零 简单平均数:

加权平均数: ② 各个变量值与算术平均数离差平方之和等于最小值

三、标准差 P118 标准差的计算公式:

1.未分组资料:

2.分组资料:

∑=-0)(X X 0

)(=-∑f X X 2

2()()-=∑-=∑X X f X X 简单平均数:最小值加权平均数:

最小值

=

=

σσ

第四章:

一、动态数列的水平分析指标

属于现象发展的水平分析指标有:发展水平、平均发展水平、增长量、平均增长量。

平均发展水平/序时平均数/动态平均数 序时平均数的计算方法:

(一)绝对数动态数列的序时平均数 1.时期数列的序时平均数 P138 例题:

2. 时点数列的序时平均数 P139

(1) 如果资料是连续时点资料,可分为两种情况: 1). 对连续变动的连续时点数列(即未分组资料)

2). 对非连续变动的连续时点数列(即分组资料)

例题:

某厂7月份的职工人数自7月1日至7月10日为258人,7月11日起至7月底均为279人,则该厂7月份平均职工人数为:

123123n ,,, n

n a a a a a a n n a

a a a a ++++==

∑L L 式中:序时平均数

各时期发展水平

时期项数

a

a n

=

a f a f

=

∑∑)26.5( 6

29

3028282024万件则上半年平均月产=+++++=)

(27231

279

2125810人=?+?=a

⑵ 如果资料是间断时点资料,也可分为两种情况: P140 1) 对间隔相等的间断时点资料

这种计算方法称为“首末折半法” 例题:

1

22

1

2221321

3

2211

-+

++++=-++++++=

--n a a a a a n a a a a a a a n n n n ΛΛ)(2960)274029903150(31)(27402

2800

26806)

(29902

268033005)

(31502

3300

30004件第二季度平均库存量件月份件月份件月份=++=∴=+==+==+=a a a )

(29603

2740

29903150 322800

2680226803300233003000件第二季度平均库存量:上面计算可合并简化为=++=+++++=

2) 对间隔不等的间断时点资料 P141

例题:

补充习题:

23112

12111

222n n n n i

i a a a a a a f f f a f ---=++++++=∑L )(83.25712

30945

3452

4

.2593.258323.2581.257421.2572.256万人年平均人口数为:

该市则,==++?++?++?+2003

(二)相对数动态数列的序时平均数

1. 由两个时期数列对比组成的相对数动态数列的序时平均数 P142

例题:

补充习题:

∑∑∑∑=

==b a n b n a

b a c

一般公式为:

810941904601 3

1760128011503

197813671256%

./)(/)(==++++=程度第三季度平均计划完成

2. 由两个时点数列对比组成的相对数动态数列的序时平均数 P142 (1)若时间间隔相等:

例题:

补充习题:

2222122122 321321

321321n n n n b b b b a a a a n b b b b n a a a a b a c +++++

+++=

-++++-++++==ΛΛΛΛ)/()()/()(一般公式为:

%

(18825)

248552042 2845830826280527106956702645

==

+

+++++=全体职工的平均比重第三季度生产工人数占

(2)若时间间隔不等:(不考)

3.若由二个连续时点数列对比组成的相对数动态数列的序时平均数:

4由一个时期数列和一个时点数列对比组成的相对数动态数列的序时平均数。 例题:

23112

12123112121

222222n n n n n n a a

a a a a f f f a c

b b b b b b b f f f

----++++++==++++++L L 1

2

2

b a

c 321-+

+++∑=

=

n b b b b n

a

n Λ一般公式为:)(..)(..)/()(/)(次月数月平均商品流转次数季度的商品流转次数次商品流转次数第一季度月平均

3993133 13350

7156 142

655545235324015080=?=?=∴==-+++++=∑∑a a

c b

b ==

∑连续变动时点:用简单平均,即af

a c bf

b

=

=

∑非连续变动时点:用加权平均,即

(三)增长量和平均增长量 1、增长量=报告期水平-基期水平

2、逐期增长量与累计增长量的关系:逐期增长量之和等于累计增长量。

3、相邻两个增长时期的增长量之差=逐期增长量

4、

二、动态数列的速度分析指标

定基发展速度和环比发展速度之间的关系:

(1) 定基发展速度等于环比发展速度的连乘积;

(2) 两个相邻时期的定基发展速度之比,等于它们的环比发展速度。

定基增长速度=定基发展速度-1(或100%) 环比增长速度=环比发展速度-1(或100%)

各个时期环比增长速度的连乘积不等于相应定基增长速度

1

=

=

-逐期增长量之和累计增长量

平均增长量逐期增长量个数动态数列项数0

1

1a a a a n n

i i i -=-∑=-)(报a a =a a ÷=告期水平发展速度基期水平定基发展速度:可分为:环比发展速度:01100%

i i i a a a a -?

????

??

=?110

i i n

i n a

a =-?∏推理:1i 001

i i

i a a a a --

增长速度发展速度 - 定基增长速度无关系

环比增长速度

增长量前一时期水平

增长的绝对值增长百分比基期水平

或 1 (100%)

1%100

100=??

?==

三、长期趋势的测定与预测 (一)直线方程 P163 最小平方法公式:

直线方程的一般公式: 用高等数学求偏导数方法,得到以下联立方程组:

例题: P163

c y a bt

=+2c

()min y y c y y -→∑实际值,即原数列值趋势值或理论值

∑∑+=t

b Na y ∑∑+=2

t

b t a ty 为使计算方便,可设t:

奇数项:ΛΛ,,,,,,,,3210123---偶数项:ΛΛ,,,,,,,531135---这样使0=∑t ,即上述方程组可简化为:Na

y =∑∑∑=2

t

b ty 0)( 222=???

????=?-=-==--=∑∑∑∑∑∑∑∑∑∑∑t n y n t b n y t b y a t ty t t n y t ty n b )(导出:由联立方程也可直接推

第五章:

一、综合指数 P192

1、个体指数是反映个别社会经济现象变动的相对数。

2、q ——物量(生产量、销售量); P ——商品价格(质量); 下标1——报告期; 下标0——基期。

3、同度量因素宜固定于基期,故称为拉氏指数公式。

同度量因素宜固定在报告期,故称派氏指数公式。

总量动态指标指数 × = 式中, ——销售量总指数;p ——同一时期的价格。

——销售价格总指数;q ——同一时期的销售量。 4、数量指标综合指数的编制——其同度量因素往往取基期的质量指标 质量指标综合指数的编制——其同度量因素往往取报告期的数量指标 数量指标综合指数:

二、平均指标指数 P203

1、加权算术平均数指数——通常用于编制数量指标综合指数 数量指标指数: 质量指标指数:

100%K =?报告期水平基期水平

1

00

q

q p K q p ∑=∑称为拉氏数量指数公式

1

00

p

p q K p q ∑=∑

称为拉氏质量指数公式

1

00

q

q p K q p ∑=∑称为拉氏数量指数公式

100

p p q

K

p q

∑=∑称为拉氏质量指数公式10

q q p K q p ∑=∑称为拉氏数量指数公式

100

p p q K p q ∑=∑称为拉氏质量指数公式1

10

1

q

q p

K q p

∑=∑称为派氏数量指数公式

1

10

1

p

p q

K p q ∑=∑

称为派氏质量指数公式

1000

1q 10

0000

K

q q q p K q p q

q Kq q Kq p

K q p ∑=∑=∴=∑∴=∑Q 以综合产量指数为例:11

01

110

01

01

, p p p p p q

K p q p

K Kp p Kp q

K p q ∑=∑=∴=∑∴=∑Q

2、加权调和平均数指数——通常用于编制质量指标综合指数。 数量指标指数:

质量指标指数:

例题:设某商店仅有2005年商品收购额和2004年、2005年各种商品收购单价,要求计算价格总指数。

计算结果表明,这商店四种商品2005年收购价格比2004年平均提高4.8%;由于价格提高,使该商店2005年商品收购额增加17 891元。

11

01

101

011

11

1, p 1

p p p p q

K p q p K p p K p q K p q K ∑=∑=∴=∑∴=∑??Q 权数为原综合指数基本公式的分子

我国现行农产品收购价格指数和集市贸易价格指数就采用此公式

1000

101010

10

1 , q 1q q q q p

K q p q K q q K

q p K q p K ∑=∑=∴=∑∴=∑Q ∑

=-=-∑=?=∑=)(891 17160 370051 3881

%8.104%100160

37011

1111

111元q p K q p q p K

K p

三、指数体系 P224

1、总量动态指标=数量指标指数×质量指标指数

例题:

绝对数分析:

①由于出厂价格提高:

Σp1q1- Σp0q1=9620000-8732000= 888000(元) ②由于产品产量增加:

Σq1p0- Σq0p0=8732000-7456000=1276000(元) ∴ 2164000=888000+1276000(元)

1

1

1

1

1

00

1

1

1

1

1

1

1

()()

p q p q q p p q p q q p

p q p q p q p q q p q p ∑∑∑=?∑∑∑-=-+-∑∑∑∑∑∑若建立指数体系为:)

(216400074560009620000%02.1297456000

962000000110011元总产值指数=-=∑-∑==∑∑=q p q p q p q p %11.117%17.110%02.129%

11.11774560008732000 %17.11087320009620000 0

0011011?=∴==∑∑==∑∑p q p q q p q p 产品产量总指数:出厂价格总指数:相对数分析:

现代心理与教育统计学第07章习题解答

1. 何谓点估计与区间估计,它们各有哪些优缺点? 点估计就是总体参数不清楚时,用一个特定的值,即样本统计量对总体参数进行估计,但估计的参数为数轴上某一点。 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它不具体指出总体参数是多少,能指出总体未知参数落入某一区间的概率有多大。 点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。 区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。 2以方差的区间估计为例说明区间估计的原理 根据χ2分布: 总体方差的.95或.99置信区间为: 即总体参数(方差)落入上述区间的概率为1-α,其值为95%或99% 3.总体平均数估计的具体方法有哪些? 总体方法为点估计好区间估计,区间估计又分为: (1) 当总体分布正态方差已知时,样本平均的分布为正态分布,故依据正态分布理论估计其区间;(2)当总体分布正态方差未知时,样本平均数的分布为T 分布,依据T 分布理论估计其区间;(3)当总体非分布正态方差未知时,只有在n 大于30时渐近T 分布,样本平均数的分布渐近T 分布,依据T 分布理论估计其区间。 4总体相关系数的置信区间,应根据何种分布计算? 应根据Fisher 的Z 分布进行计算 5.解 依据样本分布理论该样本平均数的分布呈正态 其标准误为: 其置信区间为: 该科成绩的真实分数有95%的可能性在78.55----83.45之间。 6.解:此题属于总体分布正态总体方差未知的情形,故样本平均数的分布呈T 分布 其标准误为: 用df=99差T 值表,然后用直线内插法求得t α/2=1.987 其置信区间为: 该学区教学成绩的平均值有95%的可能在78.61---81.39之间。 7解:此题属于总体分布正态总体方差已知 计算标准误 ()()222212221σσσχnS S n X X n =-=-=-∑()()22/121222/2111)(ααχσχ----<<-n n S n S n 25.116 5===n x σσ45 .8355.7825.1*96.18125.1*96.1812/2/<<+<<-?+<

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )

《心理统计学》月期末考试指导

0272《心理统计学》2016年6-7月期末考试指导 一、考试说明 本课程闭卷考试,满分100分,考试时间90分钟。可能的考试卷型包括: 1、单项选择题 2、判断题 3、简答题 4、计算题 5、综合应用题 二、重点复习内容 (一)绪论 1、心理学统计学的内容:描述统计、推论统计、实验设计。其中,描述统计的指标包括数据的集中趋势,数据的离散趋势和数据间的相关 2、数据的种类 按照测量的水平,可以划分为称名变量、等级变量、等距变量和比率变量。 (1)称名变量,是指根据事物的某一特征,用来划分、区别事物的不同种类所形成的变量。这类数码并无数量和序列的含义,不能进行数量化分析,不能做加减乘除的运算。 (2)等级变量,在对事物进行分类过程中,依据事物某种属性程度的大小排列顺序形成的变量。等级变量既无相等单位,也无绝对零,不同组的等级变量间不能进行加减乘除的运算。(3)等距变量,是指在观测标识事物某一特定属性时,具有相对参照点、有相等单位的变量。可以进行加减运算,但是由于等距变量的参照点是相对的,即无绝对零点,因此不能进行乘除的运算。例如,测量温度的℃。 (4)比率变量,是指既有相等单位又有绝对零参照点的变量,如身高、体重、反应时、各种感觉阈值的物理量等。这类变量可以进行加减乘除的运算。 (二)统计图表 1、次数分布表:各种次数分布的列表形式和图示形式。次数分布包括简单次数分布、分组次数分布、相对次数分布、累积次数分布等。 2、编制次数分布表的步骤 (1)求全距:从最大值的数据中减去最小值的数据,所得差数就是全距。用符号R表示(2)定组数 (3)求组距:指每一组的间距,用符号i表示。 (4)定组限:指各组数据在数值上的起点值和终点值。 (5)求组中值:各组实际上限数值与实际下限数值的中点数值,即上、下限数值的平均值。(6)归类划记:将原始观测值按照一定的顺序逐一归组。 (7)记录各组次数(f)。 (8)核对,抄录新表。 3、连续变量的单位是无限的,例如整数180的实上限和下限分别为179.5和180.5,而测量数据8.35的下实限是8.345。 4、累加次数分布表:如果想知道某个数值以下或以上的数据的数目,就要用累加次数。 5、次数分布图:编制次数分布表与绘制次数分布图,对于了解一组数据的分布情况,平均水平,差异情况等非常有用。由于数据的性质不同,有时实验结果的次数分布图上会出现双峰。 (三)集中量数 集中量数主要用来描述一组数据的集中趋势,常用的代表性的集中量数有算术平均数、中数、众数。 1、算术平均数:又称平均数,是集中量数中性能最好的一个统计量,一般用M表示。

统计学五几种常见的假设检验

定义 假设检验就是用来判断样本与样本,样本与总体的差异就是由抽样误差引起还就是本质差别造成的统计推断方法。其基本原理就是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还就是接受作出推断。 基本原理 (1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。 (2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而就是基于小概率原理:概率很小的事件在一次试验中几乎就是不可能发生的,若发生了,就就是不合理的。至于怎样才算就是“小概率”呢?通常可将概率不超过0、05的事件称为“小概率事件”,也可视具体情形而取0、1或0、01等。在假设检验中常记这个概率为α,称为显著性水平。而把原先设定的假设成为原假设,记作H0。把与H0相反的假设称为备择假设,它就是原假设被拒绝时而应接受的假设,记作H1。 假设的形式 H0——原假设, H1——备择假设 双侧检验:H0:μ = μ0 , 单侧检验: ,H1:μ < μ0 或, H1:μ > μ0假设检验就就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。 假设检验的种类 下面介绍几种常见的假设检验 1、T检验 亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。 目的:比较样本均数所代表的未知总体均数μ与已知总体均数μ0。 计算公式:统计量: 自由度:v=n - 1 适用条件: (1) 已知一个总体均数; (2) 可得到一个样本均数及该样本标准误; (3) 样本来自正态或近似正态总体。 T检验的步骤 1、建立虚无假设H0:μ1= μ2,即先假定两个总体平均数之间没有显著差异; 2、计算统计量T值,对于不同类型的问题选用不同的统计量计算方法; 1)如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度,其统计量T值

统计学简答题重点

统计学简答题重点1 劳动效益统计的意义? 提高劳动效益是市场经济的要求 有利于降低企业劳动消耗 有利于合理分配劳动力资源 有利于认识企业劳动活动的规律性 有利于提高企业的产品质量 2 劳动效益评价体系与原则? 企业劳动效益与社会整体效益相一致原则 直接劳动效益与间接劳动效益统一原则 内部劳动效益与外部效益统一原则 长期劳动效益与短期劳动效益统一原则 价值与使用价值统一原则 3企业劳动效率统计研究的基本任务? 计算劳动效率水平 计算劳动效率增长速度 横向比较,找出制约的原因 各影响及影响程度,分析发展趋势 分析变动影响的因素,提高劳动效率的最佳途径 4 商业企业劳动生产率主要指标? 实物劳动生产率 价值劳动生产率 每万元商品销售额占的业务人数 全员劳动生产率 售货员的劳动效率

5 劳动效率统计的意义? 提高全社会全员劳动生产率 工业生产的增长主要靠劳动效率来体现 改善劳动条件,增加企业效益,推动社会经济发展根据劳动效率确定劳动力及发展速度 劳动效率的变化反映技术培训效果 为提高劳动效率提供数据 是考核和评价业绩最主要的指标 是确定劳动报酬、制订劳动定额的依据 6 对经标准的劳动定额,采用的方法 技术测定的劳动定额 按定额标准制定的劳动定额 同行业先进的劳动定额 历史最高水平的劳动定额 7 劳动定额统计的重要性? 劳动定额统计是合理劳动的重要依据 是调动生产积极性的手段 是断提高劳动生产率的重要工具之一 是企业贯彻按劳分配原则的条件 是全面经济效益核算分析的手段 8劳动定额统计的任务 统计和核算实耗工时与完成定额工时 统计、检查、分析与评定完成情况及指标 统计与分析现行劳动定额水平 统计与分析劳动定额管理工作情况

统计学期末考试试题和答案解析

统计学期末综合测试 一、单项选择题(每小题1分,共20分) 1、社会经济统计的数量特点表现在它是( )。 A 一种纯数量的研究 B 从事物量的研究开始来认识事物的质 C 从定性认识开始以定量认识为最终目的 D 在质与量的联系中,观察并研究社会经济现象的数量方面 2、欲使数量指标算术平均法指数的计算结果、经济内容与数量指标综合法指数相同,权数应是( )。 A 00p q B 11p q C 01p q D 10p q 3、如果你的业务是销售运动衫,哪一种运动衫号码的度量对你更为有用( )。 A 均值 B 中位数 C 众数 D 四分位数 4、某年末某地区城市人均居住面积为20平方米,标准差为8.4平方米,乡村人均居住面积为30平方米,标准差为11.6平方米,则该地区城市和乡村居民居住面积的离散程度( )。 A 乡村较大 B 城市较大 C 城市和乡村一样 D 不能比较 5、某厂某种产品生产有很强的季节性,各月计划任务有很大差异,今年1月超额完成计划3%,2月刚好完成计划,3月超额完成12%,则该厂该年一季度超额完成计划( )。 A 3% B 4% C 5% D 无法计算 6、基期甲、乙两组工人的平均日产量分别为70件和50件,若报告期两组工人的平均日产量不变,乙组工人数占两组工人总数的比重上升,则报告期两组工人总平均日产量( )。 A 上升 B 下降 C 不变 D 可能上升也可能下降

7、同一数量货币,报告期只能购买基期商品量的90%,是因为物价( )。 A 上涨10.0% B 上涨11.1% C 下跌11.1% D 下跌10.0% 8、为消除季节变动的影响而计算的发展速度指标为( )。 A 环比发展速度 B 年距发展速度 C 定基发展速度 D 平均发展速度 9、计算无关标志排队等距抽样的抽样误差,一般采用( )。 A 简单随机抽样的误差公式 B 分层抽样的误差公式 C 等距抽样的误差公式 D 整群抽样的误差公式 10、我国统计调查方法体系改革的目标模式是以( )为主体。 A 抽样调查 B 普查 C 统计报表 D 重点调查 11、设总体分布形式和总体方差都未知,对总体均值进行假设检验时,若抽取一个容量为100 的样本,则可采用( )。 A Z 检验法 B t 检验法 C 2χ检验法 D F 检验法 12、要通过移动平均法消除季节变动得到趋势值,则移动平均项数( )。 A 应选择奇数 B 应和季节周期长度一致 C 应选择偶数 D 可取4或12 13、回归估计标准差的值越小,说明( )。 A 平均数的代表性越好 B 平均数的代表性越差 C 回归方程的代表性越好 D 回归方程的代表性越差 14、某企业最近几批同种产品的合格率分别为90%、95.5%、96%,为了对下一批产品的合格率 进行抽样检验,确定抽样数目时P 应选( )。 A 90% B 95.5% C 96% D 3 % 96%5.95%90++ 15、假设检验中,第二类错误的概率β表示( )。 A 0H 为真时拒绝0H 的概率 B 0H 为真时接受0H 的概率

心理统计学》重要知识点

《心理统计学》重要知识点 第二章 统计图表 简单次数分布表的编制:Excel 数据透视表 列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表 直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。 条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。 简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。 复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。 圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。 线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势; 第三章 集中量数 ● 集中趋势和离中趋势是数据分布的两个基本特征。 ● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。 ● 集中量数:描述数据分布集中趋势的统计量数。 ● 离中趋势:是指数据分布中数据分散的程度。 ● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):n x X i ∑= Excel 统计函数AVERAGE 算术平均数的重要特性: (1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i (2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后, 那么,变量Y 2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。中位数上下的数据出现 次数各占50%。 3.众数(mode ,M O ):一组数据中出现次数最多的数据。 4.算术平均数、中数、众数之间的关系。 5.加权平均数:i i i n n n w w w x w w w w x w x w x M ∑∑=++++++= 212211

医学统计学 检验方法

医学统计学检验方法(转) 医学论文中统计方法的正确应用 医用统计方法是医学科研和论文撰写的一个基本工具,但是不少医学科研及临床工作者对统计方法的正确应用缺乏足够的知识,在实际应用过程中常常出现一些不妥用法甚至误用现象。正确使用统计方法,能使研究结果具有科学性和说服力;反之,如果使用不当,不仅不能准确地反映科研结果,而且可能带来错误的结论。 1、所选统计方法脱离了资料的性质不同的资料类型和不同的研究目的采用不同的统计方法。按照资料的性质测定指标的多少,确定资料是计数资料还是计量资料,应用单因素分析还是多因素分析。 1.1 多因素资料是对每个研究对象测量的多个指标同时进行的综合分析,其分析计算过程相对复杂。常用的有回归分析;相关分析以及判别分析、聚类分析、主成分分析和因子分析等。多因素分析多用于计量资料。 1.2 单因素分析应用较多,按获取资料的方法,分计数资料和计量资料。首先,计数资料主要是针对要求某现象的频率和比例,利用率或比的相应计算方法。如做不同样本间的比较则采用计数资料的显著性检验,样本率与总体率的比较用u 检验;两个样本率的比较可用u 检验或四格表的x 检验,多个样本率的比较可用行乘列的卡方检验或2XC 表的卡方检验。其次,计量资料要结合研究目的确定相应的统计方法。对于显著性检验通常有T 检验和F 检验,T 检验是用于两个均数问的比较,按研究设计与比较内容的不同又分为样本均数和总体均数的比较,两个样本均数差别的检验,配对资料的显著性检验。F 检验用于多个样本均数的比较,按设计类型分完全随机设计的方差分析、随机区组设计的方差分析和组内分组资料的方差分析。 2、根据研究目的选用统计分析方法不同的统计方法说明不同的问题,同样不同的问题要应用不同的统计方法来分析和表达。研究者在做统计分析前,首先要明确资料分析的目的、意图是什么,通过分析最终达到什么样的期望,临床工作者科研通常的目的主要有: 2.1 某现象发生的频率或比例如人群中重复癌的发生率,采用频率指标,构成指标或相对比,可计算发病、患病、感染、阳性频率或构成等。

统计学简答题答案资料讲解

1、什么是统计学,有哪些特点? 统计学是收集、整理、分析、解释数据并从数据中得到结论的学科。 特点:客观性~~相关性~~实用性~~科学性~~严谨性~~逻辑性~~~ 2、何谓标志,按能否用数量表示可以分为哪两种类型,分别举例说明 标志是指说明总体单位属性或特征的名称。可以分为数量标志和质量标志 品质标志:说明总体单位属性特征的名称,用文字描述。Ex:性别,名族,工种,籍贯数量标志:说明总体单位数量特征的名称,用数量表示。数量标志的具体表现称标志值。 Ex:工人的年龄,工资,工龄 3、什么是离散型变量,连续性变量?举例说明 变量:可变的数量标志和指标; 离散型变量:指变量的数值只能以计数的方法取得,(变量值只能取整数); 连续型变量:指变量的取值连续不断,(变量值能取小数)。 4、简述品质标志和数量标志的区别,并举例说明。 区别:数量标志说明的是总体的数量特征,而品质标志说明的是总体的属性特征。 5、什么是数量指标和质量指标?二者有何关系? 统计指标:反映总体数量特征的科学概念和具体数值。 注意:从理论上讲,一个完整的统计指标由两部分构成:指标名称+指标数值 例如:某地区2009年完成利税总额(指标名称)为1500(指标数值)亿元。 数量指标:用来反映现象的总规模、总水平、或工作总量的指标。其数值大小随总体的研究范围的大小而增减。 质量指标:反映客观现象的劳动效果或工作质量等事物内部数量关系的指标,其数值的大小与总体的研究范围大小无直接联系。 6、统计标志和统计指标有和联系与区别? 区别:1、标志是反映总体单位特征;指标反映总体特征。 2、指标都能用数量表示,标志只有数量标志能用数量表示; 3、标志是一个理论概念,实际应用中只有指标。 联系:1、标志与指标可以相互转化,随研究目的的转化而改变; 2、指标值一般是标志值汇总来的; 3、标志的名称常常就是指标名称。 7、制定一份完整的统计调查方案,应包括哪些内容? 1)明确调查的目的和任务 2)确定调查的对象和调查单位、 3)确定带调查项目、设计调查表或问卷 4)确定调查时间、调查地点和调查方式方法 5)制定调查的组织实施计划 8、举例说明重点调查的概念和特点 重点调查:是在调查对象范围内部选择部分重点调查单位进行的调查。 特点:调查单位少、适用于调查对象的标志值比较集中于某些单位的场合、重点调查的调查方式主要采取专门调查的组织形式(一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。);有点在于花费较少的人力物力和时间就可以获得总体的基本情况资料。 9、简述重点调查、典型调查、抽样调查的联系与区别P31 抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。

现代心理与教育统计学复习资料

现代心理与教育统计学 复习资料 Revised as of 23 November 2020

1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。

统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、 次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 %100 N f

统计学试题及答案分析-共20页

统计学考试题一 一、 单项选择题(请将正确答案的番号写在括号内,每小题1分,共20分) 1. 统计学名称来源于 A .政治算术学派 B .国势学派 C .数理统计学派 D .社会经济统计学派 2. 统计学是一门关于研究客观事物数量方面和数量关系的 A .社会科学 B .自然科学 C .方法论科学 D .实质性科学 3. 几位学生的统计学考试成绩分别为55,60,70,80,85,60,这几个数字是 A .指标 B .变量 C .标志 D .变量值 4. 重点调查中的重点单位就是 A .有关国际名声的单位 B .在总体中其单位数目占绝大比重的单位 C .特殊的单位 D .其单位数虽少,但被调查的标志值在总体标志值中占绝大比重的单位 5. 调查某大学学生学习情况,则总体是 A .该大学所有学生 B .该大学每一名学生的学习成绩C .该大学每一名学生 D .以上都不正确 6. 某公司员工的工资分为:(1)800元以下;(2)800~1500元;(3)1500~2019元;(4) 2019元以上,则第四组的组中值近似为 A .2019元 B .1750元 C . 2250元 D .2500元 7. 分配数列是 A .按数量标志分组的数列 B .按品质标志分组的数列 C .按指标分组的数列 D . 按数量标志或品质标志分组的数列 8. 统计表的形式构成由总标题、横行标题、纵栏标题 A .数据资料 B .主词 C .宾此 D .以上都不正确 9. 反映同类现象在不同时期发展变化一般水平的指标是 A .算术平均数 B .序时平均数 C .众数 D . 调和平均数 10. 某企业5月份计划要求成本降低3%,实际降低5%,其成本计划完成程度为 A .97.94% B .166.67% C .101.94% D .1.94% 11. 若两总体的计量单位不同,在比较两总体的离散程度时,应采用 A .全距 B .平均差 C .标准差 D .标准差系数 12. 下列指标中,属于强度相对数的是 A .某企业的工人劳动生产率 B .人均国民收入 C .某种商品的平均价格 D .某公司的平均工资 13. 拉氏指数所用的同度量因素是固定在 A .基期 B .报告期 C .固定时期 D .任意时期 14. 某市工业总产值增长了10%,同期价格水平提高了3%,则该市工业生产指数为 A .113.3% B .13% C .106.8% D .10% 15. 我国消费价格指数的编制方法 A .∑∑= 0q p q p K K p p B . ∑∑= 1 1111 q p K q p K p p C .∑∑= 1q p q p K p D .∑∑= 1 011q p q p K p

心理统计学重点分析

心理统计学重点分析.txt遇事潇洒一点,看世糊涂一点。相亲是经销,恋爱叫直销,抛绣球招亲则为围标。没有准备请不要开始,没有能力请不要承诺。爱情这东西,没得到可能是缺憾,不表白就会有遗憾,可是如果自不量力,就只能抱憾了。心理统计学重点分析 一.描述统计 (一)统计图表 1)统计图 次数分布图: ①直方图:用以矩阵的面积表示连续性随即变量次数分布的图形。 ②次数多边形图:一种表示连续性随机变量次数分布的线形图,属于次数分布图。 ③累加次数分布图:分为:累加直方图和累加曲线图; 其中累加曲线的形状大约有三种:一种是曲线的上枝长于下枝(正偏态),另一种是下枝长于上枝(负偏态),第三种是上枝,下枝长度相当(正态分布)。 其他统计图:条形图:用于离散型数据资料; 圆形图:用于间断性资料; 线形图:更多用于连续性资料,凡预表示两个变量之间的函数关系,或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的情况,用这种方法比较好。 散点图: 2)统计表 ①简单次数分布表 ②分组次数分布表 ③相对次数分布表:将次数分布表中各组的实际次数转化为相对次数,即用频数比率表示。 ④累加次数分布表 ⑤双列次数分布表:对有联系的两列变量用同一个表来表示其次数分布。 (二)集中量数 1)算术平均数M 优点:反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少受抽样变动的影响; 缺点:受极端数据的影响;若出现模糊不清的数据时,无法计算平均数; 计算和运用平均数的原则:同质性原则;平均数与个体数值相结合的原则;平均数与标准差。方差相结合原则; 性质: ①在一组数据中每个变量与平均数之差的总和等于零 ②在一组数据中,每一个数都加上一个常数C,所得的平均数为原来的平均数加常数C ③在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C 2)中数:Md按顺序排列在一起的一组数据中居于中间位置的数,即这组数据中,一般数据比它大,一般数据比它小。注意计算方法; 3)众数:Mo是指在次数分布中出现次数最多的那个数值; 三者的关系:正偏态分布中,M>Md>Mo 负偏态分布中,M

医学统计学检验方法

医学统计学检验方法(转) 医学论文中统计方法的正确应用 医用统计方法是医学科研和论文撰写的一个基本工具,但是不少医学科研及临床工作者对统计方法的正确应用缺乏足够的知识,在实际应用过程中常常出现 一些不妥用法甚至误用现象。正确使用统计方法,能使研究结果具有科学性和说服力;反之,如果使用不当,不仅不能准确地反映科研结果,而且可能带来错误的结论。 1、所选统计方法脱离了资料的性质不同的资料类型和不同的研究目的采用不同的统计方法。按照资料的性质测定指标的多少,确定资料是计数资料还是计量资料,应用单因素分析还是多因素分析。 1.1多因素资料是对每个研究对象测量的多个指标同时进行的综合分析,其分析计算过程相对复杂。常用的有回归分析;相关分析以及判别分析、聚类分析、 主成分分析和因子分析等。多因素分析多用于计量资料。 1.2单因素分析应用较多,按获取资料的方法,分计数资料和计量资料。首 先,计数资料主要是针对要求某现象的频率和比例,利用率或比的相应计算方法。如做不同样本间的比较则采用计数资料的显著性检验,样本率与总体率的比较用 u检验;两个样本率的比较可用u检验或四格表的x检验,多个样本率的比较可用行乘列的卡方检验或2XC表的卡方检验。其次,计量资料要结合研究目的确定相应的统计方法。对于显著性检验通常有T检验和F检验,T检验是用于两个均数问的比较,按研究设计与比较内容的不同又分为样本均数和总体均数的比较,两个样本均数差别的检验,配对资料的显著性检验。F检验用于多个样本均数的比较,按设计类型分完全随机设计的方差分析、随机区组设计的方差分析和组内分组资料的方差分析。 2、根据研究目的选用统计分析方法不同的统计方法说明不同的问题,同样不同的问题要应用不同的统计方法来分析和表达。研究者在做统计分析前,首先要明确资料分析的目的、意图是什么,通过分析最终达到什么样的期望,临床工作者科研通常的目的主要有: 2.1某现象发生的频率或比例如人群中重复癌的发生率,采用频率指标,构成指标或相对比,可计算发病、患病、感染、阳性频率或构成等。

统计学简答题

简答题 1.如何理解统计指标体系比统计指标的应用更为广泛和重要? 因为任何社会经济总体都是一个相互联系的有机整体,这种联系是产生统计指标体系的客观基础,同时也产生了使用统计指标体系的要求。同时,从对社会经济总体的认识来讲,一个统计指标的作用是有限的,只有用相互联系的一套指标才能全面地认识社会经济总体及其运动过程,因此统计指标体系比统计指标的应用更为广泛和重要。 2.简述统计指标和标志的关系? 标志和指标既有区别又有联系。区别:第一,标志是说明总体单位属性或特征的名称;而指标是说明总体数量特征的名称。第二,标志有只能用文字说明的品质标志和可以用数值表示的数量标志两种;而指标都能用数值表示。联系:第一,有许多统计指标的数值是由总体单位的数量标志值汇总而来的。第二,由于总体和总体单位是可变的,则说明总体的指标和反映总体单位的标志之间存在着变化关系。 3.一个完整的统计工作过程包括哪些内容? 主要包括:统计设计、统计调查、统计整理和统计分析四个阶段。统计设计是定性工作,为以后的定量工作做准备;统计调查和统计整理都是定量工作过程,是向社会实际搜集大量统计资料以及对调查来的原始统计资料进行加工整理的工作过程;统计分析是运用统计资料达到认识事物本质和规律性的目的,是定性认识。统计工作过程是一个由定性到定量再到定性的认识过程。 4.一个完整的统计调查调查方案应包括哪些主要内容? 1)确定调查目的和任务;2)确定调查对象和调查单位;3)确定调查内容,拟定调查表;4)确定调查时间和调查期限;5)确定调查方法;6)确定调查组织和实施计划。 5.统计工作为什么要强调多种调查方法结合运用? 任何一种调查方法都有它的优越性和局限性,从而具有各自的应用条件;同时,整个社会经济由有多方面多部门组成的,条件情况十分复杂,要搜集到各种统计资料,只依靠一种统计调查方法是难以完成的。因此,在统计工作中,必须根据具体情况,结合运用不同的调查方式方法。 6.什么是分组标志?进行统计分组应如何选择分组标志? 分组标志是作为分组的标准或依据的特征。正确的分组标志是实现统计研究目的的前提。选择分组标志时应注意:(1)在不同的研究目的下选择不同的分组标志(2)选择一定历史条件下最能反映现象本质差别及内在联系的标志作为分组标志(3)分组标志的选择要随着历史、社会、经济条件的变化而变化。 7.对于连续型变量编制组距式变量数列组限应如何设置?为什么? 应重叠设置。因为连续型变量的数值是连续不断的,相邻两值之间可以取无限个数值,在编制组距式变量数列时,如果组限不重叠设置,就会使一部分变量值无组可归。 8.简述三种非全面调查的主要区别? 抽样调查、重点调查和典型调查都是专门组织的非全面调查,但它们在几个方面存在着较大区别:(1)选取调查单位的方式不同。重点单位的选取是根据重点的标志总量是否占据全部单位标志总量的绝大比重这一标准来确定的,这一标准是客观存在的。抽样单位是按随机原则从全部单位中抽选出来的。典型单位是对总体情况分析的基础上有意识地选取出来的;(2)调查目的不同。重点调查的目的是通过对重点单位的调查,掌握总体的基本情况和基本趋势;抽样调查的目的则是通过对部分单位的调查结果来推算总体的数量特征;作为统计意义上的典型调查,其目的是了解和推断同类事物;(3)推断总体的准确性和可靠程度不同。抽样调查在给定概率和误差范围条件下,可保证推断的准确性和可靠性;而典型调查难以保证推断结果的准确性和可靠性,误差既不知道又不

现代心理与教育统计学复习资料

第一章 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。

4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 %100 N f

(三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。

(完整版)社会统计学试卷A及答案解析

级专业2010学年第 1 学期《社会统计学》试卷 A 姓名:学号: (□开卷□闭卷) 一、选择题:2*10=20分 1、要了解400个学生的学习情况,则总体单位是( B ) 。 A 400个学生 B 每一个学生 C 400个学生的成绩 D 每一个学生的成绩 2、只与一个自由度有关的是( A ) χ分布 B 超几何分布C 泊松分布 D F分布 A 2 3、将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种 抽样方式叫( B )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 4、在方差分析中,自变量是(A )。 A 定类变量 B 定序变量 C 定距变量 D 定比变量 5、某城市男性青年27岁结婚的人最多,该城市男性青年结婚平均年龄为26.2岁,则该城 市男性青年结婚的年龄分布为(B)。 A.正偏B.负偏 C.对称D.不能作出结论 6、分析统计资料,可能不存在的平均指标是( A )。 A 众数 B 算术平均数 C 中位数 D 几何平均数 7、在一个左偏的分布中,小于平均数的数据个数将( C )。 A 超过一半 B 等于一半 C 不到一半 D 视情况而定 8、若P(A)=0.2,P(B)=0.6,P(A/B)=0.4,则) P I=( D )。 A (B A 0.8 B 0.08 C 0.12 D 0.24。 9、关于学生t分布,下面哪种说法不正确(B )。 A 要求随机样本 B 适用于任何形式的总体分布

C 可用于小样本 D 可用样本标准差S 代替总体标准差σ 10、对于大样本双侧检验,如果根据显著性水平查正态分布表得 Z α/2=1.96,则当零假 设被否定时,犯第一类错误的概率是( C )。 A 20% B 10% C 5% D .1% 二、判断题:2*10=20分 1、所有的统计指标都是变量。 ( 对 ) 2、统计所研究的对象就是社会经济现象的数量方面。 (错 ) 3、随机变量在相同的条件下进行观测,其可能实现的值不止一个。 (对 ) 4、在社会现象中,即使相同的意识作用也完全可能有不确定的结果,这就提供了概率论应用的可能性。 ( 对 ) 5、成功次数的期望值λ是决定泊松分布的关键因素。 ( 对 ) 6、进行区间估计,置信水平总是预先给定的。 ( 对 ) 7、可以对置信水平作如下解释:“总体参数落在置信区间的概率是(1-α)”。(错 ) 8、将收集到得的数据分组,组数越多,丧失的信息越多。 (错 ) 9、N 个变量值连乘积的平方根,即为几何平均数。 (错 ) 10、当样本容量n 无限增大时,样本均值与总体均值的绝对离差小于任意正数的概率趋于零。 (错 ) 三、简答题:5*7=35分 1、大数规律 大数规律是随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。 2、配对样本 所谓配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产生的。 3、消减误差比例 变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关 系时预测Y 的误差1E ,再将其化为比例来度量。将削减误差比例记为PRE 。 4、同分对 如果在X 序列中,我们观察到i j X =X (此时Y 序列中无i j Y =Y ),则这个配对仅是X 方向而非Y 方向的同分对;如果在Y 序列中,我们观察到i j Y =Y (此时X 序列中无i j X =X ),则这个配对仅是Y 方向而非X 方向的同分对;我们观察到i j X =X ,也观察到i j Y =Y ,则称这个配对为X 与Y 同分对。 5、什么是分层抽样? 分层抽样也叫类型抽样,就是先将总体按某种特征或属性分若干类别或层次,再按照一定比 例在各个子类别或层次中随机抽取,最后将各抽取的单位合并成样本。 6、简述回归分析和相关分析之间的密切联系。 一般说来,只有当两个变量之间存在着较高程度的相关关系时,回归分析才变得有意义和有价值。相关程度越高,回归预测越准确。因此,往往先进行相关分析,然后才选用有明显相关关系的变量作回归分析。与此同时,相关关系往往要通过回归分析才能阐释清楚,例如皮尔逊相关系数的PRE 性质。回归分析具有推理的性质,而相关分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。因而从分析层次上讲,回归分析更深刻一些。 7、P 值决策与统计量的比较 P 值是被称为观察到的(或实测的)显著性水平。用P 值进行检验比根据统计量检验提供更多

心理统计学重要知识点

心理统计学重要知识点 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

《心理统计学》重要知识点 第二章 统计图表 简单次数分布表的编制:Excel 数据透视表 列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表 直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。 条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。 简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。 复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。 圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。 线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势; 第三章 集中量数 ● 集中趋势和离中趋势是数据分布的两个基本特征。 ● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。 ● 集中量数:描述数据分布集中趋势的统计量数。 ● 离中趋势:是指数据分布中数据分散的程度。 ● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):n x X i ∑ = Excel 统计函数AVERAGE 算术平均数的重要特性: (1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i (2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后, 那么,变量Y 2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。中 位数上下的数据出现次数各占50%。 3.众数(mode ,M O ):一组数据中出现次数最多的数据。 4.算术平均数、中数、众数之间的关系。

相关文档
相关文档 最新文档