文档库 最新最全的文档下载
当前位置:文档库 › 实验二 定量资料的统计推断

实验二 定量资料的统计推断

实验二  定量资料的统计推断
实验二  定量资料的统计推断

实验二定量资料的统计推断

(总体均数的估计及t检验、z检验、F检验)

一、随机抽样调查上海市区男孩出生体重(kg),得下表数据,问

1、99%的男孩出生体重在什么范围?

2、全市男孩出生体重均数在什么范围?

3、某男孩出生体重为4.5kg ,怎样评价?

4、在这些男孩中随机抽样,根据正态分布理论抽到体重≤2.15(kg)的男孩的可能性

是多少?

5、在这些男孩中随机抽查10人,抽到出生体重均数为≤3.2(kg)的样本的可能性约有多少?

体重人数

2.0~ 1

2.2~ 2

2.4~ 5

2.6~ 10

2.8~ 12

3.0~ 24

3.2~ 23

3.4~ 22

3.6~ 17

3.8~ 7

4.0~ 3

4.2~ 2

4.4~4.6 1

二、将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前后(治后一月)的血沉(㎜/小时)如下表。

病人号甲治疗前药治疗后1 2 3 4 5 6 7 8 9 10 20 23 16 21 20 17 18 18 15 19 16 19 13 20 20 14 12 15 13 13

病人号乙治疗前药治疗后1 2 3 4 5 6 7 8 9 10 19 20 19 23 18 16 20 21 20 20 16 13 15 13 13 15 18 12 17 14

1、甲、乙两药是否均有效?

2、甲、乙两药的疗效有无差别?

三、某地抽样调查了部分健康成人的红细胞数和血红蛋白量,结果如下表:

2、分别计算男、女两项指标的抽样误差。

3、试估计该地健康成年男、女红细胞数的均数。

4、该地正常成年男、女血红蛋白含量有无差别?

5、该地成年男、女两项血液指标是否均低于上表地标准值?

四、为研究某药物的抑癌作用,使一批小白鼠致癌后,按完全随机设计的方法随机分为四组,A 、B 、C 三个试验组和一个对照组,分别接受不同的处理,A 、B 、C 三个试验组,分别注射0.5m1、1.0m1和1.5m1 30%的注射液,对照组不用药。经一定时间以后,测定四组小白鼠的肿瘤重量(g),测量结果见下表。问不同剂量药物注射液的抑癌作用有无差别?如有差别,请用SNK-q 检验方法作多重比较。

某药物对小白鼠抑癌作用(肿瘤重量,g)的试验结果

五、为研究注射不同剂量雌激素对大白鼠子宫重量的影响,取4窝不同种系的大白鼠,每窝3只,随机地分配到3个组内接受不同剂量雌激素的注射,然后测定其子宫重量,结果见下表。问注射不同剂量的雌激素对大白鼠子宫重量是否有影响? 如有影响,请用Dunnett-t 检验方法作多重比较。

大白鼠注射不同剂量雌激素后的子宫重量(g)

大白鼠

种系

雌激素剂量(μg/100g) 0.25 0.5 0.75 A

108 112 142 B

46 64 116 C

70 96 134 D 43 65 98

六、思考题及名词解释

1、试述正态分布、z 分布及t 分布的联系和区别。

2、均数的可信区间与参考值范围有何不同?试比较95%参考值范围与95%总体均数可信区间。

3、抽样分布(数理统计)的中心极限定理的内容是什么?

4、试举例说明标准差与标准误(即均数的标准差)的区别与联系。

对照组 试 验 组 A B C

3.6 3.0 0.4 3.3

4.5 2.3 1.8 1.2 4.2 2.4 2.1 1.3

4.4 1.1 4.5 2.5 3.7 4.0 3.6 3.1

5.6 3.7 1.3 3.2

7.0 2.8 3.2 0.6 4.1 1.9 2.1 1.4

5.0 2.6 2.6 1.3

4.5 1.3 2.3 2.1

5、假设检验和区间估计有何区别与联系?

6、假设检验中a与P有何区别与联系?

7、怎样正确选用单侧检验和双侧检验?

8、第一类错误与第二类错误有何区别及联系?

9、假设检验时,一般当P<0.05时,则拒绝H0,理论根据是什么?

10、z检验、t检验的应用条件是什么?

11、为什么假设检验的结论不能绝对化?

12、能否说假设检验的P值越小,比较的指标间差异越大?为什么?

13、假设检验的基本步骤

14、方差分析的基本思想和应用条件是什么?

15、在完全随机设计方差分析中的SS组间、SS组内各表示什么含义?

16、随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什

么不同?

17、配对t检验与配伍组设计的ANOV A之间有何联系?两样本t检验与完全随机

设计的ANOV A又有何联系?

18、为什么在方差分析的结果为拒绝H0、接受H1之后,对多个样本均数的两两比

较要用多重比较的方法,而不能用多个两两比较的t检验替代?

19、多个样本均数的两两比较方法有哪些?

20、抽样分布抽样误差(均数的抽样误差)标准误(样本均数的标准误)参数估计区间估计(总体均数的可信区间)第一类错误与第二类错误单侧检验与双侧检验检验水准a与概率P值

H0与H1 小概率事件及小概率事件原理

实验二 定量资料的统计推断

实验二定量资料的统计推断 (总体均数的估计及t检验、z检验、F检验) 一、随机抽样调查上海市区男孩出生体重(kg),得下表数据,问 1、99%的男孩出生体重在什么范围? 2、全市男孩出生体重均数在什么范围? 3、某男孩出生体重为4.5kg ,怎样评价? 4、在这些男孩中随机抽样,根据正态分布理论抽到体重≤2.15(kg)的男孩的可能性 是多少? 5、在这些男孩中随机抽查10人,抽到出生体重均数为≤3.2(kg)的样本的可能性约有多少? 体重人数 2.0~ 1 2.2~ 2 2.4~ 5 2.6~ 10 2.8~ 12 3.0~ 24 3.2~ 23 3.4~ 22 3.6~ 17 3.8~ 7 4.0~ 3 4.2~ 2 4.4~4.6 1 二、将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前后(治后一月)的血沉(㎜/小时)如下表。 病人号甲治疗前药治疗后1 2 3 4 5 6 7 8 9 10 20 23 16 21 20 17 18 18 15 19 16 19 13 20 20 14 12 15 13 13 病人号乙治疗前药治疗后1 2 3 4 5 6 7 8 9 10 19 20 19 23 18 16 20 21 20 20 16 13 15 13 13 15 18 12 17 14 1、甲、乙两药是否均有效? 2、甲、乙两药的疗效有无差别? 三、某地抽样调查了部分健康成人的红细胞数和血红蛋白量,结果如下表: 2、分别计算男、女两项指标的抽样误差。 3、试估计该地健康成年男、女红细胞数的均数。

4、该地正常成年男、女血红蛋白含量有无差别? 5、该地成年男、女两项血液指标是否均低于上表地标准值? 四、为研究某药物的抑癌作用,使一批小白鼠致癌后,按完全随机设计的方法随机分为四组,A 、B 、C 三个试验组和一个对照组,分别接受不同的处理,A 、B 、C 三个试验组,分别注射0.5m1、1.0m1和1.5m1 30%的注射液,对照组不用药。经一定时间以后,测定四组小白鼠的肿瘤重量(g),测量结果见下表。问不同剂量药物注射液的抑癌作用有无差别?如有差别,请用SNK-q 检验方法作多重比较。 某药物对小白鼠抑癌作用(肿瘤重量,g)的试验结果 五、为研究注射不同剂量雌激素对大白鼠子宫重量的影响,取4窝不同种系的大白鼠,每窝3只,随机地分配到3个组内接受不同剂量雌激素的注射,然后测定其子宫重量,结果见下表。问注射不同剂量的雌激素对大白鼠子宫重量是否有影响? 如有影响,请用Dunnett-t 检验方法作多重比较。 大白鼠注射不同剂量雌激素后的子宫重量(g) 大白鼠 种系 雌激素剂量(μg/100g) 0.25 0.5 0.75 A 108 112 142 B 46 64 116 C 70 96 134 D 43 65 98 六、思考题及名词解释 1、试述正态分布、z 分布及t 分布的联系和区别。 2、均数的可信区间与参考值范围有何不同?试比较95%参考值范围与95%总体均数可信区间。 3、抽样分布(数理统计)的中心极限定理的内容是什么? 4、试举例说明标准差与标准误(即均数的标准差)的区别与联系。 对照组 试 验 组 A B C 3.6 3.0 0.4 3.3 4.5 2.3 1.8 1.2 4.2 2.4 2.1 1.3 4.4 1.1 4.5 2.5 3.7 4.0 3.6 3.1 5.6 3.7 1.3 3.2 7.0 2.8 3.2 0.6 4.1 1.9 2.1 1.4 5.0 2.6 2.6 1.3 4.5 1.3 2.3 2.1

看医统学习题(计数资料)

《医学统计学习题》计数资料 5、有资料如下表: 甲、乙两个医院某传染病各型治愈率 病型 患者数治愈率(%)甲乙甲乙 普通型300 100 60.0 65.0 重型100 300 40.0 45.0 暴发型100 100 20.0 25.0 合计500 500 48.0 45.0 由于各型疾病的人数在两个医院的内部构成不同,从内部看,乙医院各型治愈率都高于甲医院,但根据栏的结果恰好相反,纠正这种矛盾现象的统计方法是: A、重新计算,多保留几位小数 B、对率进行标准化 C、对各医院分别求平均治愈率 D、增大样本含量,重新计算 6、5个样本率作比较,χ2>χ20.01,4,则在α=0.05检验水准下,可认为: A、各总体率不全等 B、各总体率均不等 C、各样本率均不等 D、各样本率不全等 7、两个独立小样本计量资料比较的假设检验,首先应考虑: A、用t检验 B、用Wilcoxon秩和检验 C、t检验或Wilcoxon秩和检验均可 D、资料符合t检验还是Wilcoxon秩和检验条件 13.对三行四列表资料作 2检验,自由度等于 A. 1 B. 2 C. 3 D. 6 E. 12 14. 根据下述资料,则 病情 病人数治愈数治愈率(%)病人数治愈数治愈率(%)轻型40 36 90 60 54 90 重型60 42 70 40 28 70 合计100 78 78 100 82 82 A. 乙疗法优于甲疗法 B. 甲疗法优于乙疗法 C. 甲疗法与乙疗法疗效相等 D. 此资料甲、乙疗法不能比较 E. 以上都不对15.在实际工作中,同质是指()。 A.被研究指标的非实验影响因素均相同。B.研究对象的测量指标无误差。 C.被研究指标的主要影响因素相同。D.研究对象之间无个体差异。E.以上都对。答案 5、有资料如下表: 甲、乙两个医院某传染病各型治愈率 病型 患者数治愈率(%)甲乙甲乙

作业与参考标准答案ch第三部分计数资料统计描述和统计推断

作业与参考标准答案ch第三部分计数资料统计描述和统计推断

————————————————————————————————作者:————————————————————————————————日期:

《医学统计学》 【教材】倪宗瓒主编.医学统计学.北京;高等教育出版 社.2004. 【作业】教材附录二 【习题解答】 第三单元 计数资料的统计描述和统计推断 分析计算题 3.1 解: (1) 100%= ?同年该年龄组死亡人数 年龄组死亡人数构成比某年某年龄组死亡总数 %39.1%1001802 25 ~0=?= 岁组死亡人数构成比 余类推; 10000010= ?同年该年龄组死亡人数 死亡率万某年某年龄组平均人口数 010000010 3.3610?=25 ~岁组死亡率= 万万745000 余类推; 岁组死亡率 各年龄组死亡率 相对比~0= 04.1336 .380 .43~30== 岁组相对比 余类推。 各年龄组死亡人数构成比、死亡率和相对比计算结果见表3.1.1。 表3.1.1 某地某年循环系统疾病死亡资料 年龄组 /岁 平均人口数 循环系统 死亡人数 死亡人数构成比 /% 死亡率 (1/10万) 相对比 (各年龄组死亡率/0~组死亡率)

0~ 745000 25 1.39 3.36 — 30~ 538760 236 13.10 43.80 13.04 40~ 400105 520 28.86 129.97 38.68 50~ 186537 648 35.96 347.38 103.39 60~ 52750 373 20.70 707.11 210.45 合 计 1923152 1802 100.00 93.70 — (2) 死亡人数构成比是指某年龄组死亡人数与各年龄组死亡人口总数之比,说明总死亡人数中各年龄组死亡人数所占的比重; 死亡率是指某年实际死亡数与该年可能发生死亡人数(本题即为该年平均人口数)之比,用以说明死亡发生的频率或强度; 相对比用以说明各年龄组死亡率是0~岁组死亡率的几倍或几分之几。 3.2解:因为甲、乙两医院某传染病的类型构成明显不同,且疾病类型对该病的治疗效果有影响,故应进行标准化,再比较两医院的治愈率。根据本题资料,以两医院合计病人数为标准人口,采用直接标准化法。 表3.2.1 直接法计算甲、乙两医院某传染病标准化治愈率/% 类型 标准病人数 N i 甲医院 乙医院 原治愈率/% p i 预期治愈人数 N i p i 原治愈率/% p i 预期治愈人数 N i p i 普通型 552 59.9 331 65.2 360 重 型 552 39.9 220 44.9 248 暴发型 252 19.8 50 25.4 64 合 计 1356 48.4 601( i i N p ∑) 45.4 672( i i N p ∑) 甲医院某传染病标准化治愈率:601 100%44.3%1356p '=?=甲 乙医院某传染病标准化治愈率:672100%49.6%1356p '=?=乙 可以看出,经标准化后乙医院的该传染病的治愈率高于甲医院。

统计学方积乾 第七版 第二章 定量资料的统计描述课后练习题答案

第2章 定量资料的统计描述 案例2-1(P27) 答:该资料为一正常人群发汞值的检测结果,已整理成频率分布表(P27)。统计描述时应首先考察资料的分布规律,通过频率(频数)分布表(表2-9 P27)和直方图(图2-3 P14)可以看出,此238人发汞值的频数分布呈正偏态分布,即观察值绝大多数集中在发汞值较小的组段。 对偏态分布,选用算术均数和标准差进行统计描述是不恰当的。应选用中位数描述该市居民发汞平均水平,选用四分位间距描述居民发汞值变异度,计算如下: 25507523.5(23825%20) 4.7(mol/kg) 6625.5(23850%86) 6.6(mol/kg) 602 7.5(23875%146)8.9(mol/kg) 48(%) x x L x i P L n x f f P u P u P u =+?==+?==+?==+?S

离散程度指标: 四分位间距=P75-P25=8.9-4.7=4.2umol/kg。 故该市居民发汞平均水平为6.6 umol/kg,离散度为4.2umol/kg,

思考与练习(P31) 1. 答: (1) 某年某地120例6-7岁正常男童胸围测量结果(cm)的频数分布 Group Frequency Percent Cumulative Percent 49.0- 1 .8 .8 50.0- 4 3.3 4.2 51.0- 8 6.7 10.8 52.0- 6 5.0 15.8 53.0- 19 15.8 31.7 54.0- 18 15.0 46.7 55.0- 14 11.7 58.3 56.0- 26 21.7 80.0 57.0- 10 8.3 88.3 58.0- 9 7.5 95.8 59.0- 4 3.3 99.2 61.0-62.0 1 .8 100.0 Total 120 100.0

实习2 定量资料的统计推断1

实习二 定量资料的统计推断 一、目的要求 1、掌握抽样误差、标准误、可信区间的概念及计算; 2、熟悉t 分布; 3、掌握假设检验的基本原理、有关概念(如I 、II 类错误)及注意事项; 4、掌握t 检验和u 检验的适用条件、基本步骤等。 二、主要内容 (一)基本概念 1.抽样误差 2.可信区间 (二)t 分布 1.以0为中心,左右对称的单峰分布; 2.t 分布曲线是一簇曲线,其形态与自由度v 的大小有关。自由度v 越小,则t 值越分散,曲线越低平;自由度v 逐渐增大时,t 分布逐渐逼近u 分布(标准正态分布);当v 趋于∞时,t 分布即为u 分布。 (三)总体均数的估计 1、点估计 2、区间估计 ①σ未知且n 较小:(/2X X t S αν-,,/2v X X t S α+,) ②σ未知但n 足够大:(/2X X u S α-,/2X X u S α+) ③σ已知:(X u X σα2/-,X u X σα2/+) (四)假设检验的步骤及有关概念 1、基本思想:小概率事件和反证法 2、基本步骤 (1)建立检验假设,确立检验水准 (2)选择检验方法,计算检验统计量 (3)确定P 值,下结论 P <α,拒绝H 0,接受H 1,差异有统计学意义,可以认为……不同。

P>α,不拒绝H0,差异无统计学意义,尚不能认为……不同。 3、两类错误: Ⅰ型错误是拒绝了实际上成立的H0,也称为“弃真”错误,用α表示。统计推断时,根据研究者的要求来确定。 Ⅱ型错误是不拒绝实际上不成立的H0,也称为“存伪”错误,用β表示。但β值的大小一般很难确切估计,只有已知样本含量n、两总体参数的差值δ以及检验水准α的条件下,才能估算出β的大小。 4、注意事项 (五)t检验和u检验 1、t检验的应用条件:独立性;σ未知且n较小时,要求样本来自正态分布总体;两样本均数比较时,还要求两样本所属总体的方差齐性。 2、u检验的应用条件:独立性;σ未知但n足够大(如n>100)或σ已知。 3、t检验与u检验,检验统计量的计算: 三、SPSS操作演示 1、单样本t检验 2、两独立样本t检验 3、两配对样本t检验 四、课堂讨论 1.根据以下案例资料回答问题:在对两组药物治疗某心血管病的临床试验研究中,选择了140例受试对象,得到如下结果:

计数资料的统计学分析 (1)

[模拟] 计数资料的统计学分析 A型题题干在前,选项在后。有A、B、C、D、E五个备选答案其中只有一个为最佳答案。 第1题: 计数资料又称如下哪一种资料 A.数量资料 B.抽样资料 C.普查资料 D.调查资料 E.定性资料 参考答案:E 答案解析: 第2题: 计数资料是指将观察单位按下列哪一种分组计数所得的资料 A.数量 B.体重 C.含量 D.属性或类型或品质 E.放射性计数 参考答案:D 答案解析: 第3题: 计数资料的初步分析常常要用下列哪些相对数 A.频数 B.频数和频率指标 C.率、构成比和相对比 D.构成指标和相对比 E.比和构成比 参考答案:C 答案解析: 第4题: 频率指标,它说明某现象发生的如下哪一种

B.强度 C.比重大小 D.例数 E.各组的单位数 参考答案:B 答案解析: 第5题: 构成指标,它说明一事内部各组成部分所占的如下哪一种大小 A.比重 B.强度 C.频数 D.频率 E.例数 参考答案:A 答案解析: 第6题: 对480人进行老年性白内障普查,分60岁一、70岁一和80岁一三个年龄组受检人数分别为300、150和30人,白内障例数分别为150、90和24人。回答70岁一年龄组的患病率(%)是多少 A.5 B.50 C.60 D.80 E.20 参考答案:C 答案解析: 第7题: 对1000人进行老年性白内障普查,分50岁一和60岁一两个年龄组,受检人数分别为480人和520人,白内障例数分别为120人和280人。回答患者50岁一年龄构成比(%)是多少 A.53.9 B.12 C.30 D.28

参考答案:C 答案解析: 第8题: 在计数资料计算相对数时,应注意如下哪些问题 A.分母不宜过大 B.可比性 C.随机性 D.分母不宜过小 E.分母宜中 参考答案:D 答案解析: 第9题: 在计数资料进行相对数间比较时,应注意如下哪些问题 A.分母不宜太小 B.可比性 C.可用频率指标代替构成指标 D.随机性和正态分布 E.其可比性和遵循随机抽样 参考答案:E 答案解析: 第10题: X2检验是要计算检验统计量X2值、X2值是反应如下哪种情况 A.实际频数大于理论频数 B.理论频数大于实际频数 C.实际频率和理论频率的吻合程度 D.实际频数和理论频数的吻合程度 E.实际频率大于理论频率 参考答案:D 答案解析: 第11题: X2值愈大,则X2值的概率P值如下哪种情况

(完整版)统计学方积乾第七版第二章定量资料的统计描述课后练习题答案课件

第2章定量资料的统计描述 案例2-1(P27) 答:该资料为一正常人群发汞值的检测结果,已整理成频率分布表(P27) 。统计描述时应首先考察资料的分布规律,通过频率( 频数) 分布表( 表2-9 P27) 和直方图( 图2-3 P14) 可以看出,此238人发汞值的频数分布呈正偏态分布,即观察值绝大多数集中在发汞值较小的组段。 对偏态分布,选用算术均数和标准差进行统计描述是不恰当的。应选用中位数描述该市居民发汞平均水平,选用四分位间距描述居民发汞值变异度,计算如下: i P = L + ( n? x% S f) x x L f x 2 P = 3.5 +(238? 25% 20) = 4.7(u mol/ kg) 25 66 2 P = 5.5 +(238? 50% 86) = 6.6(u m ol/ kg) 50 60

2 P = 7.5 +(238? 75% 146) = 8.9(u m ol/ kg) 75 48

离散程度指标: 四分位间距=P75-P25=8.9-4.7=4.2umol/kg。 故该市居民发汞平均水平为 6.6 umol/kg,离散度为4.2umol/kg,

思考与练习(P31) 1. 答: (1) N Range Min Max Mean 胸围120 12.7 49.1 61.8 55.120 某年某地120 例6-7 岁正常男童胸围测量结果(cm) 的频数分布 Group Frequency Percent Cumulative Percent 49.0- 1 .8 .8 50.0- 4 3.3 4.2 51.0- 8 6.7 10.8 52.0- 6 5.0 15.8 53.0- 19 15.8 31.7 54.0- 18 15.0 46.7 55.0- 14 11.7 58.3 56.0- 26 21.7 80.0 57.0- 10 8.3 88.3 58.0- 9 7.5 95.8 59.0- 4 3.3 99.2 61.0-62.0 1 .8 100.0 Total 120 100.0

定量资料统计学方法小结

计量资料分析常用的统计学方法小结 第二章、定量资料的统计描述 频率分布表与频率分布图: 描述平均水平的统计指标(描述集中趋势):算数均数、几何均数、中位数与百分位数、众数 描述变异程度的统计指标(描述离散趋势):极差、四分位数间距、方差、标准差、变异系数 描述分布形态的统计指标:偏度系数、峰度系数 第一节频率分布表与频率分布图 离散型定量变量和连续型定量变量的频率分布 离散型定量变量的取值是不连续的。直接清点各变量值出现的频数计算相应的频率,即为频率分布表。离散型定量变量的频率分布图可用直条图表达,以各等宽矩形直条的高度表示各组频率的大小。 连续型定量变量的取值是连续的。将数据适当分组,清点各组频数,并计算相应频率,即为频率分布表。连续型定量变量的频率分布图可用直方图表达,纵

坐标为频率密度,即频率/组距,直方图面积之和等于1. 1、离散型定量变量的频率分布 步骤:(1)直接清点各变量值出现的频数 (2)计算各组频率,累计频数,累计频率 2、连续型定量变量的频率分布 步骤: (1)求极差(range):即最大值与最小值之差,又称为全距。 (2)决定分组组数、组距:根据研究目的和样本含量n确定分组组数,通常分为10~15个组。组距=极差/组数,为方便计,组距为极差的十分之一, 再略加调整。 (3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值。 (4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。 编制频率表的注意事项: (1)分组不宜过粗,也不宜过细。通常分为10~15个组。 (2)为计算方便,组段下限一般取较整齐的数值。确定各组段上下限时,各组段要连续但不重叠。除去最后一个组段,其余组段应包含下限值,不包含上

统计学-计量资料的统计描述方法

计量资料的统计描述方法 怎样表达一组数据? 描述计量资料的常用指标— A 、描述平均水平(中心位置): 均数X 、中位数和百分位数、几何均数G 、众数(mode ) B 、描述数据的分散程度: 标准差、四分位数间距、 变异系数、方差、全距 (一)均数mean 和标准差standard deviation 1. (算术)均数X 均数是描述一组计量资料平均水平或集中趋势的指标。 *直接计算公式: 12n X X X X X n n +++== ∑L 应用条件:适用于对称分布,特别是正态分布资料。 2. 中位数(median )M 和百分位数(percentile ) A.中位数M 是将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。 应用条件: 用于任何分布类型,包括偏态资料、两端数据无界限的资料。

计算: n 为奇数时-- 1 ( )2 n M X += n 为偶数时-- ()(1)2212n n M X X +? ?=+ ? ?? 9人数据:12,13,14, 14, 15, 15, 15, 17, 19天 B.百分位数 是将N 个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X 百分位数。中位数是第百分50位数。 四分位数间距(quartile range ) = 第25百分位数(P25)~第75百分位数(P75)。 四分位数间距用于描述偏态资料的分散程度(代替标准差S ),包含了全部观察值的一半。 ) (天1552 19===+X X M 88451 22221415214.5() M X X X X ?? ==== ???+如果只调查了前八位中学生,则: +(+)(+)天

第三单元 计数资料的统计描述和统计推断(第一部分)

第三单元计数资料的统计描述和统计推断 【习题】 分析计算题 3.1 某地某年循环系统疾病死亡资料如表18。 表18 某地某年循环系统疾病死亡资料 年龄组/岁平均人口数 循环系统 死亡人数 死亡人数构成比 /% 死亡率 (1/10万) 相对比 (各年龄组死亡率 /0~组死亡率) 0~745000 25 30~538760 236 40~400105 520 50~186537 648 60~52750 373 合计1923152 1802 (1) 请根据以上数据计算各年龄组死亡人数构成比、死亡率和相对比。 (2) 分析讨论各指标的含义。 3.2 请就表19资料比较甲、乙两个医院某传染病的治愈率/%。 表19 甲、乙两院某传染病治愈率(%)的比较 类型 甲医院乙医院 病人数治愈数治愈率/% 病人数治愈数治愈率/% 普通型414 248 59.9 138 90 65.2 重型138 55 39.9 414 186 44.9 暴发型126 25 19.8 126 32 25.4 合计678 328 48.4 678 308 45.4 3.3 传统疗法治疗某病,其病死率为30%,治愈率为70%。今用某种新药治疗该病10人,结果有1人死亡。问该新药的治疗效果是否优于传统疗法(单侧)。

3.4 甲、乙两地各抽样调查1万名妇女,结果甲地卵巢癌患病人数100人,乙地卵巢癌患病人数80人,请问甲乙两地妇女的卵巢癌患病率是否不同。 3.5 对甲地一个由40名新生儿组成的随机样本进行某病的基因检测,结果阳性2例。据此资料,估计该地此病的基因总体携带率的95%可信区间。 3.6 已知一般人群中慢性气管炎患病率为9.7%,现调查了300名吸烟者,发现其中有63人患有慢性气管炎,试推断吸烟人群慢性气管炎患病率是否高于一般人群。 3.7 研究者取4mL某饮料进行细菌培养,得细菌数60个,试估计平均每1mL 饮料中细菌数的均值和标准差,并估计平均每1mL饮料中细菌数的95%可信区间。 3.8 分别从两种饮料中各取10mL样品进行细菌培养,甲饮料培养细菌440个,乙饮料培养细菌300个,问两种饮料中细菌数有无差别。 3.9 若某地区1998年新生儿腭裂发生率为2.15‰ ,1999年在此地区抽样调查1000名新生儿,发现腭裂1例,问此地区1999年腭裂发生率是否比1998年低。 3.10 对某地区居民饮用水进行卫生学检测中,随机抽查1mL水样,经培养获大肠杆菌菌落2个,试估计该地区水中平均每毫升所含大肠杆菌菌落的95%可信区间。 3.11 将80例均为初治的乳腺癌患者随机分配到甲乙两种治疗方案中,每组各40例,甲方案31例有效,乙方案14例有效,问两种治疗方案的有效率有无差别? 3.12 为了解某中药治疗原发性高血压的疗效,将44名高血压患者随机分为两组。实验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果如表20,问该药治疗原发性高血压是否有效? 表20 两种疗法治疗原发性高血压的疗效 分组例数有效有效率/% 实验组23 21 91.30 对照组21 5 23.81

七两独立样本定量资料的统计分析的Saa实现

第七章两独立样本定量资料的统计分析的Stata实现 例7-1 为研究金属镉中毒对大鼠肝脏中锌含量的影响,随机抽取20只小鼠,随机分为实验组和对照组。实验组小鼠每日经饮水染毒,对照组正常饮水。1个月后,测量小鼠肝脏中锌含量(ug/ml)(表7-1),试分析两种饮用水小鼠的肝脏中锌平均含量有无差异。 表7-1 实验组和对照组小鼠肝脏中锌含量(ug/ml)实验组7.14 5.95 7.10 8.26 10.08 7.91 9.07 9.30 8.64 8.51 对照组 6.61 7.31 7.20 6.59 7.65 5.59 6.39 6.57 7.91 7.86 例7-2 为研究接触某重金属对人体血胰岛素水平有无影响,研究者从接触某重金属的职业工人中随机抽取14人,从非接触工人中随机抽取14人,测量每个工人的血胰岛素水平(ulu/ml)(表7-2),试分析上述两个人群的血胰岛素平均水平有无差异。 表7-2 某重金属接触工人和非接触工人血胰岛素水平(ulu/ml) 7.84 8.11 8.45 9.38 10.22 12.28 11.57 接触重金属工人 11.38 8.23 8.92 3.02 4.54 7.11 6.04 17.94 7.42 9.12 9.45 7.86 16.48 24.12 非接触工人 8.57 8.92 6.74 9.23 16.29 5.73 8.51 例7-3 随机抽取30名在校大学生,男性16人,女性14人,检测血红蛋白含量(g/ul),问男性和女性大学生的血红蛋白平均含量有无差别?(数据略)

例7-4 例7-1中要检验两种饮水小鼠的肝脏锌平均含量有无差别,需要先检验实验组和对照组所来自的总体方差是否相等,即对例7-1中资料进行方差齐性检验。 例7-1的Stata数据格式如下:

6.计量资料的统计推断—t检验

6 计量资料的统计推断-t检验 t检验是以t分布为理论依据的假设检验方法,常用于正态总体小样本资料的均数比较,t检验统计量有三个不同的形式,适用于单因素设计的三种不同类型:①单个样本的均数与已知总体均数比较的检验,适用于单组设计,给出一组服从正态分布的定量观测数据和一个标准值(总体均值)的资料。②配对t检验,适用于配对设计。③成组t检验,适用于完全随机设计的两均数比较。 SPSS中使用菜单Analyze →Compore Means作t检验,Compore Means的下拉菜单如表6-1所示。 表6-1 Compore Means下拉菜单 Means…分层计算… One-Sample T Test…单样本t检验… Independent-Samples T Test…独立样本t检验… Paired-Sample T Test…配对t检验… One-Way ANOV A…单因素方差分析… 6.1 计量资料的分层计算 Means过程可以对计量资料分层计算均数、标准差等统计量,同时可对第一层分组进行方差分析和线性趋势检验。 例6-1某学校测得不同年级、不同性别的12名学生的身高(cm),数据见表6-2。试用SPSS的Means过程分别计算不同年级、不同性别学生身高的均数和标准差。 表6-2 12名学生的身高(cm) 解年级:1=“初一”、2=“高一”,性别:1=“男”、2=“女”。 选择Analyze→Compare Means→Means命令,弹出Means对话框,如图6-2。在变量列表中选中身高,送入Dependent(因变量)框中;选中年级,送入Independent(自变量),确定第一层依年级分组,单击Next按钮,选中性别,送入Independent,确定第二层依性别分组;单击OK。输出结果如图6-3所示。 在Means对话框单击Options(选项)按钮,弹出Means:Options对话框,可以选择要计算的统计量,默认Mean、Number of cases、Standard Deviation;在Statistics for First Layer中,可对第一层分组作方差分析(Anova table and eta)和线性趋势检验(Test for linearity)。

两样本定量资料的统计分析

一、选择题 1.在两样本均数比较的t 检验中,无效假设是( )。 A.两样本均数不等 B.两样本均数相等 C.两总体均数不等 D.两总体均数相等 E.样本均数等于总体均数 2.两样本均数比较的t 检验,差别有统计意义时,P 越小,说明( )。 A.两样本均数差别越大 B.两总体均数差别越大 C.越有理由认为两总体均数不同 D.越有理由认为两样本均数不同 E.越有理由认为两总体均数相同 3.正态性检验,按α=0.10水准,认为总体服从正态分布,此时若推断有错,其错误的概率( )。 A.大于0.10 B.小于0.10 C.等于0.10 D.等于β,而β未知 E.等于1–β,而β未知 4.以下检验方法除 外,其余均属非参数方法。 A. t 检验 B. H 检验 C. M 检验 D. 2χ检验 E. 符号秩和检验 5.两小样本定量资料比较的假设检验,首先应考虑 。 A. 用t 检验 B. 用秩和检验 C. t 检验与秩和检验均可 D. 资料符合t 检验还是秩和检验的条件 E. 2χ检验 6.在作两样本均数比较时,已知1n 、2n 均小于30,总体方差不齐且呈极度偏峰的资料宜用 。 A. 't 检验 B. t 检验 C. u 检验 D. 秩和检验 E. 't 检验与秩和检验均可 7.三组比较的秩和检验,样本例数均为5,确定P 值应查 。 A. 2χ界值表 B. H 界值表 C. T 界值表 D. M 界值表 E. 以上均不可 二、简答题 1.成组t 检验的应用条件是什么?如何判断? 2.成组t 检验的应用条件不满足时,如何比较两样本? 3. 秩和检验有哪些优缺点? 4.两组或多组有序分类资料的比较,为什么宜用秩和检验而不用2χ检验?

相关文档
相关文档 最新文档