两独立样本t检验和非参数检验的实证分析
龙源期刊网 https://www.wendangku.net/doc/19850310.html, 两独立样本t检验和非参数检验的实证分析作者:张家骥 来源:《经营者》2013年第11期 摘要:教学质量是靠具体课程完成,课程的建设是教学质量提升的重要环节和基本保证。本文简述了概率论与数理统计重点课程建设的必要性,重点在于对课程建设前后分层随机抽样得来的样本进行实证分析。实证分析主要从基本统计分析、参数检验、非参数检验三个大的方面进行,尤其是非参数检验方面,又具体利用了三种不同的检验法进行分析推断。 关键词:t检验;非参数检验;显著性水平;频数分析 概率论与数理统计是我国高等院校理工类、经济类、管理类各专业的一门重要公共基础课程,同时也是一门应用广泛,适用性强的工具课。此门课程的教学为学生的其他专业课及其将来毕业后的工作、继续深造等方面奠定必要的数学基础,而且对培养学生的逻辑思维能力、分析判断问题能力、统计观点、应用能力和创新能力均有着特殊而又重要的作用,是培养高素质综合型人才的重要保证。 笔者本身是东华理工大学理学院的一线教师,这两年来,同时在江西财经大学统计学院读研究生。在此期间,笔者主持的“概率论与数理统计”重点课程建设项目小组一直在努力的探索和研究,收获了一些成果。本文的主要目的是针对进行重点课程建设这几年来,对搜集到的学生该门课程的考试成绩从统计学的角度进行实证分析。尤其是从参数检验和非参数统计两个重要角度进行探究,论证这几年来进行课程建设是否让学生成绩取得了明显的提高。 本文数据来源于东华理工大学所有开设了概率论与数理统计课程的学院,分别收集了2010学年第二学期(即下半年)概率成绩和2012学年第二学期概率成绩。总共十个学院,进行分层随机抽样,对每个学院随机抽取10名学生,最终获到两组样本,每组各100个样本点。下面开始进行实证分析: 一、基本统计分析 对数据的分析首先从基本统计分析入手。通过基本统计分析,掌握数据的基本统计特征,同时迅速把握数据的总体分布形态。而基本统计分析往往先从频数分析开始,由于成绩数据均为定距型数据,直接采用频数分析不利于对其分布形态的把握,因此先对数据分组后再进行频数分析。SPSS频数分析的操作如下:选择菜单【Analyze】→【Descriptive】→【Frequencies】,结果如下: 从上面的统计表中可以看出,进行重点课程建设后,平均分有了明显的提高,而且从频数分布表可以看出,第3组第4组即中高分数段百分数有了明显提升。从数据的角度初步说明课程建设有效果,学生成绩明显改善。
第十一章 非参数检验
第十一章非参数检验 第一节符号检验 符号检验的方法·符号检验的特点和作用 第二节配对符号秩检验 配对符号秩检验的方法·配对符号秩检验的效力 第三节秩和检验 秩和检验的方法·秩和检验的近似 第四节游程检验 游程的概念·游程检验的方法·差符号游程检验 第五节累计频数检验 累计频数检验的方法·累计频数检验的应用 一、填空 1.非参数检验,泛指“对分布类型已知的总体进行参数检验”()的所有检验方法。 2.符号检验的零假设就是配对观察结果的差平均起来等于()。 3.理论研究表明,对于配对样本非正态分布的差值d,()是最佳检验。 4.秩和检验检验统计量U是U1和U2中较()的一个。 5.秩尺度之统计量的均值和标准差只取决于()。 6.()常被用作经验分布与理论分布的比较。 7.绝对值相等的值,应将它们的秩()。 8.符号检验,在分布自由检验中称为()。 9.符号检验和配对符号秩检验,都只适用于()样本。 10.数据序列ABBABAAABABBABBAAAAAB的总游程数是() 二、单项选择 1.下列检验中,不属于非参数统计的方法的是()。 A 总体是否服从正态分布 B 总体的方差是否为某一个值 C 样本的取得是否具有随机性 D 两组随机变量之间是否相互独立 2.下列情况中,最适合非参数统计的方法是()。 A 反映两个大学新生成绩的差别 B 反映两个大学新生家庭人均收入的差别 C 反映两个大学三年级学生对就业前景的看法差别 D反映两个大学在校生消费水平的差别 3.不属于非参数检验的是()。 A符号检验B游程检验C累计频数检验 D F检验 4.在累计频数检验中,卡方的自由度为()。 A n1 B 2 C n2 D n1+n2
第7章 非参数检验试题
第7章非参数检验试题 选择题: 1、4组学生成绩(优、良、中、差)比较,宜用(B )。 A 方差分析 B 秩和检验 C 卡方检验 D 四格表直接计算概率法 2、两样本秩和检验的无效假设是(B )。 A 两样本秩和相等 B 两总体分布相同 C 两样本分布相同 D 两总体秩和相等 3、(C ),应该用非参数统计方法。 A 正态分布资料n不相等时两样本均数比较 B 正态分布资料两样本方差都比较大时两样本均数的比较 C 两组等级资料的比较 D 两组百分比资料的平均数比较 4、在统计检验中是否选择用非参数统计方法,( A )。 A 要根据研究目的和数据特征作决定 B 可在算出几个统计量和得出初步结论后进行选择 C要看哪个统计结论符合专业理论 实验组对照组 实测值甲的编秩乙的编秩实测值甲的编秩乙的编秩 10 7.5 7.5 10 7.5 7.5 12 9 9 8 4 5 15 10 10.5 8 5 5 15 11 10.5 6 1 2 17 12 13 6 2 2 17 13 13 6 3 2 17 14 13 8 6 5 19 17 17 19 17 17 19 17 17 20 20 20.5 19 17 17 20 21 20.5 19 17 17 21 22 22 D 要看哪个P值更小 5、下表列出了成组设计的两样本资料及甲乙两个研究者的编秩结果,下面哪一个说法是对的?( C ) A 甲的编秩方法是错的 B 乙的编秩方法是错的 C 甲乙两人方法均对 D 甲乙两人的编秩方法均错 6、以下检验方法中,(A )不属于非参数统计方法。 A.t检验 B.H检验 C.T检验D.χ2检验 7、为判断各总体均数是否相等,对于来自方差齐性及正态分布总体的多个样本比较,可以作秩和(H)检验,通过判断各总体分布的位置是否相同而判断各总体均数是否相等,与作方差分析相比( C )。 A.应该把α定得小一点 B.将增大犯I类错误的概率
非参数检验
第十一章非参数检验 本章讲述某些用于定序尺度的双样本检验。与上一章所讲的检验不同,使用这类方法不需要对总体分布作任何事先的假定(例如正态总体)。同时从检验的内容来说,也不是检验总体分布的某些参数(例如均值、成数、方差等),而是检验总体某些有关的性质,所以称为非参数检验。非参数检验,泛指“对分布类型已知的总体进行参数检验”之外的所有检验方法。 与均值差等检验比较,非参数检验有什么优点呢?在对均值差进行t检验时,不仅要有定距尺度的假定,还要有正态总体的假定。当然,对于大样本,正态总体的假定可以放松。但正是对于小样本,这种假定最容易出问题。因此,在满足下面两条件之一时,我们期望用非参数检验代替均值差检验:①没有根据采用定距尺度,但可以安排数据的顺序(即秩);②样本小且不能假定具有正态分布。由于非参数检验不能充分利用全部现有的资料信息。因此,如果有根据采用定距尺度,并且如果对于小样本能够假定其具有正态性,或对大样本能够放松对正态性假定的要求,一般宁愿使用均值差检验,而不用非参数检验。 非参数检验,无需做出经典统计所必要的关于分布的任何假设。唯一需要的假设是:全部数据或数据对都出自相同的基本总体,且取样是随机的、相互独立的。基于这种原因,非参数检验又称为分布自由(或无分布)检验。“无分布”不是指总体真的无分布,而是指虽有时对总体分布一无所知,但仍可以进行分析。不仅如此,这些很容易理解的方法还可以用于处理等级的资料和定性的信息。 很显然,如果把从一个正态总体中抽取的数据用分布自由来处理,其效果肯定不如相应的参数检验有力。我们一般用下述指标来确定非参数检验的“效率” E n = n n 非参数检验中的 参数检验中的 0第一节符号检验 “符号检验”是针对观察结果之差的符号来作估价的。在单一实验组的实验中,对于样本中每个个体的前测与后测,如果我们并不关心(X1―X0)的具体数值,而只关心是增大了还是减小了。 符号检验的零假设就是配对观察结果的差平均起来等于零:人们期望这些差中有一半小于零(负号),而另一半大于零(正号),因此符号检验就是对差分布之中位数为零的零假设检验。 符号检验是二项检验的一种实际应用,即先假设p=0.5,按二项分布计算正号“+”出现次数之抽样分布,然后以样本中正号“+”出现的次数x作为检验统计量。如果它是B(x;n,0.5)下的小概率事件,便否定对差分布之中位数为零的零假设,即认为两总体存在平均水平上的差别。 像符号检验这样的非参数值验,在分布自由检验中称为简便检验(或快速检验)。这类检验方法的特点,不仅在于其计算方法具有简捷性,而且在于其应用范围十分广泛。其缺点是检验效力低,因为在统计决策中它仅利用了数据中的部分信息。同有关的最佳参数或非参数检验相比,简便检验的统计决策是保守的,即它接受零假设已远远超过了必要程度,它拒绝零假设则需要有更大的样本容量。
SPSS的参数检验和非参数检验
S P S S的参数检验和非 参数检验 公司内部档案编码:[OPPTR-OPPT28-OPPTL98-OPPNN08]
实验报告 SPSS的参数检验和非参数检验 学期:_2013__至2013_ 第_1_学期 课程名称:_数学建模专业:数学 实验项目__SPSS的参数检验和非参数检验实验成绩:_____ 一、实验目的及要求 熟练掌握t检验及其结果分析。熟练掌握单样本、两独立样本、多独立样本的非参数检验及各种方法的适用范围,能对结果给出准确分析。 二、实验内容 使用指定的数据按实验教材完成相关的操作。 1、给幼鼠喂以不同的饲料,用以下两种方法设计实验: 方式1:同一鼠喂不同的饲料所测得的体内钙留存量数据如下: 方式2:甲组有12只喂饲料1,乙组有9只喂饲料2,所测得的钙留存量数据如下:
请选用恰当方法对上述两种方式所获得的数据进行分析,研究不同饲料是否使幼鼠体内钙的留存量有显着不同。 2、为分析大众对牛奶品牌是否具有偏好,随机挑选超市收集其周一至 周六各天三种品牌牛奶的日销售额数据,如下表所示: 请选用恰当的非参数检验方法,以恰当形式组织上述数据进行分析,并说明分析结论。 实验报告附页 三、实验步骤 (一) 方式1: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Paired-Samples T Test,出现窗口; 3、把检验变量饲料1,饲料2 选择到Paired Variables框,单击OK。方式2: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Independent-Samples T Test,出现窗口 3、选择检验变量饲料到Test Variable(s)框中。 4、选择总体标志变量组号到Grouping Variables框中。 5、单击Define Groups按钮定义两总体的标志值1、2,单击OK。
非参数检验卡方检验实验报告
大理大学实验报告 课程名称生物医学统计分析 实验名称非参数检验(卡方检验) 专业班级 姓名 学号 实验日期 实验地点 2015—2016学年度第 2 学期
Fisher 的精确检验:精确概率法计算的卡方值(用于理论数E<5)。 不同的资料应选用不同的卡方计算方法。 例为2*2列联表,df=1,须用连续性校正公式,故采用“连续校正”行的统计结果。 X2=,P(Sig)=<,表明灭螨剂A组的杀螨率极显着高于灭螨剂B组。 例 表3 治疗方法* 治疗效果交叉制表 计数 治疗效果 123 合计 治疗方法11916540 21612836 31513735合计504120111 分析:表3是治疗方法* 治疗效果资料分析的列联表。 表4 卡方检验 X2值df渐进 Sig. (双侧) Pearson 卡方 1.428a4.839
似然比4.830线性和线性组合.5141.474 有效案例中的 N111 a. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为。 分析:表4是卡方检验的结果。自由度df=4,表格下方的注解表明理论次数小于5的格子数为0,最小的理论次数为。各理论次数均大于5,无须进行连续性校正,因此可以采用第一行(Pearson 卡方)的检验结果,即 X2=,P=>,差异不显着,可以认为不同的治疗方法与治疗效果无关,即三种治疗方法对治疗效果的影响差异不显着。 例 表5 灌溉方式* 稻叶情况交叉制表 计数 稻叶情况 123 合计 灌溉方式114677160 2183913205 31521416182合计4813036547 分析:表5是灌溉方式* 稻叶情况资料分析的列联表。
数理统计 实验三 非参数假设检验
西北农林科技大学实验报告 学院名称:理学院专业年级: 姓名:学号: 课程:数理统计学报告日期: 实验三非参数假设检验 一.实验目的 1.验证某产品的合格率是否是否低于0.9. 2.检验某地区儿童身高是否符合正态分布。 3.为研究心脏病猝死人数与日期的关系,收集到168个观测数据, 利用这批样本数据推断猝死人数与日期的关系是否为2.8:1:1:1:1:1:1. 4.某工厂用甲乙两种工艺生产同一种产品,利用样本数据检验两种 工艺下产品使用寿命是否存在显著差异。 二.实验要求 用spss实现非参数假设检验,包括二项式检验,单样本正态分布检验,两个独立样本检验,卡方检验。 三.实验内容 (一)验证某产品的合格率是否是否低于0.9. 打开文件“非参数检验(产品合格率)”,点击分析->非参数检验->旧对话框->二项式,把数据“是否合格”添加到检验变量列表,把检验比例默认的0.5该为题目要求的0.9(如图所示)。
点击确定得到结论(如图所示)。 结论: 0.80.90.1930.05(1p) 0.90.123w p P p n ????--??≥=>??-??????? 由上表知,SPSS 的悖假设检验案例比例小于0.9的,并且在精确显著(单侧)值sig=0.193>0.05,即接受原假设检验,即二项式检
验的案例比例是大于0.9的。 (二)检验某地区儿童身高是否符合正态分布。 打开文件“非参数检验(单样本KS-儿童身高)”,点击分析->非参数检验->旧对话框->1样本,把数据“周岁儿童的身高(sg)”添加到检验变量列表,检验分布默认为常规,即正态(如图所示)。 点击确定得到结论(如图所示)。
方差分析与非参数检验
北京建筑大学 理学院信息与计算科学专业实验报告 课程名称《数据分析》实验名称方差分析与非参数检验实验地点基C-423 日期2017.3.30 (1)熟悉数据的基本统计与非参数检验分析方法; (2)熟悉撰写数据分析报告的方法; (3)熟悉常用的数据分析软件SPSS。 【实验要求】 根据各个题目的具体要求,完成实验报告。 【实验内容】 1、附件给出某年房屋价格的相关数据,请选用恰当的分析方法,对影响房屋价格的因素进行分析。(注意数据要调整成标准的格式,变量值、组别(字符变量转换成数值变量))(单因素方差分析选择其中两个因素、双因素方差分析选择其中任一对因素即可) 2、附件给出管理才能评分的相关数据,请选用恰当的分析方法,分析该评分数据是否服从正态分布。 3、附件给出了某体育比赛的两位裁判打分数据,请选用恰当的分析方法,检验该两组评分分布是否有显著差异。(注意数据要调整成标准的格式,变量值、组别) 4、附件给出了减肥茶数据,请选用恰当方法分析,检验该减肥茶是否对减肥有显著效果。(注意数据要调整成标准的格式,变量值、组别) 【分析报告】 1、对影响房屋价格的因素进行分析。(单因素方差分析选择其中两个因素、双因素方差分析选择其中任一对因素即可)。 表1-1(a) 装修状况对均价影响的单因素方差分析结果 均价 平方和df 均方 F 显著性 组间79.180 1 79.180 62.408 .000 组内230.914 182 1.269 总数310.094 183 表1-1(b) 所在区县对均价影响单因素方差分析结果 均价 平方和df 均方 F 显著性 组间91.919 3 30.640 25.279 .000 组内218.174 180 1.212 总数310.094 183 表1-1(a)是装修状况对均价影响的单因素方差分析结果。可以看到:观测变量均价的离差平方总和为310.094;如果仅考虑装修状况单个因素的影响,则均价总变差中,不同装修状况可解释的变差为79.180,抽样误差引起的变差为230.914,它们的方差分别为79.180和1.269,相除所得的F统计量的观测值为62.408,对应的概率P-值近似为0.如果显著性水平α为0.05,由于概率P-值小于显著性水平α,应拒绝原假设,认为不同装修状况对均价的平均值产生了显著影响,不同装修状况对均价的影响效应不全为0。 表1-1(b)是所在区县对均价影响单因素方差分析结果。可以看到:如果仅考虑所在区县单个因素的影响,则均价总变差310.094中不同所在区县可解释的变差为91.919,抽样误差引起的变差为218.174,
非参数检验 SPSS操作
非参数检验的SPSS操作 前面一章介绍的二项分布的比率检验、配合度检验——卡方检验和1-Sample K-S检验等都属于非参数检验。这一节我们主要结合前面参数假设检验一章讲过的t检验以及方差分析一章讲过的方差分析,来进一步分析,当参数检验的前提条件不满足时,两个样本和多个样本平均数差异的SPSS操作方法。 一、两个独立样本的差异显著性检验 两独立样本的的差异显著性检验只有在满足如下条件时才能进行T检验:变量为正态分布的连续测量数据。若数据不满足这样的条件,强行进行T检验容易造成错误的结论。在数据不能满足这种参数检验的条件下,我们可以选择非参数检验方法进行。与两独立样本差异显著性检验相对应的方法可以在SPSS主菜单Analyze / Nonparametric Tests / 2 Independent Samples…中得到。 1.数据 采用本章第一节中例2的数据(数据文件“9-4-1.sav”),具体介绍操作过程。 2.理论分析 对于数据文件9-4-1.sav中的数据,目的是检验男女生之间注意稳定性是否存在显著差异,注意稳定性测量的结果虽然是测量数据但是从总体上来看不满足正态分布的前提假设,另外不同性别的学生可以看成是两组独立的样本,因此对上述资料的检验可以用非参数的独立样本的检验方法。 2.操作过程 (1)在SPSS主菜单中选择Analyze / Nonparametric Tests / 2 Independent Samples…得到两个独立样本非参数检验的主对话框(图9-1),把因变量atten选入到检验变量表列(Test Independent-Sample
两个独立样本的非参数检验方法有哪四种
两个独立样本的非参数检验方法有哪四种 两独立样本的非参数检验是在对总体分布不很了解的情况下,通过分析样本数据,推断样本来自的两个独立总体分布是否存在显著差异。一般用来对两个独立样本的均数、中位数、离散趋势、偏度等进行差异比较检验。 一、Mann-Whitney U检验 主要通过对平均秩的研究来实现推断。 将数据按照升序进行排序,每一个具体数据都会有一个在整个数据中的名次或排序序号,这个名次就是该数据的秩。 相同观察值(即相同秩,ties),取平均秩。 两独立样本的Mann-Whitney U检验的零假设 H0:两个样本来自的独立总体均值没有显著差异。 将两组样本(X1 X2 …… Xm)(Y1 Y2 …… Yn)混合升序排序,每个数据将得到一个对应的秩。 计算两组样本数据的秩和Wx ,Wy 。 N=m+n Wx+Wy= N(N+1)/2 如果H0成立,即两组分布位置相同,Wx应接近理论秩和 m(N+1)/2; Wy 应接近理论秩和n(N+1)/2)。 如果相差较大,超出了预定的界值,则可认为H0不成立。 二、两个独立样本的K-S检验 K-S检验不仅能够检验单个总体的分布是否与某一理论分布差异显著,还能够检验两个总体的分布是否存在显著差异,其零假设是两组独立样本来自的两个总体的分布无显著差异。 两个独立样本K-S检验的基本思想与前面讨论的单样本K-S检验的基本思路大体一致。这里是以变量值的秩作为分析对象,而非变量值本身。其基本思路如下: ①首先,将这两组样本混合并按升序排序。 ②然后分别计算两组样本秩的累计频数和累计频率。
最后,计算累计频率之差,得到秩的差值序列并得到D统计量(同单样本K-S检验,但无需修正)。 三、游程检验(Wald-Wolfwitz Runs) 零假设是H0:为样本来自的两独立总体分布没有显著差异。 样本的游程检验中,计算游程的方法与观察值的秩有关。首先,将两组样本混合并按照升序排列。在数据排序时,两组样本的每个观察值对应的样本组标志值序列也随之重新排列,然后对标志值序列求游程。 如果计算出的游程数相对比较小,则说明样本来自的两总体的分布形态存在较大差距;如果得到的游程数相对比较大,则说明样本来自的两总体的分布形态不存在显著差距。 SPSS将自动计算游程数得到Z统计量,并依据正态分布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为两个样本来自的总体分布有显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设H0,认为两个样本来自的总体分布无显著差异。 四、极端反应检验 从另一个角度检验两独立样本所来自的两个总体分布是否存在显著差异。其零假设是来两独立样本来自的两个总体分布无显著差异。 极端反应检验的基本思想是将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现极端反应。如果试验样本没有出现极端反应,则认为两总体分布无显著差异,反之,则总体分布存在显著差异。
非参数检验
非参数检验Nonparametric Tests菜单 概述 非参数统计是统计分析的重要组成部分,其优点是适用范围广(通用的统计方法),可用于等级资料和开口资料,缺点是检验效能低。目前,非参数统计的一般性统计分析的理论发展远远不及参数检验完善,比较完善的可供使用的方法也不多。比如多个样本间两两比较的非参数检验,虽然已有好几种方法可资利用,但由于在理论上仍存在争议,权威的统计软件(如SAS和SPSS)均没有提供这方面的方法。 虽然这些权威的统计软件没有提供两两比较的非参数方法,但是,国产的统计软件大都提供了两两比较的方法。因此建议大家:如果真的要做这方面的非参数分析,不如直接用PEMS、SPLMWIN、NOSA等国产软件,免得用SPSS等只能做一半。 在SPSS中,提供了8种非参数检验方法,放入了Nonparametric Tests菜单中,分为两大类: (一)分布类型的检验过程: 亦称拟合优度检验方法,即检验样本所来自的总体是否服从某种理论分布。 1、Chi-square test:用卡方检验来检验变量的几个取值所占百分比是否和我们期望的比例有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%,随便举例)。请注意该检验和我们一般所用的卡方检验不太一样,我们一般作的卡方检验要用crosstable菜单来完成,见上一章,而不是这里讨论。 2、Binomial T est:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以是连续性变量,然后按你给出的分界点一分为二。 3、Runs T est:用于检验某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。 4、One-Sample Kolmogorov-Smirnov T est(1-Sample K-S..):采用柯尔莫诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。 (二)分布位置的检验过程: 用于检验样本所在的总体分布位置或形状是否相同。我们平时所说的,所用的非参数检验方法实际上指的就是这一类方法。具体包含以下几种方法: 1、T wo-Independent-Samples T ests:即成组设计的两样本均数比较的非参数检验。 2、T ests for Several Independent Samples:成组设计的多个样本均数比较的非参数检验,此处不提供两两比较方法。 3、T wo-Related-Samples T ests:配对设计两样本均数的非参数检验。 4、T ests for Several Related Samples:配伍设计多个样本均数的非参数检验,此处同样不提供两两比较。 本次实习只要求掌握分布位置的检验过程
非参数假设检验及其运用
非参数假设检验法及其运用 摘要:在国际金融危机下?以中国股市数据为依据,运用S-plus 统汁分析软件和Excel , 对中国股市正态分布假设进行了 Kolmogorv 拟合优度检验,运用方差平方秩检验方法,比 较分析了上证指数和深证综指的波动性。 关键字:股市:Kolmogorov 拟合优度检验:秩检验。 引言:对中国股市分布的研究,国内各学者对中国股市进行了非参数检验0王金玉、李霞、 潘德惠(2005)通过引入一种新的估计方法“非参数假设检脸方法”,以达到对证券投资咨询 机构,对证券市场大盘定势预测准确度的估计。周明磊(2004)运用非参数非线性协整检验? 对上证指数与深成指间协整关系进行了研究,结论是:上证指数□深圳成指之间确实存在非 线性的协整关系。方国斌(2007)从分析中国股市收益率序列的特征入手,寻找描述中国股市 波动性特征的合适的统计模型。 在研究相关文献的基础上,将非参检验应用于中国股市统计特征的研究。运用 Kolmogorov 拟合优度检验,对中国般市进行了正态分布假设检验;运用方差平方秩检验方 法,比较分析了上海指数和深圳综指的波动性。 正文: 一、Kolmogorov 拟合优度检脸以及方差的平方秩检验方法。 (―)Kolmogorov 拟合优度检验 1?原假设和备择假设 原假设H 。:样本来自于正态分布总体。 备择假设H(:样本不是来自于正态分布总体。 2?检验统i|?量 令S (X)是样本X 「X2、…X“、的经验分布函数,Fhx)是完全已知的假设分布函数. 则检验统il ?量T 为S(x)片F*(x)的最大垂宜距离,即:T = supl F*(x)-S(x)L 3. P 值计算 近似P 值可以通过在表A13中插值得到,或者利用2倍的单边检验的P 值。 (-)方差的平方秩检验 1. 原假设和备择假设 (1) 双边检验 原假设Ho :除了它们的均值可能不同外,X 和Y 同分布。 2 // Z ?、/T I ?丿 单边P 值二》 7=1 W 人 且是小于等于nU-t)的最大整数。当给迫的显著性水平a 大于或等于P 值时,拒绝原 假设° 在本文中,该检验是运用S-plus 统il ?分析软件实现的。 这里I 的是检验统il ?量的观测值,(n(M)l
两个独立样本的非参数检验方法有4种
两个独立样本的非参数检验方法有4种 曼-惠特尼U检验(Mann—whitney U) 两个独立的曼-惠特尼U检验可用于对两个总体分布的比较判断。其零假设是两组独立样本来自的总体分布无显著差异。曼-惠特尼U检验通过对两组样本平均秩的研究来实现推断秩简单的说就是变量值排序的名次。 两个独立样本的K-S检验 K-S检验不仅能够检验单个总体的分布是否与某一理论分布差异显著,还能够检验两个总体的分布是否存在显著差异,其零假设是两组独立样本来自的两个总体的分布无显著差异。 两个独立样本K-S检验的基本思想与前面讨论的单样本K-S检验的基本思路大体一致。主要差别在于:这里是以变量值的秩作为分析对象,而非变量值本身。其基本思路如下: ①首先,将这两组样本混合并按升序排序。 ②然后分别计算两组样本秩的累计频数和累计频率。 ③最后,计算累计频率之差,得到秩的差值序列并得到D统计量(同单样本K-S检验,但无需修正)。 两独立样本的游程检验 单样本游程检验用来检验变量值的出现是否随机,而两个独立变量游程检验则用来检验两个独立样本来自的两个总体的分布是否存在显著差异。其零假设是两组独立样本来自的两个总体的分布无显著差异。 两独立样本的游程检验与单样本游程检验的基本思想相同,不同的是计算游程数的方法。两独立样本的游程检验中,又程数依赖于变量的秩。 步骤如下:首先,将两组样本混合并按升序排列,在变量值排序的同时,对应的组标记值也会随之重新排列。 然后,对组标记只序列按前面讨论的游程的方法计算游程数容易理解:如果两总体的分布存在较大的差距,那么游程数会相对比较少,如果游程数比较大,则应是两组样本充分混合的结果,那么总体的分布不会存在显著差异。 再次,根据游程数据计算Z统计量,该统计量近似服从正态分布。 极端反应检验 极端反应检验从另一个角度检验两独立样本所来自的两个总体分布是否存在显著差异。其零假设是来两独立样本来自的两个总体分布无显著差异。 极端反应检验的基本思想是将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现极端反应。如果试验样本没有出现极端反应,则认为两总体分布无显著差异,反之,则总体分布存在显著差异。 第1 页共1 页
第七章 非参数检验习题7
第七章 非参数检验习题 一、 选择题 1.配对比较秩和检验的基本思想是:若检验假设成立,则对样本来说( )。 A .正秩和与负秩和的绝对值不会相差很大 B .正秩和与负秩和的绝对值相等 C .正秩和与负秩和的绝对值相差很大 D .不能得出结论 E .以上都不对 2.设配对资料的变量值为1X 和2X ,则配对资料的秩和检验是( )。 A .把1X 和2X 的差数从小到大排序 B .分别按1X 和2X 从小到大排序 C .把1X 和2X 综合从小到大排序 D .把1X 和2X 的和数从小到大排序 E .把1X 和2X 的差数的绝对值从小到大排序 3.下列哪项不是非参数统计的优点( )。 A .不受总体分布的限制 B .适用于等级资料 C .适用于未知分布型资料 D .适用于正态分布资料 E .适用于分布呈明显偏态的资料 4.等级资料的比较宜采用( )。 A .秩和检验 B .F 检验 C .t 检验 D .2 检验 E .u 检验 5.在进行成组设计两样本秩和检验时,以下检验假设哪种是正确的( )。 A .两样本均数相同 B .两样本的中位数相同 C .两样本对应的总体均数相同 D .两样本对应的总体分布相同 E .两样本对应的总体均数不同 6.以下检验方法中,不属于非参数检验方法的是( )。 A .Friedman 检验 B .符号检验 C .Kruskal-Wallis 检验 D .Wilcoxon 检验 E .t 检验 7.成组设计两样本比较的秩和检验中,描述不正确的是( )。 A .将两组数据统一由小到大编秩 B .遇有相同数据,若在同一组,按顺序编秩 C .遇有相同数据,若不在同一组,按顺序编秩 D .遇有相同数据,若不在同一组,取其平均值 E .遇有相同数据,若在同一组,取平均致词 二、简答题 1.简要回答进行非参数统计检验的适用条件。 2.你学过哪些设计的秩和检验,各有什么用途? 3. 试写出非参数统计方法的主要有缺点。 三、计算题 1.对8份血清分别用HITAH7600全自动生化分析仪(仪器一)和OLYMPUS AU640全自动生化分析仪(仪器二)测乳酸脱氢酶(LDH ),结果见表7-1。问两种仪器所得结果有无差别?