文档库 最新最全的文档下载
当前位置:文档库 › 实验设计与数据处理__第三次课后作业答案

实验设计与数据处理__第三次课后作业答案

实验设计与数据处理__第三次课后作业答案
实验设计与数据处理__第三次课后作业答案

现代实验方法及数据处理

作业三

1、用乙醇水溶液分离某种废弃农作物中的木质素,考察了三个因素(溶剂浓度、温度和时间)对木质素得率的影响,因素水平如下表所示。将因素A,B,C依次安排在正交表L9(34)的1,2,3列,不考虑因素间的交互作用。9个试验结果y(得率/%)依次为:5.3、5.0、4.9、5.4、6.4、3.7、3.9、3.3、2.4。试用直观分析法确定因素主次和优方案,并画出趋势图。

解:下表展示了分析过程及结果:

因素主次为:A、B、C,最优方案为:A2 B2 C3

即溶剂浓度取80%,反应温度取160℃,保温时间取1h。

而各因素的趋势图如下所示:

2.采用直接还原法制备超细铜粉的研究中,需要考察的影响因素有反应温度、cu2+与氨水质量比和CuSO4溶液浓度,并通过初步试验确定的因素水平如下表:

试验指标有两个:(1)转化率,越高越好;(2)铜粉松密度,越小越好。用正交表L9(34)安排试验,将3个因素依次放在1,2,3列上,不考虑因素间的交互作用,9次试验结果依次如下:

转化率/%: 40.26,40.46,61.79,60.15,73.97,91.31,73.52,87.19,97.26;松密度/(g/mL): 2.008,0.693,1.769,1.269,1.613,2.775,1.542,1.115,1.824。试用综合平衡法对结果进行分析,找出最好的试验方案。

解:

对转化率进行正交分析:

对铜粉松密度进行正交分析:

对于转化率指标进行直观分析

因素主次:A、B、C

优方案:A3、B3、C1

对于铜粉松密度指标进行直观分析

因素主次:B、C、A

优方案:A1、B2、C2

而通过综合平衡法可以得到平衡后的方案为:

A3、B2、C2

即反应温度取90℃,cu2+与氨水质量比取1:0.5,CuSO4溶液浓度0.5(g/mL)。

实验设计与数据处理心得

实验设计与数据处理心得体会 刚开始选这门课的时候,我觉得这门课应该就是很难懂的课程,首先我们做过不少的实验了,当然任何自然科学都离不开实验,大多数学科(化工、化学、轻工、材料、环境、医药等)中的概念、原理与规律大多由实验推导与论证的,但我觉得每次到处理数据的时候都很困难,所以我觉得这就是门难懂的课程,却也就是很有必要去学的一门课程,它对于我们工科生来说也就是很有用途的,在以后我们实验的数据处理上有很重要的意义。 如何科学的设计实验,对实验所观测的数据进行分析与处理,获得研究观测对象的变化规律,就是每个需要进行实验的人员需要解决的问题。“实验设计与数据处理”课程就就是就是以概率论数理统计、专业技术知识与实践经验为基础,经济、科学地安排试验,并对试验数据进行计算分析,最终达到减少试验次数、缩短试验周期、迅速找到优化方案的一种科学计算方法。它主要应用于工农业生产与科学研究过程中的科学试验,就是产品设计、质量管理与科学研究的重要工具与方法,也就是一门关于科学实验中实验前的实验设计的理论、知识、方法、技能,以及实验后获得了实验结果,对实验数据进行科学处理的理论、知识、方法与技能的课程。 通过本课程的学习,我掌握了试验数据统计分析的基本原理,并能针对实际问题正确地运用,为将来从事专业科学的研究打下基础。这门课的安排很合理,由简单到复杂、由浅入深的思维发展规律,先讲单因素试验、双因素试验、正交试验、均匀试验设计等常用试验设计

方法及其常规数据处理方法、再讲误差理论、方差分析、回归分析等数据处理的理论知识,最后将得出的方差分析、回归分析等结论与处理方法直接应用到试验设计方法。 比如我对误差理论与误差分析的学习:在实验中,每次针对实验数据总会有误差分析,误差就是进行实验设计与数据评价最关键的一个概念,就是测量结果与真值的接近程度。任何物理量不可能测量的绝对准确,必然存在着测定误差。通过学习,我知道误差分为过失误差,系统误差与随机误差,并理解了她们的定义。另外还有对准确度与精密度的学习,了解了她们之间的关系以及提高准确度的方法等。对误差的学习更有意义的应该就是如何消除误差,首先消除系统误差,可以通过对照试验,空白试验,校准仪器以及对分析结果的校正等方法来消除;其次要减小随机误差,就就是要在消除系统误差的前提下,增加平行测定次数,可以提高平均值的精密度。 比如我对方差分析的理解:方差分析就是实验设计中的重要分析方法,应用非常广泛,它就是将不同因素、不同水平组合下试验数据作为不同总体的样本数据,进行统计分析,找出对实验指标影响大的因素及其影响程度。对于单因素实验的方差分析,主要步骤如下:建立线性统计模型,提出需要检验的假设;总离差平方与的分析与计算;统计分析,列出方差分析表。对于双因素实验的方差分析,分为两种,一种就是无交互作用的方差分析,另一种就是有交互作用的方差分析,对于这两种类型分别有各自的设计方法,但就是总体步骤都与单因素实验的方差分析一样。

试验统计方法复习题集

试验统计方法复习题 一、名词(术语、符号)解释: 1、总体:具有相同性质的个体所组成的集团特区为总体。 2、样本:从总体中抽出的一部分个体。 3、试验指标:用于衡量试验效果的指示性状称为试验指标。 4、试验因素:是人为控制并有待比较的一组处理因素,简称因素或因子。 5、试验水平:是在试验因素所设定的量的不同级别或质的不同状态称为试验水平,简称水平。 5、处理:单因素试验是指水平,多因素试验是水平与水平的组合。 6、简单效应:一个因素的水平相同,另一个因素不同水平间的性状(产量)差异属于简单效应。 7、参数:由总体的全部观察值而算得的特征数称为参数。 8、统计数:由样本观察值计算的特征数。 9、统计假设:是根据试验目的对试验总体提出两种彼此对立的假设称为统计假设。 10、无效假设:是指处理效应与假设值之间没有真实差异的假设称为无效假设。 11、准确度:是指试验中某一性状的观察值与其相应理论真值的接近程度。 12、精确度:是指试验中同一性状的重复观察值彼此之间的接近程度。 13、复置抽样:指将抽出的个体放回到原总体后再继续抽样的方法叫复置抽样或有放回抽样。 14、无偏估计:一个样本统计数等于所估计的总体参数,则该统计数为总体相应参数的无偏估计值。 15、第一类错误:否定一个正确H0 时所犯的错误。 16、第二类错误:接受一个不真实假设时所犯的错误。 17、互斥事件:事件A与B不可能同时发生,即AB为不可能事件,则称事件A与B为互斥事件。 18、随机事件:在一定条件下,可能发生也可能不发生,可能这样发生,也可能那样发生的事件。 19、标准差:方差的正根值称为标准差。 20、处理效应:是指因素的相对独立作用,亦是因素对性状所起的增进或减少的作用称为处理效应。 21、概率分布:随机变数可能取得每一个实数值或某一围的实数值是有一定概率的,这个概率称为 随机变数的概率分布。 22、随机抽样:保证总体中的每一个体,在每一次抽样中都有同等的概率被取为样本。 23、两尾测验:有两个否定区,分别位于分布的两尾。 24、显著水平:否定无效假设H0的概率标准。 25、试验方案:根据试验目的与要求拟定的进行比较一组试验处理的总称为试验方案。 26、随机样本:用随机抽样的方法,从总体中抽出的一个部分个体。 27、标准误:抽样分布的标准差称为标准误。 28、总体:具有相同性质的个体所组成的集团称为总体。 29、独立性测验:主要为探求两个变数间是否相互独立测验的假设。

《数据分析》练习题

《数据分析》练习题 1.一个地区某月前两周从星期一到星期五各天的最低气温依次是(单位:℃):x 1, x 2, x 3, x 4, x 5和x 1+1, x 2+2, x 3+3, x 4+4, x 5+5,若第一周这五天的平均最低气温为7℃,则第二周这五天的平均最低气温为 。 2.有10个数据的平均数为12,另有20个数据的平均数为15,那么所有这30个数据的平均数是( ) A .12 B. 15 C. 1 3.5 D. 14 3.一组数据8,8,x ,6的众数与平均数相同,那么这组数据的中位数是 ( ) A. 6 B. 8 C.7 D. 10 4.某校在一次考试中,甲乙两班学生的数学成绩统计如下: 请根据表格提供的信息回答下列问题: (1)甲班众数为 分,乙班众数为 分,从众数看成绩较好的是 班; (2)甲班的中位数是 分,乙班的中位数是 分; (3)若成绩在80分以上为优秀,则成绩较好的是 班;、 (4)甲班的平均成绩是 分,乙班的平均成绩是 分,从平均分看成绩较好的是 班. 5.在方差的计算公式 ()()()222 21210120202010 s x x x ??= -+-+???+-??中, 数字10和20分别表示的意义可以是( ) A .数据的个数和方差 B .平均数和数据的个数 C .数据的个数和平均数 D .数据组的方差和平均数 6..如果将所给定的数据组中的每个数都减去一个非零常数,那么该数组的 ( ) A.平均数改变,方差不变 B.平均数改变,方差改变 C.平均输不变,方差改变 D.平均数不变,方差不变 7..已知7,4,3,,321x x x 的平均数是6,则_____________321=++x x x . 8..已知一组数据-3,-2,1,3,6,x 的中位数为1,则其方差为 . 9..已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是 3 1 ,那么另一组数据3x 1-2,3x 2-2,3x 3-2, 3x 4-2,3x 5-2的平均数是和方差分别是 . 10..关于一组数据的平均数、中位数、众数,下列说法中正确的是( ) A.平均数一定是这组数中的某个数 B. 中位数一定是这组数中的某个数 C.众数一定是这组数中的某个数 D.以上说法都不对 分数 50 60 70 80 90 100 人数 甲 1 6 12 11 15 5 乙 3 5 15 3 13 11

实验设计与数据处理试题库

一、名词解释:(20分) 1. 准确度和精确度:同一处理观察值彼此的接近程度同一处理的观察值与其真值的接近程度 2. 重复和区组:试验中同一处理的试验单元数将试验空间按照变异大小分成若干个相对均匀的局部,每个局部 就叫一个区组 3回归分析和相关分析:对能够明确区分自变数和因变数的两变数的相关关系的统计方法: 对不能够明确区分自变数和因变数的两变数的相关关系的统计方法 4?总体和样本:具有共同性质的个体组成的集合从总体中随机抽取的若干个个体做成的总体 5. 试验单元和试验空间:试验中能够实施不同处理的最小试验单元所有试验单元构成的空间 二、填空:(20分) 1. 资料常见的特征数有:(3空)算术平均数方差变异系数 2. 划分数量性状因子的水平时,常用的方法:等差法等比法随机法(3空) 3. 方差分析的三个基本假定是(3空)可加性正态性同质性 4. 要使试验方案具有严密的可比性,必须(2空)遵循“单一差异”原则设置对照 5. 减小难控误差的原则是(3空)设置重复随机排列局部控制 6. 在顺序排列法中,为了避免同一处理排列在同一列的可能,不同重复内各处理的排列方式常采用(2空)逆向式 阶梯式 7. 正确的取样技术主要包括:()确定合适的样本容量采用正确的取样方法 8. 在直线相关分析中,用(相关系数)表示相关的性质,用(决定系数)表示相关的程度。 三、选择:(20分) 1试验因素对试验指标所引起的增加或者减少的作用,称作(C) A、主要效应 B、交互效应 C、试验效应 D、简单效应 2. 统计推断的目的是用(A) A、样本推总体 B、总体推样本 C、样本推样本 D、总体推总体 3. 变异系数的计算方法是(B) 4. 样本平均数分布的的方差分布等于(A) 5. t检验法最多可检验(C)个平均数间的差异显著性。 6. 对成数或者百分数资料进行方差分析之前,须先对数据进行(B) A、对数 B、反正弦 C、平方根 D、立方根 7. 进行回归分析时,一组变量同时可用多个数学模型进行模拟,型的数据统计学标准是(B) A、相关系数 B、决定性系数 C、回归系数 D、变异系数 8. 进行两尾测验时,u0.10=1.64,u0.05=1.96,u0.01=2.58,那么进行单尾检验,u0.05=(A) 9. 进行多重比较时,几种方法的严格程度(LSD\SSR\Q)B 10. 自变量X与因变量Y之间的相关系数为0.9054,则Y的总变异中可由X与Y的回归关系解释的比例为(C) A、0.9054 B、0.0946 C、0.8197 D、0.0089 四、简答题:(15分) 1. 回归分析和相关分析的基本内容是什么?(6分)配置回归方程,对回归方程进行检验,分析多个自变量的主次 效益,利用回归方程进行预测预报: 计算相关系数,对相关系数进行检验 2. 一个品种比较试验,4个新品种外加1个对照品种,拟安排在一块具有纵向肥力差异的地块中,3次重复(区组),各重复内均随机排列。请画出田间排列示意图。(2分) 3. 田间试验中,难控误差有哪些?(4分)土壤肥力,小气候,相邻群体间的竞争差异,同一群体内个体间的竞争 差异。 4随即取样法包括哪几种方式?(3分)简单随机取样法分层随机取样法整群简单随机取样法 五、计算题(25分) 1. 研究变数x与y之间的关系,测得30组数据,经计算得出:x均值=10,y均值=20,l xy =60, l yy=300,r=0.6。根

实验设计与数据处理

《实验设计与数据处理》大作业 班级:环境17研 姓名: 学号: 1、 用Excel (或Origin )做出下表数据带数据点的折线散点图 余浊(N T U ) 加量药(mL) 总氮T N (m g /L ) 加量药(mL ) 图1 加药量与剩余浊度变化关系图 图2 加药量与总氮TN 变化关系图 总磷T P (m g /L ) 加量药(mL) C O D C r (m g /L ) 加量药(mL) 图3 加药量与总磷TN 变化关系图 图4 加药量与COD Cr 变化关系图 去除率(%) 加药量(mL)

图5 加药量与各指标去除率变化关系图

2、对离心泵性能进行测试的实验中,得到流量Q v 、压头H 和效率η的数据如表所示,绘制离心泵特性曲线。将扬程曲线和效率曲线均拟合成多项式(要求作双Y 轴图)。 η H (m ) Q v (m 3 /h) 图6 离心泵特性曲线 扬程曲线方程为:H=效率曲线方程为:η=+、列出一元线性回归方程,求出相关系数,并绘制出工作曲线图。 (1) 表1 相关系数的计算 Y 吸光度(A ) X X-3B 浓度(mg/L ) i x x - i y y - l xy l xx l yy R 10 -30 2800 20 -20 30 -10 40 ()() i i x x y y l R --= = ∑

50 10 60 20 70 30 平均值 40 吸光度 X-3B浓度(mg/L) 图7 水中染料活性艳红(X-3B )工作曲线 一元线性回归方程为:y=+ 相关系数为:R 2= (2) 代入数据可知: 样品一:x=样品二:x=、试找出某伴生金属c 与含量距离x 之间的关系(要求有分析过程、计算表格以及回归图形)。 表2 某伴生金属c 与含量距离x 之间的关系分析计算表 序号 x c lgx 1/x 1/c 1 2 2 3 3 4 4 5 5 7 6 8 7 10 1

数据分析与处理答案

数据分析与处理答案 Prepared on 24 November 2020

一、简答题(5×2分, 共10分) 1、请解释质量控制图中三条主要控制线的意义:CL 、UCL 、LCL 未学,不考 2、请解释正交设计表“L 934” 这个符号所指代的意义。如果要做6因素4水平实验,应该选择以下哪一个正交表(不考虑交互作用):L 1645,L 3249 L: 正交; 9:9行或9次实验; 3:3个水平 ; 4:4列或4个因素 选L 3249 二、计算题(90分) 1、某分析人员分别进行4次平行测定,得铅含量分别是、、、、,试分别用3s 法、Dixon 法和Grubbs 检验法判断是否为离群值。(,4=, ,5=)(12分) x =, s=, 3s 法:∣ 应保留 Dixon :70.6360.08 0.89671.8560.08 Q -= =-> ,5=, 应舍去 Grubbs: G 计= 60.0868.455/5.61-=> ,4,应舍去· ·· 2、4次测定结果为:%、%、%、%,根据这些数据估计此样品中铬的含量范围(P=95%)(8分) ( 2.353%903,10.0=?=t P , 3.182%9530.05=?=,t P , 5.841%9930.01=?=,t P ) x =%, s=% 3、用一种新方法测定标准试样中的氧化铁含量(%),得到以下8个数 据:、、、、、、、。标准偏差为%,标准值为%问这种新方法是否可靠(P=95%,,7=)(10分)

x = 34.3034.33 1.770.048 t -==< ,7,所以新方法可靠 4、某小组做加标回收试验考查方法的准确性,测得加标前1000mL 样品浓度为L ,加入浓度为1000mg/L 的标准样品后,测得样品总浓度为L ,求回收率是多少。(8分) 没讲,不考 5、两分析人员测定某试样中铁的含量,得到如下结果: 已知A 的标准偏差s 1=,B 的标准偏差s 2=,请比较两个人测定结果的精密度和准确的有无显着性差异。(12分) F (,4,4)=, t (,8)= F==< F (,4,4),故精密度无显着性差异 t=< t (,8),故准确度无显着性差异 5. 拟考察茶多酚浓度、浸泡时间、维生素C 等3个因素对米粉保鲜效果的影响,实验因素水平表如下表。 请完成下列正交表格,并指出各因素的主次顺序,求出最优水平组合,并做方差分析,填方差分析表,并对实验结果做出讨论(可结合因素指标变化图)。(25分)

数据分析(梅长林)习题

第五章习题 1.习题 解:假定两总体服从正态分布,且协方差矩阵21∑=∑,误判损失相同又先验概 即:0.4285711=P 0.5714292=P 又计算可得: (1)(2)25.31622.025,2.416 1.187x x ????==--???????? 并且:-2.38145ln =S 计算广义平方距离函数: 2()1 ()()()()ln 2ln j T j j j j j d p -=--+-x x x S x x S 并计算后验概率: 2 2 2 ??0.5()0.5()1 ?(|)e e j k d d j k P G --==∑x x x 1,2j = 回代判别结果如下:

由此可见误判的回代估计: 0.07141/14* ==r P 若按照交叉确认法,定义广义平方距离如下: 2()1() ()()()()()()()ln 2ln j j j T j j x x x x j d p -=--+-x x x S x x S 逐个剔除, 交叉判别,后验概率按下式计算: 2 2 2 ??0.5()0.5()1 ?(|)e e j k d d j k P G --==∑x x x 1,2j = 通过SAS 计算得到表所示结果。发现同样也是属于G1的4号被误判为G2,因此误判率的交 叉确认估计为* ?1/140.0714c p ==

*121p p p ΦΦ?? =+- ?? ? 其中(1) (2)1(1)(2)?()()T λ -=--x x S x x =, 2 1(1|2)ln (2|1)c p d c p =,又因为(1|2)(2|1)c c c ==,所以288.0ln 1 2==P P d , 最后可得后验概率p 为: 习题 解:(1)在21∑≠∑并且先验概率相同的的假设前提下,建立矩离判别的线性判别函数。利用SAS 的proc discrim 过程首先计算得到总体的协方差矩阵,如表:

试验设计与数据处理

试验设计与数据处理方法总述及总结 王亚丽 (数学与信息科学学院 08统计1班 081120132) 摘要:实验设计与数据处理是一门非常有用的学科,是研究如何经济合理安排 试验可以解决社会中存在的生产问题等,对现实生产有很重要的指导意义。因此本文根据试验设计与数据处理进行了总述与总结,以期达到学习、理解、掌握的以及灵活运用的目的。 1 试验设计与数据处理基本知识总述 1.1试验设计与数据处理的基本思想 试验设计与数据处理是数理统计学中的一个重要分支。它是以概率论、数理统计及线性代数为理论基础,结合一定的专业知识和实践经验,研究如何经济、合理地安排实验方案以及系统、科学地分析处理试验结果的一项科学技术,从而解决了长期以来在试验领域中,传统的试验方法对于多因素试验往往只能被动地处理试验数据,而对试验方案的设计及试验过程的控制显得无能为力这一问题。 1.2试验设计与数据处理的作用 (1)有助于研究者掌握试验因素对试验考察指标影响的规律性,即各因素的水平改变时指标的变化情况。 (2)有助于分清试验因素对试验考察指标影响的大小顺序,找出主要因素。(3)有助于反映试验因素之间的相互影响情况,即因素间是否存在交互作用。(4)能正确估计和有效控制试验误差,提高试验的精度。 (5)能较为迅速地优选出最佳工艺条件(或称最优方案),并能预估或控制一定条件下的试验指标值及其波动范围。 (6)根据试验因素对试验考察指标影响规律的分析,可以深入揭示事物内在规律,明确进一步试验研究的方向。

1.3试验设计与数据处理应遵循的原则 (1)重复原则:重可复试验是减少和估计随机误差的的基本手段。 (2)随机化原则:随机化原则可有效排除非试验因素的干扰,从而可正确、无偏地估计试验误差,并可保证试验数据的独立性和随机性。 (3)局部控制原则:局部控制是指在试验时采取一定的技术措施方法减少非试验因素对试验结果的影响。用图形表示如下: 2试验设计与数据处理方法总述和总结 2.1方差分析 (1)概念:方差分析是用来检验两个或两个以上样本的平均值差异的显著程度。并由此判断样本究竟是否抽自具有同一均值的总体。 (2)优点:方差分析对于比较不同生产工艺或设备条件下产量、质量的差异,分析不同计划方案效果的好坏和比较不同地区、不同人员有关的数量指标差异是否显著时,是非常有用的。 (3)缺点:对所检验的假设会发生错判的情况,比如第一类错误或第二类错误的发生。 (4)基本原理:方差分析的基本思路是一方面确定因素的不同水平下均值之间的方差,把它作为对由所有试验数据所组成的全部总体的方差的第一个估计值;另一方面再考虑在同一水平下不同试验数据对于这一水平的均值的方差,由此计算出对由所有试验数据所组成的全部数据的总体方差的第 二个估计值。比较上述两个估计值,如果这两个方差的估计值比较接近就说明因素的不同水平下的均值间的差异并不大,就接受零假设;否则,说明因素的不同水平下的均值间的差异比较大。

第2章 数据分析(梅长林)习题题答案

第2章 习 题 一、习题 (1)回归模型 15,2,1,22110 =+++=i x x y i i i i εβββ 调用proc reg : ] 由此输出得到的回归方程为: 2100920.049600.045261.3X X y ++=∧ 由最后一列可以看出,使用化妆品的人数X1和月收入X2对化妆品的销售数量有着显著影响。46521.30=∧ β可以理解为该化妆品作为一种必需品每个月的销售量。当购买该化妆品的人数固定时,月收入没增加一个一个单位,改化妆品的销售数量将增加个单位。同理,当购买该化妆品的人均月收入固定时,购买该化妆品的人数每增加一千人,该化妆品的销售数量将增加个单位。 p n SSE -= ∧2 σ 是2σ的无偏估计,所以2σ的估计值是. (2)调用 由此可到线性回归关系显著性检验: 0至少有一个为0:2,1:1210ββββH H ?==

的统计量/(1)/()SSR p MSR F SSE n p MSE -= =-的观测值47.56790=F ,检验的p 值 0001.0)(000<>==F F p p H 另外9989.053902 53845 2=== SST SSR R ,2R 描述了由自由变量的线性关系函数值所能反映的Y 的总变化量的比例。2R 越大,表明线性关系越明显。这些结果均表明Y 与X1,X2之间的回归关系高度显著。 (3)若置信水平05.0=α,由17881.2)12(975.0=t ,利用参数估计值得 到21,0,βββ的置信区间分别为: 对,0β2942.54516.343065.21781.245216.3±=?±,即)7458.8,8426.1(-) 对1β:01318.049600.000605.01781.249600.0±=?±,即)50198.0,48282.0( ) 2β:0021 .000920.00009681.01781.200920.0±=?±,即)00113.0,0071.0(- (4)首先检验X1对Y 是否有显著性影: 假设其约简模型为:15,2, 1,220 =++=i x y i i i εββ 由观测数据并利用proc reg 过程拟合此模型求得: 88137.484)(=R SSE 13215=-=R f 88357.56)(=F SSE 12315=-=R f 由[()()]() ()/R F F SSE R SSE F f f F SSE F f --= 求得检验统计量的值为: 3 .9012/88357.5688357 .5688137.4840=-= F 05.0))13,1(()(0000<>==>==F F P F F p p H 由此拒绝原假设,所以x2对Y 有显著影响。 ~ 同理检验X2对Y 是否有显著性影: 假设其约简模型为:15,2, 1,110 =++=i x y i i i εββ 由观测数据并利用proc reg 过程拟合此模型求得: 31872)(=R SSE 13215=-=R f 88357.56)(=F SSE 12315=-=R f 由[()()]() ()/R F F SSE R SSE F f f F SSE F f --= 求得检验统计量的值为: 12/88357.5688357.56318720-= F 05.0))13,1(()(0000<>==>==F F P F F p p H 由此拒绝原假设,所以x2对Y 有显著影响。

实验设计与数据处理试题库

一、名词解释:(20分) 1.准确度和精确度:同一处理观察值彼此的接近程度同一处理的观察值与其真值的接近程度 2.重复和区组:试验中同一处理的试验单元数将试验空间按照变异大小分成若干个相对均匀的局部,每个局部就叫一个区组 3回归分析和相关分析:对能够明确区分自变数和因变数的两变数的相关关系的统计方法: 对不能够明确区分自变数和因变数的两变数的相关关系的统计方法 4.总体和样本:具有共同性质的个体组成的集合从总体中随机抽取的若干个个体做成的总体 5.试验单元和试验空间:试验中能够实施不同处理的最小试验单元所有试验单元构成的空间 二、填空:(20分) 1.资料常见的特征数有:(3空)算术平均数方差变异系数 2.划分数量性状因子的水平时,常用的方法:等差法等比法随机法(3空) 3.方差分析的三个基本假定是(3空)可加性正态性同质性 4.要使试验方案具有严密的可比性,必须(2空)遵循“单一差异”原则设置对照 5.减小难控误差的原则是(3空)设置重复随机排列局部控制 6.在顺序排列法中,为了避免同一处理排列在同一列的可能,不同重复内各处理的排列方式常采用(2空)逆向式阶梯式 7.正确的取样技术主要包括:()确定合适的样本容量采用正确的取样方法 8.在直线相关分析中,用(相关系数)表示相关的性质,用(决定系数)表示相关的程度。 三、选择:(20分) 1试验因素对试验指标所引起的增加或者减少的作用,称作(C) A、主要效应 B、交互效应 C、试验效应 D、简单效应 2.统计推断的目的是用(A) A、样本推总体 B、总体推样本 C、样本推样本 D、总体推总体 3.变异系数的计算方法是(B) 4.样本平均数分布的的方差分布等于(A) 5.t检验法最多可检验(C)个平均数间的差异显著性。 6.对成数或者百分数资料进行方差分析之前,须先对数据进行(B) A、对数 B、反正弦 C、平方根 D、立方根 7.进行回归分析时,一组变量同时可用多个数学模型进行模拟,型的数据统计学标准是(B) A、相关系数 B、决定性系数 C、回归系数 D、变异系数 8.进行两尾测验时,u0.10=1.64,u0.05=1.96,u0.01=2.58,那么进行单尾检验,u0.05=(A) 9.进行多重比较时,几种方法的严格程度(LSD\SSR\Q)B 10.自变量X与因变量Y之间的相关系数为0.9054,则Y的总变异中可由X与Y的回归关系解释的比例为(C) A、0.9054 B、0.0946 C、0.8197 D、0.0089 四、简答题:(15分) 1.回归分析和相关分析的基本内容是什么?(6分)配置回归方程,对回归方程进行检验,分析多个自变量的主次效益,利用回归方程进行预测预报: 计算相关系数,对相关系数进行检验 2.一个品种比较试验,4个新品种外加1个对照品种,拟安排在一块具有纵向肥力差异的地块中,3次重复(区组),各重复内均随机排列。请画出田间排列示意图。(2分) 3.田间试验中,难控误差有哪些?(4分)土壤肥力,小气候,相邻群体间的竞争差异,同一群体内个体间的竞争差异。 4随即取样法包括哪几种方式?(3分)简单随机取样法分层随机取样法整群简单随机取样法 五、计算题(25分) 1.研究变数x与y之间的关系,测得30组数据,经计算得出:x均值=10,y均值=20,l xy=60, l yy=300,r=0.6。根据所得数据建立直线回归方程。(5分)a=2 b=1.8 y=2+1.8 x 2.完成下列方差分析表,计算出用LSR法进行多重比较时各类数据填下表:

试验统计方法复习题

试验统计方法复习题 1.何谓实验因素和实验水平?何谓简单效应、主要效应和交互效应?举例说明之。 实验因素: 被变动并设有待比较的一组处理的因子或试验研究的对象。 实验水平: 实验因素的量的不同级别或质的不同状态。 简单效应: 同一因素内俩种水平间实验指标的相差。 主要效应:一个因素内各简单效应的平均数。 交互效应:俩个因素简单效应间的平均差异。 2.什么是实验方案,如何制定一个正确的实验方案?试结合所学专业举例说明之。 试验指标:用于衡量试验效果的指示性状。 制定实验方案的要点○1.目的明确。 ○2. 选择适当的因素及其水平。 ○3设置对照水平或处理,简称对照(check,符号CK)。 ○4应用唯一差异原则。 3.什么是实验误差?实验误差与实验的准确度、精确度以及实验处理间的比较的可靠性有什么关系? ○1.试验误差的概念:试验结果与处理真值之间的差异. ○2随机误差影响了数据的精确性,精确性是指观测值间的符合程度,随机误差是偶然性的,整个试验过程中涉及的随机波动因素愈多,试验的环节愈多,时间愈长,随机误差发生的可能性及波动程度便愈大。系统误差是可以通过试验条件及试验过程的仔细操作而控制的。实际上一些主要的系统性偏差较易控制,而有些细微偏差则较难控制。 4.试分析田间实验误差的主要来源,如何控制田间实验的系统误差?如何降低田间实验的随机误差? 误差来源:(1)试验材料固有的差异 (2)试验时农事操作和管理技术的不一致所引起的差异 (3)进行试验时外界条件的差异 控制误差的途径:(1)选择同质一致的试验材料 (2) 改进操作和管理技术,使之标准化 (3) 控制引起差异的外界主要因素 选择条件均匀一致的试验环境; 试验中采用适当的试验设计和科学的管理技术; 应用相应的科学统计分析方法。 尽量减少实验中的随机波动因素、环节和时间可以有效的降低随机误差。 5.田间实验设计的基本原则是什么?完全随机设计、完全随机区组设计、拉丁设计各有何特点?各在什么情况下使用? (1)基本原则是:○1.重复○2随机排列○3局部控制 (2)完全随机设计的特点是设计分析简便,但是应用该设计的条件是要求试验的环境因素相当均匀,所以一般用于实验室培养试验及网、温室的盆钵试验。 完全随机区组设计○1.特点: 根据“局部控制”的原则,将试验地(或试验环境)按肥力变异梯度(或条件变异梯度)划分为等于重复次数的区组,一区组亦即一重复,区组内各处理都独立地随机排列。○2应用条件:对试验地的地形要求不严,必要时,不同区组亦可分散设置在不同地段上。 拉丁方设计的○1.特点:将处理从纵横二个方向排列为区组(或重复),使每个处理在每一

数据处理与实验设计小论文

上海大学2014~2015学年秋季学期研究生课程考试课程名称:数据处理与实验设计课程编号:11S009003论文题目:正交实验在锂离子电极材料制备中的应用 研究生姓名:李艳峰学号:14722191 论文评语: 成绩:任课教师: 评阅日期:

正交实验在锂离子电极材料制备中的应用 李艳峰 (上海大学环境与化学工程学院,上海200444) 摘要:锂源、反应温度、反应时间和锂钛摩尔比是影响锂离子电极负极材料Li4Ti5O12制备的重要因素,本文利用正交实验L9 (34)的方法对液相法制备Li4Ti5O12的各种影响因素进行进一步优化,从而得到最优水平组合,并对各种影响因素进行权重分析。最后,利用正交实验确定了液相法制备Li4Ti5O12的最佳工艺:烧结温度为750℃,烧结时间为8h,LiOH·H2O 为锂源,原料中锂钛摩尔比为0.85。 关键词:正交实验设计;液相法;影响因素; 中图分类号:O242.1文献标识码:A The application of orthogonal experimental design on liquid method in the production of Lithium-ion electrode materials Yanfeng Li (School of Environmental and Chemical Engineering, Shanghai University, Shanghai 200444, China) Abstract:lithium source, reaction temperature, reaction time and lithium titanium molar ratio are important factors for the preparation of Li4Ti5O12 conditions of liquid method. Based on the single factor experiment, this study use L9 (34) orthogonal experiments to optimized the removal of the preparation of Li4Ti5O12 of liquid method. The optimal technological parameters of solution method determined by the orthogonal experiment were as follows: sintering temperature was 750℃, sintering time was 8 h, the lithium resource was LiOH·H2O and the mole ration of Li to Ti was 0.85. Key words: Orthogonal experimental design;Liquid method; Factors;

试验设计与数据处理课程论文

课 程 论 文 课程名称试验设计与数据处理 专业2012级网络工程 学生姓名孙贵凡 学号201210420136 指导教师潘声旺职称副教授

成绩 科学研究与数据处理 学院信息科学与技术学院专业网络工程姓名孙贵凡学号:201210420136 摘要:《实验设计与数据处理》这门课程列举典型实例介绍了一些常用的实验设计及实验数据处理方法在科学研究和工业生产中的实际应用,重点介绍了多因素优化实验设计——正交设计、回归分析方法以对目标函数进行模型化处理。其适于工艺、工程类本科生使用,尤其适用于化学化工、矿物加工、医学和环境学等学科的本科生使用。其对行实验设计可提供很大的帮助,也可供广大分析化学工作者应用。关键字:优化实验设计; 标函数进行模型化处理; 正交设计; 回归分析方法 1 引言 实验是一切自然科学的基础,科学界中大多数公式定理是由试验反复验证而推导出来的。只有经得起试验验证的定理规律才具有普遍实用性。而科学的试验设计是利用自己已有的专业学科知识,以大量的实践经验为基础而得出的既能减少试验次数,又能缩短试验周期,从而迅速找到优化方案的一种科学计算方法,就必然涉及到数据处理,也只有对试验得出的数据做出科学合理的选择,才能使实验结果更具说服力。实验设计与数据处理在水处理中发挥着不可估量的作用,通过科学合理的实验设计过程加上严谨规范的数据处理方法,可以使水处理原理,内在规律性被很好的发现,从而更好的应用于生产实践。 2 材料与方法 2.1 供试材料 1. 论文所围绕的目标和假设 研究的目标就是实验的目的,我们设计了这个实验是想来做什么以及想得到什么样的结论。要正确的识别问题和陈述问题,这些需要专业知识和大量的阅读文献综述等方法来获得我们所要提出的问题。需要对某一个具体的问题,并且对这个具体的问题提出假设。如水处理中混凝剂的最佳投加量,混凝剂的最佳投加量有一个适宜的PH值范围。

第三章 误差和分析数据的处理作业及答案(1)

第三章 误差和分析数据的处理 作业及答案 一、选择题(每题只有1个正确答案) 1. 用加热挥发法测定BaCl 2·2H 2O 中结晶水的质量分数时,使用万分之一的分析天平称样0.5000g ,问测定结果应以几位有效数字报出?( D ) [ D ] A. 一位 B. 二位 C .三位 D. 四位 2. 按照有效数字修约规则25.4507保留三位有效数字应为( B )。 [ B ] A. 25.4 B. 25.5 C. 25.0 D. 25.6 3. 在定量分析中,精密度与准确度之间的关系是( C )。 [ C ] A. 精密度高,准确度必然高 B. 准确度高,精密度不一定高 C. 精密度是保证准确度的前提 D. 准确度是保证精密度的前提 4. 以下关于随机误差的叙述正确的是( B )。 [ B ] A. 大小误差出现的概率相等 B. 正负误差出现的概率相等 C. 正误差出现的概率大于负误差 D. 负误差出现的概率大于正误差 5. 可用下列何种方法减免分析测试中的随机误差( D )。 [ D ] A. 对照实验 B. 空白实验 C. 仪器校正 D. 增加平行实验的次数 6. 在进行样品称量时,由于汽车经过天平室附近引起天平震动产生的误差属于( B )。 [ B ] A. 系统误差 B. 随机误差 C. 过失误差 D. 操作误差 7. 下列表述中,最能说明随机误差小的是( A )。 [ A ] A. 高精密度 B. 与已知含量的试样多次分析结果的平均值一致 C. 标准偏差大 D. 仔细校正所用砝码和容量仪器 8. 对置信区间的正确理解是( B )。 [ B ] A. 一定置信度下以真值为中心包括测定平均值的区间 B. 一定置信度下以测定平均值为中心包括真值的范围 C. 真值落在某一可靠区间的概率 D. 一定置信度下以真值为中心的可靠范围 9. 有一组测定数据,其总体标准偏差σ未知,要检验得到这组分析数据的分析方法是否准确可靠,应该用( C )。 [ C ] A. Q 检验法 B. G(格鲁布斯)检验法 C. t 检验法 D. F 检验法 答:t 检验法用于测量平均值与标准值之间是否存在显著性差异的检验------准确度检验 F 检验法用于两组测量内部是否存在显著性差异的检验-----精密度检验 10 某组分的质量分数按下式计算:10 ???= m M V c w 样,若c =0.1020±0.0001,V=30.02±0.02, M=50.00±0.01,m =0.2020±0.0001,则对w 样的误差来说( A )。 [ A ] A. 由“c ”项引入的最大 B. 由“V ”项引入的最大

定性数据分析第二章课后答案资料

定性数据分析第二章 课后答案

第二章课后作业 【第1题】 解:由题可知消费者对糖果颜色的偏好情况(即糖果颜色的概率分布),调查 者取500块糖果作为研究对象,则以消费者对糖果颜色的偏好作为依据,500块糖果的颜色分布如下表1.1所示: 表1.1 理论上糖果的各颜色数 由题知r=6,n=500,我们假设这些数据与消费者对糖果颜色的偏好分布是相符,所以我们进行以下假设: 原假设::0H 类i A 所占的比例为)6,...,1(0==i p p i i 其中i A 为对应的糖果颜色,)6,...,1(0=i p i 已知,16 10=∑=i i p 则2χ检验的计算过程如下表所示: 在这里6=r 。检验的p 值等于自由度为5的2χ变量大于等于18.0567的概率。在Excel 中输入“)5,0567.18(chidist =”,得出对应的p 值为

05.00028762.0<<=p ,故拒绝原假设,即这些数据与消费者对糖果颜色的偏好 分布不相符。 【第2题】 解:由题可知 ,r=3,n=200,假设顾客对这三种肉食的喜好程度相同,即顾 客选择这三种肉食的概率是相同的。所以我们可以进行以下假设: 原假设 )3,2,1(3 1 :0==i p H i 则2χ检验的计算过程如下表所示: 在这里3=r 。检验的p 值等于自由度为2的2χ变量大于等于15.72921的概率。在Excel 中输入“)2,72921.15(chidist =”,得出对应的p 值为 05.00003841.0<<=p ,故拒绝原假设,即认为顾客对这三种肉食的喜好程度是 不相同的。 【第3题】 解:由题可知 ,r=10,n=800,假设学生对这些课程的选择没有倾向性,即选 各门课的人数的比例相同,则十门课程每门课程被选择的概率都相等。所以我们可以进行以下假设: 原假设)10,...,2,1(1.0:0==i p H i 则2χ检验的计算过程如下表所示:

实验设计与数据处理

试验设计与数据处理 学院 班级 学号 学生姓名 指导老师

第一章 4、 相对误差18.20.1%0.0182x mg mg ?=?= 故100g 中维生素C 的质量范围为:±。 5、1)、压力表的精度为级,量程为, 则 max 0.2 1.5%0.00333 0.375 8 R x MPa KPa x E x ?=?==?=== 2)、1mm 的汞柱代表的大气压为, 所以 max 2 0.1330.133 1.662510 8 R x KPa x E x -?=?===? 3)、1mm 水柱代表的大气压为gh ρ,其中2 9.8/g m s = 则: 3max 33 9.8109.810 1.22510 8 R x KPa x E x ---?=???===? 6. 样本测定值 算数平均值 几何平均值 调和平均值 标准差s 标准差σ 样本方差S 2 总体方差σ2 算术平均误差△ 极差R 7、S ?2=,S ?2= F =S ?2/ S ?2== 而F ()=,= 所以F ()< F < 两个人测量值没有显著性差异,即两个人的测量方法的精密度没有显著性差异。 |||69.947|7.747 6.06 p p d x =-=>

分析人员A分析人员B 8样本方差1 8样本方差2 10Fa值 104F值 6 68 4705 6 6 88 8.旧工艺新工艺 %% %% %% %% %% %% %% %% %% % % % % t-检验: 双样本异方差假设 变量 1变量 2 平均 方差 观测值139假设平均差0 df8 t Stat-38. P(T<=t) 单尾0 t 单尾临界 P(T<=t) 双尾0 t 双尾临界 F-检验双样本方差分析

数据分析师常见的7道笔试题目及答案

数据分析师常见的7道笔试题目及答案 导读:探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分析则侧重于已有假设的证实或证伪。以下是由小编为您整理推荐的实用的应聘笔试题目和经验,欢迎参考阅读。 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map 进行频率统计,然后再找出频率最大的几个)及相应的频率。然后再在这1000个最大的IP 中,找出那个频率最大的IP,即为所求。 或者如下阐述: 算法思想:分而治之+Hash 地址最多有2^32=4G种取值情况,所以不能完全加载到内存中处理; 2.可以考虑采用“分而治之”的思想,按照IP地址的Hash(IP)24值,把海量IP 日志分别存储到1024个小文件中。这样,每个小文件最多包含4MB个IP地址; 3.对于每一个小文件,可以构建一个IP为key,出现次数为value的Hash map,同时记录当前出现次数最多的那个IP地址; 4.可以得到1024个小文件中的出现次数最多的IP,再依据常规的排序算法得到总体上出现次数最多的IP; 2、搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。 假设目前有一千万个记录(这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门。),请你统计最热门的10个查询串,要求使用的内存不能超过1G。 典型的Top K算法,还是在这篇文章里头有所阐述, 文中,给出的最终算法是: 第一步、先对这批海量数据预处理,在O(N)的时间内用Hash表完成统计(之前写成了排序,特此订正。July、第二步、借助堆这个数据结构,找出Top K,时间复杂度为N‘logK。 即,借助堆结构,我们可以在log量级的时间内查找和调整/移动。因此,维护一个K(该题目中是10)大小的小根堆,然后遍历300万的Query,分别和根元素进行对比所以,我们最终的时间复杂度是:O(N) + N’*O(logK),(N为1000万,N’为300万)。ok,更多,详情,请参考原文。 或者:采用trie树,关键字域存该查询串出现的次数,没有出现为0。最后用10个元素的最小推来对出现频率进行排序。 3、有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M。返回频数最高的100个词。 方案:顺序读文件中,对于每个词x,取hash(x)P00,然后按照该值存到5000个小文件(记为x0,x1,…x4999)中。这样每个文件大概是200k左右。 如果其中的有的文件超过了1M大小,还可以按照类似的方法继续往下分,直到分解得到的小文件的大小都不超过1M。 对每个小文件,统计每个文件中出现的词以及相应的频率(可以采用trie树 /hash_map等),并取出出现频率最大的100个词(可以用含 100 个结点的最小堆),并把100

相关文档
相关文档 最新文档