文档库 最新最全的文档下载
当前位置:文档库 › 抽样调查分层抽样实验报告

抽样调查分层抽样实验报告

抽样调查分层抽样实验报告
抽样调查分层抽样实验报告

实验报告

实验思考题:

1、某调查员欲从某大学所有学生中抽样调查学生平均生活费支出情况,假设该调查员已经

完成了抽样,并获得样本情况(见样本文件),请根据此样本分别按性别、家庭所在地分层,并计算各层的样本量、平均生活费支出、生活费支出的方差及标准差。

(1)先对数据按照家庭所在地进行排序:【数据】→【排序】,选择“家庭所在地”(2)再对数据进行分类汇总:【数据】→【分类汇总】,“分类字段”选择“家庭所在地”,“汇总方式”选择“平均值”,“选定汇总项”选择“平均月生活费”,在对话框下方选择“汇总结果显示在数据下方”;再做两次分类汇总,“汇总方式”分别选择“计数”和“标准偏差”。最后得到表1-1所示结果:

表1-1

家庭所在地平均月生活费

大型城市平均值614.5348837

大型城市计数86

大型城市标准偏差300.0849173

乡镇地区平均值529.4117647

乡镇地区计数68

乡镇地区标准偏差219.0950339

中小城市平均值618.6440678

中小城市计数118

中小城市标准偏差202.5264159

总计平均值595.0367647

总计数272

总计标准偏差243.4439223

(3)在SPSS软件中得出的计算结果:

选择————,然后在出现的对话框中

分别在“Dependent list”框中选入“家庭所在地”,在“Independent List”框中选入“平均月生活费”,得到如表1-2所示结果:

表1-2

Report

平均月生活费

家庭所在地Mean N Std. Deviation

大型城市614.53 86 300.085

乡镇地区529.41 68 219.095

中小城市618.64 118 202.526

Total 595.04 272 243.444

选择——,在出现的对话框中选择“function”选择估计量,得到如图1-2所示结果:

图1-1

图1-2

选择————,出现如下图所示对话框,并按照下图1-3中所选项进行操作:

得到如下图表的结果:

Case Processing Summary

家庭所在地

Cases

Valid Missing Total

N Percent N Percent N Percent

平均月生活费大型城市86 100.0% 0 .0% 86 100.0% 乡镇地区68 100.0% 0 .0% 68 100.0%

中小城市118 100.0% 0 .0% 118 100.0%

Descriptives

家庭所在地Statistic Std. Error

平均月生活费大型城市Mean 614.53 32.359

95% Confidence Interval for Mean Lower Bound 550.20 Upper Bound 678.87

5% Trimmed Mean 592.51 Median 500.00 Variance 90050.958

Std. Deviation 300.085

Minimum 100

Maximum 2500

Range 2400

Interquartile Range 300.00

Skewness 3.116 .260

Kurtosis 17.407 .514 乡镇地区Mean 529.41 26.569

95% Confidence Interval for Mean Lower Bound 476.38 Upper Bound 582.44

5% Trimmed Mean 518.46

Median 500.00

Variance 48002.634

Std. Deviation 219.095

Minimum 200

Maximum 1000

Range 800

Interquartile Range 200.00

Skewness .996 .291

Kurtosis .172 .574 中小城市Mean 618.64 18.644

95% Confidence Interval for Mean Lower Bound 581.72 Upper Bound 655.57

5% Trimmed Mean 612.34

Median 600.00

Variance 41016.949

Std. Deviation 202.526

Minimum 200

Maximum 1200

Range 1000 Interquartile Range 300.00 Skewness .686 .223 Kurtosis .168 .442

2、教材129页第3.3题

层样本

1 10 10

2 0 20 10 0 10 30 20

2 20 35 10 50 0 40 50 10 20 20

3 0 20 0 30 30 50 40 0 30 0

(1)数据结构、运用Excel的计算步骤及结果如下:

层样本

1 10 10

2 0 20 10 0 10 30 20

2 20 35 10 50 0 40 50 10 20 20

3 0 20 0 30 30 50 40 0 30 0

20.0678 9.47212 3.07768 1.0483

0.29614

总样本量 比例分配 185.907 奈曼分配 175.381

比例分配 奈曼分配 奈曼分配层权 n1 56.3888 33.659 w1 0.192 n2 92.5129 98.853 w2 0.564 n3 37.0051 42.869 w3

0.244 sum

185.907 175.38

1

第h 层的层权:N

N W h

h =

第h 层的样本均值:∑==

h

n i hi

h

h y

n y 1

1

第h 层的样本方差: )1/()(1

22--=∑=h n i h hi h

n y y s h

总体均值方差:h 2L

h

h h 2h

n 1W )(?)(s f y V Y V st ∑-===9.472 0483.1)96

.10678.20*%10()(

)(2

22/==?=αu Y r y V st 下面计算两种分配方法的样本量及每层要抽的样本量:

1.比例分配:

比例分配的层权为:h h W w =

故:n w n ?=21=56.3888 取整得1n =57

n w n ?=22=92.5129 取整得2n =93 n w n ?=33=37.0051 取整得3n =38

2.奈曼分配:

奈曼分配的层权为:∑==L

h h

h

h h h S

W S W w 1

/

故:n w n ?=21=33.659 取整得1n =34

n w n ?=22=98.853 取整得2n =99 n w n ?=33=42.869 取整得3n =43

(2)在SPSS 中的计算均值与方差的结果如下:

Descriptives

3、教材130页第3.4题

Wh ah

0.18 27

0.21 28

0.14 27

0.09 26

0.16 28

0.22 29

1165 5.50.4522220.17820.50.0003970.25838

总体比例估计0.924 比例分配层权

总体比例估计方差0.000396981 w1 0.18

总体比例估计标准差0.019924378 w2 0.21

V 2.60308E-05 w3 0.14

w4 0.09

w5 0.16

总样本量w6 0.22

比例分配2662.655644

奈曼分配2564.651673

比例分配奈曼分配奈曼分配层权

n1 479.278016 535.9991 w1 0.208995

n2 559.1576853 519.9509 w2 0.202737

n3 372.7717902 416.8882 w3 0.162552

n4 239.639008 303.6744 w4 0.118408

n5 426.0249031 396.1531 w5 0.154467

n6 585.7842418 391.9861 w6 0.152842 SUM 2662.655644 2564.652 1

公式:

(1) 总体比例P 的简单估计量:

P Y =,h h P Y =,h p y st =.

按照总体均值估计量的公式,可推出总体比例(成数)P的估计量为:

h h

h

h h h ??p W P W P L L

st ∑∑===0.924

(2) 总体比例P 的方差为

∑---=L

st n p p f W P V h h

h h h 2h 1)1()1()?(?=∑---L h

h h h h h h 2

1

)

1()

(1n p p n N N N

(3) 第h 层的样本方差为:h h h h h h

h q p def q p n n S 1

2

-= (4) 样本总量:

若h N 较大,则2

h S ≈)1(h h P P -,此时可进一步求出估计P 时对给定的分配形式(h h nw n =)有:

∑∑-+-=

L

h

h h h h

h h h P P W N V w P P W n )

1(1)1(2

计算抽样的样本量:

在此题中,总体数量N 非常大,故,

0)1(1

1

≈-∑=L

h h

h

h

p

P W N

因此:由公式(4)得:

(比例分配的层权为:h h W w =)

各层的样本量为:n w n ?=21=479.278016 取整得1n =480

n w n ?=22=559.1576853 取整得2n =560 n w n ?=33=372.7717902 取整得3n =373

=?=n w n 44239.639008 取整得4n =240 =?=n w n 55426.0249031 取整得5n =427 =?=n w n 66585.7842418 取整得6n =586

(奈曼分配的层权为:∑==L

h h

h

h h h S

W S W w 1

/

各层的样本量为:n w n ?=21=535.9991 取整得1n =536

n w n ?=22=519.9509 取整得2n =520 n w n ?=33=416.8882 取整得3n =417

=?=n w n 44303.6744 取整得4n =304 =?=n w n 55396.1531 取整得5n =397 =?=n w n 66391.9861 取整得6n =392

数据分析实验报告

数据分析实验报告 文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-

第一次试验报告 习题1.3 1建立数据集,定义变量并输入数据并保存。 2数据的描述,包括求均值、方差、中位数等统计量。 分析—描述统计—频率,选择如下: 输出: 统计量 全国居民 农村居民 城镇居民 N 有效 22 22 22 缺失 均值 1116.82 747.86 2336.41 中值 727.50 530.50 1499.50 方差 1031026.918 399673.838 4536136.444 百分位数 25 304.25 239.75 596.25 50 727.50 530.50 1499.50 75 1893.50 1197.00 4136.75 3画直方图,茎叶图,QQ 图。(全国居民) 分析—描述统计—探索,选择如下: 输出: 全国居民 Stem-and-Leaf Plot Frequency Stem & Leaf 5.00 0 . 56788 数据分析实验报告 【最新资料,WORD 文档,可编辑修改】

2.00 1 . 03 1.00 1 . 7 1.00 2 . 3 3.00 2 . 689 1.00 3 . 1 Stem width: 1000 Each leaf: 1 case(s) 分析—描述统计—QQ图,选择如下: 输出: 习题1.1 4数据正态性的检验:K—S检验,W检验数据: 取显着性水平为0.05 分析—描述统计—探索,选择如下:(1)K—S检验

结果:p=0.735 大于0.05 接受原假设,即数据来自正太总体。 (2 )W 检验 结果:在Shapiro-Wilk 检验结果972.00 w ,p=0.174大于0.05 接受原假设,即数据来自正太总体。 习题1.5 5 多维正态数据的统计量 数据:

数据挖掘实验报告

《数据挖掘》Weka实验报告 姓名_学号_ 指导教师 开课学期2015 至2016 学年 2 学期完成日期2015年6月12日

1.实验目的 基于https://www.wendangku.net/doc/a817929743.html,/ml/datasets/Breast+Cancer+WiscOnsin+%28Ori- ginal%29的数据,使用数据挖掘中的分类算法,运用Weka平台的基本功能对数据集进行分类,对算法结果进行性能比较,画出性能比较图,另外针对不同数量的训练集进行对比实验,并画出性能比较图训练并测试。 2.实验环境 实验采用Weka平台,数据使用来自https://www.wendangku.net/doc/a817929743.html,/ml/Datasets/Br- east+Cancer+WiscOnsin+%28Original%29,主要使用其中的Breast Cancer Wisc- onsin (Original) Data Set数据。Weka是怀卡托智能分析系统的缩写,该系统由新西兰怀卡托大学开发。Weka使用Java写成的,并且限制在GNU通用公共证书的条件下发布。它可以运行于几乎所有操作平台,是一款免费的,非商业化的机器学习以及数据挖掘软件。Weka提供了一个统一界面,可结合预处理以及后处理方法,将许多不同的学习算法应用于任何所给的数据集,并评估由不同的学习方案所得出的结果。 3.实验步骤 3.1数据预处理 本实验是针对威斯康辛州(原始)的乳腺癌数据集进行分类,该表含有Sample code number(样本代码),Clump Thickness(丛厚度),Uniformity of Cell Size (均匀的细胞大小),Uniformity of Cell Shape (均匀的细胞形状),Marginal Adhesion(边际粘连),Single Epithelial Cell Size(单一的上皮细胞大小),Bare Nuclei(裸核),Bland Chromatin(平淡的染色质),Normal Nucleoli(正常的核仁),Mitoses(有丝分裂),Class(分类),其中第二项到第十项取值均为1-10,分类中2代表良性,4代表恶性。通过实验,希望能找出患乳腺癌客户各指标的分布情况。 该数据的数据属性如下: 1. Sample code number(numeric),样本代码; 2. Clump Thickness(numeric),丛厚度;

控制系统仿真与设计实验报告

控制系统仿真与设计实验报告 姓名: 班级: 学号: 指导老师:刘峰 7.2.2控制系统的阶跃响应 一、实验目的 1.观察学习控制系统的单位阶跃响应; 2.记录单位阶跃响应曲线; 3.掌握时间相应的一般方法; 二、实验内容 1.二阶系统G(s)=10/(s2+2s+10)

键入程序,观察并记录阶跃响应曲线;录系统的闭环根、阻尼比、无阻尼振荡频率;记录实际测去的峰值大小、峰值时间、过渡时间,并与理论值比较。 (1)实验程序如下: num=[10]; den=[1 2 10]; step(num,den); 响应曲线如下图所示: (2)再键入: damp(den); step(num,den); [y x t]=step(num,den); [y,t’] 可得实验结果如下:

记录实际测取的峰值大小、峰值时间、过渡时间,并与理论计算值值比较 实际值理论值 峰值 1.3473 1.2975

峰值时间 1.0928 1.0649 过渡时间+%5 2.4836 2.6352 +%2 3.4771 3.5136 2. 二阶系统G(s)=10/(s2+2s+10) 试验程序如下: num0=[10]; den0=[1 2 10]; step(num0,den0); hold on; num1=[10]; den1=[1 6.32 10]; step(num1,den1); hold on; num2=[10]; den2=[1 12.64 10]; step(num2,den2); 响应曲线:

(2)修改参数,分别实现w n1= (1/2)w n0和w n1= 2w n0响应曲线试验程序: num0=[10]; den0=[1 2 10]; step(num0,den0); hold on; num1=[2.5]; den1=[1 1 2.5]; step(num1,den1); hold on; num2=[40]; den2=[1 4 40]; step(num2,den2); 响应曲线如下图所示:

质量管理实验报告

质量管理实验 实验一质量数据测定 一、实验任务 以减速器中的轴(输入轴和输出轴)为对象进行抽样检测,对测得的数据分别进行质量检验。 二、实验目的及训练要点 1)了解抽样的基本原理和方法。 2)了解测试仪器的选择、调整技巧。 3)了解测量数据的质量判定与检验。 三、实验内容 数据测试工作是工业企业生产的重要环节,是质量管理的一项基础工作,是确保产品质量的重要手段和方法,并且它可为各类质量问题的统计分析提供科学的依据,本次实验的主要内容包括: 1)外径千分尺的调整和校正。 2)游标卡尺的调整和校正。 3)减速器中各个轴(输入轴和输出轴)的外径宽度的抽样测量。 4)对所测数据进行处理和质量判定。 5)完成实验报告的攥写。 四、实验设备、仪器、工具及资料 外径千分尺1把,游标卡尺1把,减速器50个,标准件一组。

五、实验步骤 1.准备工作 1)熟悉“实验数据记录表”及检测仪器的使用方法。 2)准备所需资料,确定待选取的抽样方法及与之适宜的测量工具。 2.外径千分尺的调整和校正 外径千分尺主要用于工件的外尺寸测量。使用前应将测量面仔细擦净,检查或调整零位到正确位置。调整步骤如下: 1)校正或调整零位方法: 转动测力装置,使两测量面轻轻地接触(>25mm的外径千分尺应用校对量杆校正),当听到棘轮摩擦声时,即为零位。若此时不是零位则将固定套管上的螺钉松开用扳手转动固定套管使零位对准,然后紧固固定套管上的螺钉; 2)压线或离线的调整: 当微分筒压线或离线超过标准规定时,则松开取下测力装置,并取下盖板,取下微分桶及锥套,将锥套向前移或向后退来调整压线或离线,锥套向前移调压线,锥套向后移调离线,调好后将微分筒,及锥套装上,零位对准,盖上盖板。将测力装置装上拧紧则调整完毕。 3)测量时必须使用测力装置,以恒定测量压力进行测量,禁止测量运动的被测物。 3.游标卡尺的调整和校正 游标卡尺用于工件的内、外尺寸,外尺寸、深度、台阶等尺寸的测量。

数据挖掘实验报告(一)

数据挖掘实验报告(一) 数据预处理 姓名:李圣杰 班级:计算机1304 学号:1311610602

一、实验目的 1.学习均值平滑,中值平滑,边界值平滑的基本原理 2.掌握链表的使用方法 3.掌握文件读取的方法 二、实验设备 PC一台,dev-c++5.11 三、实验内容 数据平滑 假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13, 15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36, 40, 45, 46, 52, 70。使用你所熟悉的程序设计语言进行编程,实现如下功能(要求程序具有通用性): (a) 使用按箱平均值平滑法对以上数据进行平滑,箱的深度为3。 (b) 使用按箱中值平滑法对以上数据进行平滑,箱的深度为3。 (c) 使用按箱边界值平滑法对以上数据进行平滑,箱的深度为3。 四、实验原理 使用c语言,对数据文件进行读取,存入带头节点的指针链表中,同时计数,均值求三个数的平均值,中值求中间的一个数的值,边界值将中间的数转换为离边界较近的边界值 五、实验步骤 代码 #include #include #include #define DEEP 3 #define DATAFILE "data.txt" #define VPT 10 //定义结构体 typedef struct chain{ int num; struct chain *next; }* data; //定义全局变量 data head,p,q; FILE *fp; int num,sum,count=0; int i,j; int *box; void mean(); void medain(); void boundary(); int main () { //定义头指针 head=(data)malloc(sizeof(struc t chain)); head->next=NULL; /*打开文件*/ fp=fopen(DATAFILE,"r"); if(!fp) exit(0); p=head; while(!feof(fp)){

哈工大_控制系统实践_磁悬浮实验报告

研究生自动控制专业实验 地点:A区主楼518房间 姓名:实验日期:年月日斑号:学号:机组编号: 同组人:成绩:教师签字:磁悬浮小球系统 实验报告 主编:钱玉恒,杨亚非 哈工大航天学院控制科学实验室

磁悬浮小球控制系统实验报告 一、实验内容 1、熟悉磁悬浮球控制系统的结构和原理; 2、了解磁悬浮物理模型建模与控制器设计; 3、掌握根轨迹控制实验设计与仿真; 4、掌握频率响应控制实验与仿真; 5、掌握PID控制器设计实验与仿真; 6、实验PID控制器的实物系统调试; 二、实验设备 1、磁悬浮球控制系统一套 磁悬浮球控制系统包括磁悬浮小球控制器、磁悬浮小球实验装置等组成。在控制器的前部设有操作面板,操作面板上有起动/停止开关,控制器的后部有电源开关。 磁悬浮球控制系统计算机部分 磁悬浮球控制系统计算机部分主要有计算机、1711控制卡等; 三、实验步骤 1、系统实验的线路连接 磁悬浮小球控制器与计算机、磁悬浮小球实验装置全部采用标准线连接,电源部分有标准电源线,考虑实验设备的使用便利,在试验前,实验装置的线路已经连接完毕。 2、启动实验装置 通电之前,请详细检察电源等连线是否正确,确认无误后,可接通控制器电源,随后起动计算机和控制器,在编程和仿真情况下,不要启动控制器。 系统实验的参数调试

根据仿真的数据及控制规则进行参数调试(根轨迹、频率、PID 等),直到获得较理想参数为止。 四、实验要求 1、学生上机前要求 学生在实际上机调试之前,必须用自己的计算机,对系统的仿真全部做完,并且经过老师的检查许可后,才能申请上机调试。 学生必须交实验报告后才能上机调试。 2、学生上机要求 上机的同学要按照要求进行实验,不得有违反操作规程的现象,严格遵守实验室的有关规定。 五、系统建模思考题 1、系统模型线性化处理是否合理,写出推理过程? 合理,推理过程: 由级数理论,将非线性函数展开为泰勒级数。由此证明,在平衡点)x ,(i 00对 系统进行线性化处理是可行的。 对式2x i K x i F )(),(=作泰勒级数展开,省略高阶项可得: )x -)(x x ,(i F )i -)(i x ,(i F )x ,F(i x)F(i,000x 000i 00++= )x -(x K )i -(i K )x ,F(i x)F(i,0x 0i 00++= 平衡点小球电磁力和重力平衡,有 (,)+=F i x mg 0 |,δδ===00 i 00 i i x x F(i,x) F(i ,x )i ;|,δδ===00x 00i i x x F(i,x)F (i ,x )x 对2 i F(i,x )K()x =求偏导数得:

数据分析实验报告

数据分析实验报告 【最新资料,WORD文档,可编辑修改】 第一次试验报告 习题1.3 1建立数据集,定义变量并输入数据并保存。 2数据的描述,包括求均值、方差、中位数等统计量。 分析—描述统计—频率,选择如下: 输出:

方差1031026.918399673.8384536136.444百分位数25304.25239.75596.25 50727.50530.501499.50 751893.501197.004136.75 3画直方图,茎叶图,QQ图。(全国居民) 分析—描述统计—探索,选择如下: 输出: 全国居民Stem-and-Leaf Plot Frequency Stem & Leaf 9.00 0 . 122223344 5.00 0 . 56788 2.00 1 . 03 1.00 1 . 7 1.00 2 . 3 3.00 2 . 689

1.00 3 . 1 Stem width: 1000 Each leaf: 1 case(s) 分析—描述统计—QQ图,选择如下: 输出: 习题1.1 4数据正态性的检验:K—S检验,W检验数据: 取显着性水平为0.05 分析—描述统计—探索,选择如下:(1)K—S检验 单样本Kolmogorov-Smirnov 检验 身高N60正态参数a,,b均值139.00

标准差7.064 最极端差别绝对值.089 正.045 负-.089 Kolmogorov-Smirnov Z.686 渐近显着性(双侧).735 a. 检验分布为正态分布。 b. 根据数据计算得到。 结果:p=0.735 大于0.05 接受原假设,即数据来自正太总体。(2)W检验

通信原理抽样定理实验报告

通信原理实验(五) 实验一抽样定理实验 项目一、抽样信号观测及抽样定理实验 1、观测并记录抽样前后的信号波形,分别观测music和抽样输出 由分析知,自然抽样后的结果如图,很明 显抽样间隔相同,且抽样后的波形在其包 络严格被原音乐信号所限制加权,与被抽 样信号完全一致。 2、观测并记录平顶抽样前后信号的波形。 此结果为平顶抽样结果,仔细观察可发现 与上一实验中的自然抽样有很大差距,即 相同之处,其包络也由原信号所限制加 权,但是在抽样信号的每个频率分量呈矩 形,顶端是平的。 3、观测并对比抽样恢复后信号与被抽样信 号的波形,并以100HZ为步进,减小A-OUT的频率,比较观测并思考在抽样脉冲频率为多少的情况下恢复信号有失真。

(2)7.7KHZ 在频率为9HZ 时的波形如上图,低通滤 波器恢复出的信号与原信号基本一致, 只是相位有了延时,约1/4个Ts ; 逐渐减小抽样频率可知在7.7KHZ 左右, 恢复信号出现了幅度的失真,且随着fs 的减小,失真越大。 上述现象验证了抽样定理,即,在信号 的频率一定时,采样频率不能低于被采 样信号的2倍,否则将会出现频谱的混 叠,导致恢复出的信号严重失真。 实验二PCM 编译码实验 实验项目一 测试W681512的幅频特性 1、将信号源频率从50HZ 到4000HZ 用示波器接模块21的音频输出,观测信号 的幅频 特性。 ⑴、4000HZ (2)、3500HZ (1)9.0KHZ (3)7.0KHZ

(3)120HZ⑷ 50HZ 在实验中仔细观察结果,可知,当信号源的频率由4000HZ不断下降到3000HZ 的过程中,信号的频谱幅度在不断地增加;在3000HZ~1500HZ的过程中,信号的幅度在一定范围内变化,但是没有特别大的差距;在1500HZ~50HZ的过程中,信号的幅度有极为明显的下降。 实验项目二PCM编码规则实验 1、以FS为触发,观测编码输入波形。示波器的DIV档调节为100微秒 图中分别为输入被抽样信号和抽样脉冲, 观察可发现正弦波与编码对应。 2、保持示波器设置不变的情况下,以FS 为触发观测PCM量化输出,记录波形

数据挖掘实验报告资料

大数据理论与技术读书报告 -----K最近邻分类算法 指导老师: 陈莉 学生姓名: 李阳帆 学号: 201531467 专业: 计算机技术 日期 :2016年8月31日

摘要 数据挖掘是机器学习领域内广泛研究的知识领域,是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地提取出有价值的知识模式,以满足人们不同应用的需要。K 近邻算法(KNN)是基于统计的分类方法,是大数据理论与分析的分类算法中比较常用的一种方法。该算法具有直观、无需先验统计知识、无师学习等特点,目前已经成为数据挖掘技术的理论和应用研究方法之一。本文主要研究了K 近邻分类算法,首先简要地介绍了数据挖掘中的各种分类算法,详细地阐述了K 近邻算法的基本原理和应用领域,最后在matlab环境里仿真实现,并对实验结果进行分析,提出了改进的方法。 关键词:K 近邻,聚类算法,权重,复杂度,准确度

1.引言 (1) 2.研究目的与意义 (1) 3.算法思想 (2) 4.算法实现 (2) 4.1 参数设置 (2) 4.2数据集 (2) 4.3实验步骤 (3) 4.4实验结果与分析 (3) 5.总结与反思 (4) 附件1 (6)

1.引言 随着数据库技术的飞速发展,人工智能领域的一个分支—— 机器学习的研究自 20 世纪 50 年代开始以来也取得了很大进展。用数据库管理系统来存储数据,用机器学习的方法来分析数据,挖掘大量数据背后的知识,这两者的结合促成了数据库中的知识发现(Knowledge Discovery in Databases,简记 KDD)的产生,也称作数据挖掘(Data Ming,简记 DM)。 数据挖掘是信息技术自然演化的结果。信息技术的发展大致可以描述为如下的过程:初期的是简单的数据收集和数据库的构造;后来发展到对数据的管理,包括:数据存储、检索以及数据库事务处理;再后来发展到对数据的分析和理解, 这时候出现了数据仓库技术和数据挖掘技术。数据挖掘是涉及数据库和人工智能等学科的一门当前相当活跃的研究领域。 数据挖掘是机器学习领域内广泛研究的知识领域,是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地抽取出有价值的知识模式,以满足人们不同应用的需要[1]。目前,数据挖掘已经成为一个具有迫切实现需要的很有前途的热点研究课题。 2.研究目的与意义 近邻方法是在一组历史数据记录中寻找一个或者若干个与当前记录最相似的历史纪录的已知特征值来预测当前记录的未知或遗失特征值[14]。近邻方法是数据挖掘分类算法中比较常用的一种方法。K 近邻算法(简称 KNN)是基于统计的分类方法[15]。KNN 分类算法根据待识样本在特征空间中 K 个最近邻样本中的多数样本的类别来进行分类,因此具有直观、无需先验统计知识、无师学习等特点,从而成为非参数分类的一种重要方法。 大多数分类方法是基于向量空间模型的。当前在分类方法中,对任意两个向量: x= ) ,..., , ( 2 1x x x n和) ,..., , (' ' 2 ' 1 'x x x x n 存在 3 种最通用的距离度量:欧氏距离、余弦距 离[16]和内积[17]。有两种常用的分类策略:一种是计算待分类向量到所有训练集中的向量间的距离:如 K 近邻选择K个距离最小的向量然后进行综合,以决定其类别。另一种是用训练集中的向量构成类别向量,仅计算待分类向量到所有类别向量的距离,选择一个距离最小的类别向量决定类别的归属。很明显,距离计算在分类中起关键作用。由于以上 3 种距离度量不涉及向量的特征之间的关系,这使得距离的计算不精确,从而影响分类的效果。

过程控制系统实验报告

实验一过程控制系统的组成认识实验 过程控制及检测装置硬件结构组成认识,控制方案的组成及控制系统连接 一、过程控制实验装置简介 过程控制是指自动控制系统中被控量为温度、压力、流量、液位等变量在工业生产过程中的自动化控制。本系统设计本着培养工程化、参数化、现代化、开放性、综合性人才为出发点。实验对象采用当今工业现场常用的对象,如水箱、锅炉等。仪表采用具有人工智能算法及通讯接口的智能调节仪,上位机监控软件采用MCGS工控组态软件。对象系统还留有扩展连接口,扩展信号接口便于控制系统二次开发,如PLC控制、DCS控制开发等。学生通过对该系统的了解和使用,进入企业后能很快地适应环境并进入角色。同时该系统也为教师和研究生提供一个高水平的学习和研究开发的平台。 二、过程控制实验装置组成 本实验装置由过程控制实验对象、智能仪表控制台及上位机PC三部分组成。 1、被控对象 由上、下二个有机玻璃水箱和不锈钢储水箱串接,4.5千瓦电加热锅炉(由不锈钢锅炉内胆加温筒和封闭外循环不锈钢锅炉夹套构成),压力容器组成。 水箱:包括上、下水箱和储水箱。上、下水箱采用透明长方体有机玻璃,坚实耐用,透明度高,有利于学生直接观察液位的变化和记录结果。水箱结构新颖,内有三个槽,分别是缓冲槽、工作槽、出水槽,还设有溢流口。二个水箱可以组成一阶、二阶单回路液位控制实验和双闭环液位定值控制等实验。 模拟锅炉:锅炉采用不锈钢精致而成,由两层组成:加热层(内胆)和冷却层(夹套)。做温度定值实验时,可用冷却循环水帮助散热。加热层和冷却层都有温度传感器检测其温度,可做温度串级控制、前馈-反馈控制、比值控制、解耦控制等实验。 压力容器:采用不锈钢做成,一大一小两个连通的容器,可以组成一阶、二阶单回路压力控制实验和双闭环串级定值控制等实验。 管道:整个系统管道采用不锈钢管连接而成,彻底避免了管道生锈的可能性。为了提高实验装置的使用年限,储水箱换水可用箱底的出水阀进行。 2、检测装置 (液位)差压变送器:检测上、下二个水箱的液位。其型号:FB0803BAEIR,测量范围:0~1.6KPa,精度:0.5。输出信号:4~20mA DC。 涡轮流量传感器:测量电动调节阀支路的水流量。其型号:LWGY-6A,公称压力:6.3MPa,精度:1.0%,输出信号:4~20mA DC 温度传感器:本装置采用了两个铜电阻温度传感器,分别测量锅炉内胆、锅炉夹套的温度。经过温度传感器,可将温度信号转换为4~20mA DC电流信号。 (气体)扩散硅压力变送器:用来检测压力容器内气体的压力大小。其型号:DBYG-4000A/ST2X1,测量范围:0.6~3.5Mpa连续可调,精度:0.2,输出信号为4~20mA DC。 3、执行机构 电气转换器:型号为QZD-1000,输入信号为4~20mA DC,输出信号:20~100Ka气压信号,输出用来驱动气动调节阀。 气动薄膜小流量调节阀:用来控制压力回路流量的调节。型号为ZMAP-100,输入信号为4~20mA DC或0~5V DC,反馈信号为4~20mA DC。气源信号 压力:20~100Kpa,流通能力:0.0032。阀门控制精度:0.1%~0.3%,环境温度:-4~+200℃。 SCR移相调压模块:采用可控硅移相触发装置,输入控制信号0~5V DC或4~20mA DC 或10K电位器,输出电压变化范围:0~220V AC,用来控制电加热管加热。 水泵:型号为UPA90,流量为30升/分,扬程为8米,功率为180W。

matlab验证时域采样定理实验报告

通信原理实验报告实验名称:采样定理 实验时间: 201211日年12月 指导老师:应娜 学院:计算机学院 级:班 学号: 姓名:

通信原理实验报告 一、实验名称 MATLAB验证低通抽样定理 二、实验目的 1、掌握抽样定理的工作原理。 2、通过MATLAB编程实现对抽样定理的验证,加深抽样定理的理解。同时训练应用计算机分析问题的能力。 3、了解MATLAB软件,学习应用MATLAB软件的仿真技术。它主要侧重于某些理论知识的灵活运用,以及一些关键命令的掌握,理解,分析等。 4、计算在临界采样、过采样、欠采样三种不同条件下恢复信号的误差,并由此总结采样频率对信号恢复产生误差的影响,从而验证时域采样定理。 三、实验步骤 1、画出连续时间信号的时域波形及其幅频特性曲线,信号为 f(x)=sin(2*pi*80*t)+ cos(2*pi*30*t); 2、对信号进行采样,得到采样序列,画出采样频率分别为80Hz,110 Hz,140 Hz时的采样序列波形; 3、对不同采样频率下的采样序列进行频谱分析,绘制其幅频曲线,对比各频率下采样序列和的幅频曲线有无差别。 4、对信号进行谱分析,观察与3中结果有无差别。 5、由采样序列恢复出连续时间信号,画出其时域波形,对比与原连续时间信号的时域波形。 四、数据分析 (1)部分程序分析: f=[fs0*k2/m2,fs0*k1/m1]; %设置原信号的频率数组 axis([min(t),max(t),min(fx1),max(fx1)]) %画原信号幅度频谱 f1=[fs*k2/m2,fs*k1/m1]; %设置采样信号的频率数组 fz=eval(fy); %获取采样序列 FZ=fz*exp(-j*[1:length(fz)]'*w); %采样信号的离散时间傅里叶变换 TMN=ones(length(n),1)*t-n'*T*ones(1,length(t)); 由采样信号恢复原信号fh=fz*sinc(fs*TMN); %. (2)原信号的波形与幅度频谱:

数据挖掘实验报告-关联规则挖掘

数据挖掘实验报告(二)关联规则挖掘 姓名:李圣杰 班级:计算机1304 学号:1311610602

一、实验目的 1. 1.掌握关联规则挖掘的Apriori算法; 2.将Apriori算法用具体的编程语言实现。 二、实验设备 PC一台,dev-c++5.11 三、实验内容 根据下列的Apriori算法进行编程:

四、实验步骤 1.编制程序。 2.调试程序。可采用下面的数据库D作为原始数据调试程序,得到的候选1项集、2项集、3项集分别为C1、C2、C3,得到的频繁1项集、2项集、3项集分别为L1、L2、L3。

代码 #include #include #define D 4 //事务的个数 #define MinSupCount 2 //最小事务支持度数 void main() { char a[4][5]={ {'A','C','D'}, {'B','C','E'}, {'A','B','C','E'}, {'B','E'} }; char b[20],d[100],t,b2[100][10],b21[100 ][10]; int i,j,k,x=0,flag=1,c[20]={0},x1=0,i1 =0,j1,counter=0,c1[100]={0},flag1= 1,j2,u=0,c2[100]={0},n[20],v=1; int count[100],temp; for(i=0;i=MinSupCount) { d[x1]=b[k]; count[x1]=c[k]; x1++; } } //对选出的项集中的元素进行排序 for(i=0;i

自动控制系统实验报告

自动控制系统实验报告 学号: 班级: 姓名: 老师:

一.运动控制系统实验 实验一.硬件电路的熟悉和控制原理复习巩固 实验目的:综合了解运动控制实验仪器机械结构、各部分硬件电路以及控制原理,复习巩固以前课堂知识,为下阶段实习打好基础。 实验内容:了解运动控制实验仪的几个基本电路: 单片机控制电路(键盘显示电路最小应用系统、步进电机控制电路、光槽位置检测电路) ISA运动接口卡原理(搞清楚译码电路原理和ISA总线原理) 步进电机驱动检测电路原理(高低压恒流斩波驱动电路原理、光槽位置检测电路)两轴运动十字工作台结构 步进电机驱动技术(掌握步进电机三相六拍、三相三拍驱动方法。) 微机接口技术、单片机原理及接口技术,数控轮廓插补原理,计算机高级语言硬件编程等知识。 实验结果: 步进电机驱动技术: 控制信号接口: (1)PUL:单脉冲控制方式时为脉冲控制信号,每当脉冲由低变高是电机走一步;双 脉冲控制方式时为正转脉冲信号。 (2)DIR:单脉冲控制方式时为方向控制信号,用于改变电机转向;双脉冲控制方式 时为反转脉冲信号。

(3)OPTO :为PUL 、DIR 、ENA 的共阳极端口。 (4)ENA :使能/禁止信号,高电平使能,低电平时驱动器不能工作,电机处于自由状 态。 电流设定: (1)工作电流设定: (2)静止电流设定: 静态电流可用SW4 拨码开关设定,off 表示静态电流设为动态电流的一半,on 表示静态电流与动态电流相同。一般用途中应将SW4 设成off ,使得电机和驱动器的发热减少,可靠性提高。脉冲串停止后约0.4 秒左右电流自动减至一半左右(实际值的60%),发热量理论上减至36%。 (3)细分设定: (4)步进电机的转速与脉冲频率的关系 电机转速v = 脉冲频率P * 电机固有步进角e / (360 * 细分数m) 逐点比较法的直线插补和圆弧插补: 一.直线插补原理: 如图所示的平面斜线AB ,以斜线起点A 的坐标为x0,y0,斜线AB 的终点坐标为(xe ,ye),则此直线方程为: 00 00Y Ye X Xe Y Y X X --= -- 取判别函数F =(Y —Y0)(Xe —Xo)—(X-X0)(Ye —Y0)

通信原理抽样定理及其应用实验报告

实验1 抽样定理及其应用实验 一、实验目的 1.通过对模拟信号抽样的实验,加深对抽样定理的理解; 2.通过PAM 调制实验,使学生能加深理解脉冲幅度调制的特点; 3.学习PAM 调制硬件实现电路,掌握调整测试方法。 二、实验仪器 1.PAM 脉冲调幅模块,位号:H (实物图片如下) 2.时钟与基带数据发生模块,位号:G (实物图片见第3页) 3.20M 双踪示波器1台 4.频率计1台 5.小平口螺丝刀1只 6.信号连接线3根 三、实验原理 抽样定理告诉我们:如果对某一带宽有限的时间连续信号(模拟信号)进行抽样,且抽 样速率达到一定数值时,那么根据这些抽样值就能准确地还原原信号。这就是说,若要传输模拟信号,不一定要传输模拟信号本身,可以只传输按抽样定理得到的抽样值。 PAM 实验原理:它采用模拟开关CD4066实现脉冲幅度调制。抽样脉冲序列为高电平时, 模拟开关导通,有调制信号输出;抽样脉冲序列为低电平,模拟开关断开, 无信号输出 图1-2 PAM 信道仿真电路示意图 32W01 C1 C2 32P03 R2 32TP0

四、可调元件及测量点的作用 32P01:模拟信号输入连接铆孔。 32P02:抽样脉冲信号输入连接铆孔。 32TP01:输出的抽样后信号测试点。 32P03:经仿真信道传输后信号的输出连接铆孔。 32W01:仿真信道的特性调节电位器。 五、实验内容及步骤 1.插入有关实验模块: 在关闭系统电源的条件下,将“时钟与基带数据发生模块”、“PAM脉冲幅度调制模块”,插到底板“G、H”号的位置插座上(具体位置可见底板右下角的“实验模块位置分布表”)。注意模块插头与底板插座的防呆口一致,模块位号与底板位号的一致。 2.信号线连接: 用专用铆孔导线将P03、32P01;P09、32P02;32P03、P14连接(注意连接铆孔的箭头指向,将输出铆孔连接输入铆孔)。 3.加电: 打开系统电源开关,底板的电源指示灯正常显示。若电源指示灯显示不正常,请立即关闭电源,查找异常原因。

大数据挖掘weka大数据分类实验报告材料

一、实验目的 使用数据挖掘中的分类算法,对数据集进行分类训练并测试。应用不同的分类算法,比较他们之间的不同。与此同时了解Weka平台的基本功能与使用方法。 二、实验环境 实验采用Weka 平台,数据使用Weka安装目录下data文件夹下的默认数据集iris.arff。 Weka是怀卡托智能分析系统的缩写,该系统由新西兰怀卡托大学开发。Weka使用Java 写成的,并且限制在GNU通用公共证书的条件下发布。它可以运行于几乎所有操作平台,是一款免费的,非商业化的机器学习以及数据挖掘软件。Weka提供了一个统一界面,可结合预处理以及后处理方法,将许多不同的学习算法应用于任何所给的数据集,并评估由不同的学习方案所得出的结果。 三、数据预处理 Weka平台支持ARFF格式和CSV格式的数据。由于本次使用平台自带的ARFF格式数据,所以不存在格式转换的过程。实验所用的ARFF格式数据集如图1所示 图1 ARFF格式数据集(iris.arff)

对于iris数据集,它包含了150个实例(每个分类包含50个实例),共有sepal length、sepal width、petal length、petal width和class五种属性。期中前四种属性为数值类型,class属性为分类属性,表示实例所对应的的类别。该数据集中的全部实例共可分为三类:Iris Setosa、Iris Versicolour和Iris Virginica。 实验数据集中所有的数据都是实验所需的,因此不存在属性筛选的问题。若所采用的数据集中存在大量的与实验无关的属性,则需要使用weka平台的Filter(过滤器)实现属性的筛选。 实验所需的训练集和测试集均为iris.arff。 四、实验过程及结果 应用iris数据集,分别采用LibSVM、C4.5决策树分类器和朴素贝叶斯分类器进行测试和评价,分别在训练数据上训练出分类模型,找出各个模型最优的参数值,并对三个模型进行全面评价比较,得到一个最好的分类模型以及该模型所有设置的最优参数。最后使用这些参数以及训练集和校验集数据一起构造出一个最优分类器,并利用该分类器对测试数据进行预测。 1、LibSVM分类 Weka 平台内部没有集成libSVM分类器,要使用该分类器,需要下载libsvm.jar并导入到Weka中。 用“Explorer”打开数据集“iris.arff”,并在Explorer中将功能面板切换到“Classify”。点“Choose”按钮选择“functions(weka.classifiers.functions.LibSVM)”,选择LibSVM分类算法。 在Test Options 面板中选择Cross-Validatioin folds=10,即十折交叉验证。然后点击“start”按钮:

控制系统仿真实验报告

哈尔滨理工大学实验报告 控制系统仿真 专业:自动化12-1 学号:1230130101 姓名:

一.分析系统性能 课程名称控制系统仿真实验名称分析系统性能时间8.29 地点3# 姓名蔡庆刚学号1230130101 班级自动化12-1 一.实验目的及内容: 1. 熟悉MATLAB软件的操作过程; 2. 熟悉闭环系统稳定性的判断方法; 3. 熟悉闭环系统阶跃响应性能指标的求取。 二.实验用设备仪器及材料: PC, Matlab 软件平台 三、实验步骤 1. 编写MATLAB程序代码; 2. 在MATLAT中输入程序代码,运行程序; 3.分析结果。 四.实验结果分析: 1.程序截图

得到阶跃响应曲线 得到响应指标截图如下

2.求取零极点程序截图 得到零极点分布图 3.分析系统稳定性 根据稳定的充分必要条件判别线性系统的稳定性最简单的方法是求出系统所有极点,并观察是否含有实部大于0的极点,如果有系统不稳定。有零极点分布图可知系统稳定。

二.单容过程的阶跃响应 一、实验目的 1. 熟悉MATLAB软件的操作过程 2. 了解自衡单容过程的阶跃响应过程 3. 得出自衡单容过程的单位阶跃响应曲线 二、实验内容 已知两个单容过程的模型分别为 1 () 0.5 G s s =和5 1 () 51 s G s e s - = + ,试在 Simulink中建立模型,并求单位阶跃响应曲线。 三、实验步骤 1. 在Simulink中建立模型,得出实验原理图。 2. 运行模型后,双击Scope,得到的单位阶跃响应曲线。 四、实验结果 1.建立系统Simulink仿真模型图,其仿真模型为

血液检查实验报告doc

血液检查实验报告 篇一:血型测定实验报告 血型测定实验报告 一、实验目的: 学习ABO型血的鉴定原理和方法。观察红细胞凝集现象,了解抗原抗体反应。 二、实验原理: 血型就是红细胞膜上特异抗原的类型。在ABO血型系统中,红细胞膜上抗原分A和B两种抗原,而血清抗体分抗A 和抗B两种抗体。A抗原加抗A抗体或B抗原加抗B抗体,则产生凝集现象。血型鉴定是将受试者的红细胞加入标准A 型血清(含有抗B抗体)与标准B型血清(含有抗A抗体)中,观察有无凝集现象,从而测知受试者红细胞膜上有无A 或/和B抗原。在ABO血型系统,根据红细胞膜上是否含A、B抗原而分为A、B、AB、O四型。(见表4-3-1-1)三消毒采血针;载玻片;消毒棉签;抗A、抗B血型定型试剂;75%乙醇;受检者血液四、实验步骤 (1)取双凹玻片一块,用干净纱布轻拭使之洁净,在玻片两端用腊笔标明A及B,并分别各滴入A及B标准血清一滴。 (2)细胞悬液制备从指尖或耳垂取血一滴,加入含1ml 生理盐水的小试管内,混匀,即得约5%红细胞悬液。采血

时应注意先用75%酒精消毒指尖或耳垂。 (3)用滴管吸取红细胞悬液,分别各滴一滴于玻片两端的血清上,注意勿使滴管与血清相接触。 (4)竹签两头分别混合,搅匀。 (5) 10~30min后观察结果。如有凝集反应可见到呈红色点状或小片状凝集块浮起。先用肉眼看有无凝集现象,肉眼不易分辨时,则在低倍显微镜下观察,如有凝集反应,可见红细胞聚集成团。 (6)判断血型根据被试者红细胞是否被A,B型标准血清所凝集,判断其血型。五、实验结果: 我们组本次实验中,载玻片1左边为抗B型定型试剂,呈淡红色,未发生凝聚;右边为抗A型定型试剂,血液在试剂中凝结,试剂较清亮。该受试者1血型为A。 载玻片2左右边的试剂内的血液皆不出现凝结现象,受试者2为O型血。 六、实验讨论: 1.实验中要分清牙签,不要用一牙签一端同时在抗A血清和抗B血清中搅拌,以免造成抗体试剂不纯。 2.实验中我们组发现15分钟后没有出现血凝现象,可用牙签轻轻搅拌一会儿,有些载玻片上就不现了血块,但有些经搅拌后仍不出现血凝现象,表示确实不含相应的抗原。篇二:血糖的测定实验报告

抽样实习报告 )

福建农林大学林学院 实习专题报告 学生姓名: 专业名称:统计学 年级: 2007年级 学号: 070482014 指导教师:陈昌雄 教师职称:副教授 成绩: 二OO九年十二月

一、实习目的 1、通过实习掌握仪器操作和基本技能,掌握树高和胸径的测量方法。 2、了解回归分析的原理及估计方法,通过测量后山林地的树木(主要是马尾松和阔叶林)来分别获得马尾松和阔叶林的平均树高。 3、掌握仪器操作和基本技能,使理论与实践紧密结合在一起,通过将课上理论知识与课外实习相结合,增强自己的实践操作能力,验证提高所学理论知识,拓宽视野,增长知识面,增强对本学科的感性认识。 二、实习时间:2009年12月27日至2009年12月31日 三、实习单位:福建农林大学校园后山 四、实习主要内容 内容一:马尾松与阔叶林的测定 (一)实习要求: 1、认真严谨,使用前先要熟悉仪器,在使用的时候要严格按照使用说明书,注意保护仪器不受损伤。 2、实验结果要符合精度要求。 3、选择树木时要注意考虑周围环境地形的影响因素,对不同的地形测量树高所选择距离有所差异,一般选择水平距离为15米的地方测量树高。 4.要均匀的选择胸径不同的树木。 (二)实习仪器 计算器,测高器、皮尺、测径尺等 (三)实习步骤 1、本次调查分为小班调查,在实现规划好的林班采取抽样方法,选取马尾松和阔叶林进行胸径和树高的测量,并且每个小班分别选取马尾松和阔叶林各5株。 2、用事先准备好的130厘米的垂直量尺,以调查的树的底部为根基,垂直量取树干130厘米的部分,做好标记,用测径尺在标志的部分量取树干的胸径。并记录数据 3、量取树木的树高,以欲测量的树木的根基为始端,用皮尺水平截取15米的距离,在距离的树木水平距离15米的地方,用测高器瞄准树木的树冠,固定测高器的数值为X1,再次用测高器瞄准树木的基部,固定测高器的数值为X2,如果X2的值为正,则树高为Y= X1-X2,如果X2的值为负,则树高Y= X1+X2。并记录数据。 4、在实测中,常常会遇到无法用测高器瞄准树木基部的情况,这时,可以以人或物为标的物,以人或物立足于树木的基部,用测高器瞄准人(物)的顶部,读取数值,再用步骤3的方法截取数据,在此基础上加上该人(物)的高度,此时得出的数值Y才为树高。并记录数据。

相关文档
相关文档 最新文档