福建农林大学管理学院旅游学院
实验报告
课程名称:统计学
专业班级:
学号:
学生姓名:
指导教师:
成绩: 2013年11月24日
实验一:EXCEL数据的整理与显示
一、实验目的及要求:
一、实验的目的
⑴掌握EXCEL用于数据预处理的基本菜单操作及命令;
⑵掌握EXCEL用于整理与显示的基本菜单操作及命令。
⑶能够根据实际中的数据特点选择最优的图形进行数据的展示。
(二)内容及要求
4.09某行业管理局所属40个企业2002年的产品销售收入数据(单位:万元)见book3.02。要求:
(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;
(2)如果按规定:销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
二、仪器用具
硬件:计算机(安装Windows98、Windows2000或Windows XP或以上)
软件:Excel 2003
三、实验原理
应用EXCEL的基本原理,根据不同数据的特征选择合适的数据处理方法对数据进行基本的整理和图形的展示。
四、实验方法与步骤
⑴数据的EXCEL预处理
①利用EXCEL进行筛选
“数据”——“筛选”——“自动筛选/高级筛选”
②利用EXCEL进行排序
“数据”——“排序”
⑵品质数据的EXCEL整理和显示
“插入”——“图表”——选择图形
⑶数值型数据的EXCEL整理和显示
“工具”——“数据分析”——“直方图”
五、实验结果与数据处理
实验(1)
1、首先将给出的数据进行升序排列
2、将分组上限90,100,110,…,150,160输入到工作表的接收区域C3:C10,选择“工具”下拉菜单,并选择“数据分析”选项。
在“数据分析”对话框中选择“直方图”命令,并选择“确定”。
3、当出现对话框时,
在“输入区域”方框内键入A1:A40;
在“接收区域”方框内键入:C2:C9;
在“输出区域”方框内键入E4(可根据需要确定);
4、选择“图表输出”;
5、选择“确定”,结果图如下所示
由于直方图中各组的间距为0,需要对图形进行调整。用鼠标左键单击任一直条,然后右键单击,在弹出的快捷菜单中选取数据系列格式,弹出数据系列格式对话框,在对话框中选择选项标签,把间距宽度改为0,按确定后即可得到直方图,
如下所示
得到基本图表后,我们可根据实际需要,利用鼠标右键的诸多功能进行细化。
实验(2)
1、首先将给出的数据进行升序排列
2、将分组上限90,100,110,…,150,160输入到工作表的接收区域C3:C10,
选择“工具”下拉菜单,并选择“数据分析”选项。
在“数据分析”对话框中选择“直方图”命令,并选择“确定”。
3、当出现对话框时,
在“输入区域”方框内键入A1:A40;
在“接收区域”方框内键入:C2:C9;
在“输出区域”方框内键入E4(可根据需要确定);
4、选择“图表输出”、“累积百分率”;
5、选择“确定”。如图所示
六、讨论与结论
真的觉得很多东西都要真的去做了,才会真的理解,并且能够掌握,记得刚开始的时候觉得很简单,后来自己去做了,就会觉得很难,很多个步骤都不知道怎么进行,后来在老师的操作演示下,才尝试着去做。遇见不懂的问题,积极地向老师同学请教,虽然走了不少弯路,但结果还是令人欣喜的。最后,我们要充分利用计算机、网络等,真正地学习一些知识,在掌握理论的基础上再进行实际操作能达到事半功倍的效果。
人口数据
一、实验目的及要求:
一、实验的目的
⑴掌握EXCEL用于数据预处理的基本菜单操作及命令;
⑵掌握EXCEL用于整理与显示的基本菜单操作及命令。
⑶能够根据实际中的数据特点选择最优的图形进行数据的展示。
(二)内容及要求
1.计算1982-2011年我国人口年人均增长率,
2.比较1982年与2011年我国人口结构发生的变化。
提示:结构比较可以选择哪些图呢?(饼图、柱形图、雷达图)。作图之前可能需要将你所要展示的数据整理在一张表上,去掉多余的数据,方便作图。
二、仪器用具
硬件:计算机(安装Windows98、Windows2000或Windows XP或以上)
软件:Excel 2003
三、实验原理
应用EXCEL的基本原理,根据不同数据的特征选择合适的数据处理方法对数据进行基本的整理和图形的展示。
四、实验方法与步骤
⑴利用函数求得1982-2011年我国人口年人均增长率
⑵利用EXCEL插入一个新的工作表
⑶将原表中的1982年和2011年的人口数数据复制到另一个工作边上
(4)点击“插入”,选择图表的“折线图”形式,并进行其他设置,完成图。五、实验结果与数据处理
(1)通过函数公式函数得出1982-2011年我国人口年人
均增长率:
(2)右击“sheet 1”工作表,选择“插入”,新建一个工作表“sheet 2”将“sheet 1”中的部分数据复制过来,如图所示
(3)插入折线图表,选定区域(!$A$5:$E$6),并进行必要调整,得出最终结图:
六、讨论与结论
对于excel的操作不够熟练,对于书本的知识掌握的不够透彻,在选择合适的函数计算公式的选择、数据量的选择以及图标形式在本题中非常关键。综合考虑,选择了各年龄段的人口数,并进行折线图的形式对比两个年份的人口结构差异。选择折线形式图表的原因是折线图表能够比较清晰地表现出两个年份在同一年龄段的人口结构差异,能够从中得出所求数据。
七、实验打印输出结果:
1.计算1982-2011年我国人口年人均增长率,如图所示,
透视表
一、实验目的及要求:
一、实验的目的
⑴掌握EXCEL用于数据预处理的基本菜单操作及命令;
⑵掌握EXCEL用于整理与显示的基本菜单操作及命令。
⑶能够根据实际中的数据特点选择最优的图形进行数据的展示。
(二)内容及要求
对数据进行整理,分析各国的订单情况。
提示:可使用数据透视表对数据进行整理,分国度,分人员以及对数据进行更长时段的整理(如按季度),对订单的分布情况进行分析。
二、仪器用具
硬件:计算机(安装Windows98、Windows2000或Windows XP或以上)
软件:Excel 2003
三、实验原理
应用EXCEL的基本原理,根据不同数据的特征选择合适的数据处理方法对数据进行基本的整理和图形的展示。
四、实验方法与步骤
(1)点击“数据分析”。选择“数据透视表和数据透视图”;
(2)单击“下一步”,来到步骤2,选定区域:练习!$A$1:$E$800
(3)单击“下一步”,来到步骤3,直接单击“完成”,得出结果图。
(4)将“订单日期”拖入左侧的“行字段”蓝线内;“国家/地区”字段拖入上方处蓝线内;将“销售人员”拖入“列字段”蓝线内;将“销售金额”字段拖入“数据”蓝线内。
(5)在数据透视表中点击“设置报告格式”选择“报表1”形式,点击“确定”。
五、实验结果与数据处理
(1)打开数据透视表和数据透视图向导,选的区域(练习!$A$1:$E$800),如图
(3)通过想到得出本阶段的结果图,如图,
(4)将各个字段依次拉入所对应区域,如图,
(5)对数据的版本进行调整,得到如图
六、讨论与结论
在做这个实验的时候要特别的细心,在打开数据透视图向导,根据字段属性将其拖入恰当的显示框,可是关键是不知如何正确排列显示项目,导致生成的透视表版面混乱。可见结果固然重要,但还是要讲究方法,要经过合理的编排、页面规划,才能从视觉上令人感到舒服,而且也有利于统计结果的整理及查询。
实验二:用EXCEL展示数据的分布特征及列联分析一、实验目的及要求:
(一)目的
⑴掌握利用EXCEL的命令对数据的分布特征进行描述;
⑵掌握利用函数命令对数据进行计算分析,
⑶掌握利用EXCEL的命令对数据分布特征进行分析,
⑷掌握利用EXCEL进行列联分析
(二)内容及要求
1、数据分布特征的测度
4.09 一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。15个工人分别用三种方法在相同的时间内组装的产品数量(单位:个)见book4.09。
准备采用什么方法来评价组装方法的优劣?
如果让你选择一种方法,你会作出怎样的选择?试说明理由。
2、列联分析
9.03 某报社关心其读者的阅读习惯是否与其文化程度有关,随机调查了254读者,得到数据见book9.03。
以 =0.05的显著性水平检验读者的阅读习惯是否与文化程度有关。
3、人口分布特征
根据统计数据,计算2011年我国人口的平均年龄(均值及中位数)。并判断数据是否存在偏态
二、仪器用具
硬件:计算机(安装Windows98 、Windows2000 或Windows XP或以上)
软件:EXCEL
三、实验原理
在做这个实验的时候,要充分结合书本,对一些数据进行检验,分析。比如有些数据的大小是用来证明显著性的,但每个数据证明的显著性的方面又不相同。
四、实验方法与步骤
⑴数值型数据的EXCEL整理和显示
“工具”——“数据分析”——“直方图”
⑵数据的分布特征的EXCEL处理
“工具”——“数据分析”——“描述统计”
⑶数据计算分析
“插入”——“函数”——命令选择
⑷列联分析的EXCEL处理
“插入”——“函数”——“统计”——“CHITEST”
五、实验结果与数据处理
1、数据分布特征的测度
计算各方法的平均值、中位数、标准差,离散系数
(2)采用方法A来组装较优,因为方法A的离散系数是三种方法中最小的,离散系数越小,说明数据的离散程度小。这样组装也是三种组装方法中较优的。2、列联分析
在对话框“Actual_range”输入观察数据区域:B2:E2。
在对话框“Expectual_range”输入观察数据区域:G2:G17。
得到P值为0.00021。由于P<α,所以拒绝原假设。
3、人口分布特征
(1)(菜单栏)插入→函数→选择类别→点击下拉键→统计→AVERAGE→对话框→在
Number1输入B9:B28→确定
(2)(1)(菜单栏)插入→函数→选择类别→点击下拉键→统计→MEDLAN→对话框→在Number1输入B9:B28→确定
六、讨论与结论
首先,明晰题意才能保证后续工作的正常进行;其次,在明确目标的前提下要选择适当的方法,因为不明白指的方法是哪一种,导致盲目操作,多次失败后才得到结果;最后,操作之前了解相关知识是有必要的,而且要认真操作,可以减少做的无用功。
七、实验打印输出结果:
3、人口分布特征
——
——
实验三:多元回归及时间序列分析
一、实验目的及要求:
(一)目的
⑴掌握利用EXCEL的命令对数据的分布特征进行描述;
⑵掌握利用函数命令对数据进行计算分析,
⑶掌握利用EXCEL的命令对数据分布特征进行分析,
⑷掌握利用EXCEL进行列联分析
(二)内容及要求
1、多元线性回归
12.03 、一家房地产评估公司想对某城市的房地产销售价格(y1)与地产的评估价值(x1)、房产的评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格作出合理预测。为此,收集了20栋住宅的房地产评估数据见book12.03。
(1)写出估计的多元回归方程。
(2)在销售价格的总变差中,被估计的回归方程所解释的比例是多少?
(3)检验回归方程的线性关系是否显著(α=0.05)。
(4)检验各回归系数是否显著(α=0.05) 。
12.06 一家货物运输公司想研究运输费用与货物类型的关系,并建立运输费用与货物类型的回归模型,以此对运输费用作出预测。该运输公司所运输的货物分为隆重类型:易碎品和非易碎品。15个路程大致相同、而货物类型不同的运输费用数据见book12.06。
(1)写出运输费用与货物类型之间的线性模型。
(2)对模型中的回归系数进行解释。
(3)检验模型的线性关系是否显著 (α=0.05) 。
2、时间序列分析和预测
13.07、一家大型百货公司最近几年各季度的销售额数据(单位:万元)见book13.07。对这一时间序列的构成要素进行分解,并作出图形进行分析,并预测
2013年各季度的值。
13.02、 1981年~2000年我国油彩油菜籽单位面积产量数据(单位:公顷/公斤)见book13.02。
(1)根据绘制时间序列图描述其形态。
(2)用5期移动平均法预测2001年的单位面积产量。
(3)采用指数平滑法,分别用平滑系数α=0.3和α=0.5预测2001年的单位面积产量,分析预测误差,说明用哪一个平滑系数预测更合适?
二、仪器用具(四号黑体加粗)
硬件:计算机(安装Windows98 、Windows2000 或Windows XP或以上)
软件:EXCEL
三、实验原理
通过图形的绘制观察数据的变动情况,利用移动平均法、指数平滑法、季节指数的测定、趋势的测定等方法确定并分析时间序列的趋势、季节以及周期性的变动特征。
四、实验方法与步骤
⑴图形描述的EXCEL处理
“图表向导”——“折线图”
⑵多元回归的EXCEL处理
⑶“工具”——“数据分析”——“回归”
⑷移动平均的数据处理
“工具”——“数据分析”——“移动平均”
⑸指数平滑的EXCEL处理
“工具”——“数据分析”——“指数平滑”
五、实验结果与数据处理(四号黑体加粗)
1、多元线性回归:
①y^=148.700453960221+0.81473818343482x1+0.820979541546054x2
+0.135041011984075x3
②87.8%
③
由于Significance F<α,所以显著
④
根据数据分析:同理,将P-value与α比较得出第三个回归系数显著,其余不显著。(2)
①Y^= 4.542857143 +7.082142857X1
②当变量X每变化一个单位,Y就会变化7.082142857个单位。
③Significance F< ,所以该模型线性关系显著
2、时间序列分析和预测:
六、讨论与结论
实验操作需要对相关知识进行必要的了解,操作中要细致认真。听杨老师讲解时,感觉很简单,但是实际操作时就会出现各种问题,可见学习重在理解。最后,操作重在孰能生巧,计算机强大的功能需要我们去挖掘,理论要与实践相结合。根据绘制时间序列图描述其形态,和使用移动平均法时就需要联系书本知识。
实验报告评分表