文档库 最新最全的文档下载
当前位置:文档库 › 020B.数据的整理与分析

020B.数据的整理与分析

020B.数据的整理与分析
020B.数据的整理与分析

一、选择题

1. (2012广东珠海,3,3分)某同学对甲、乙、丙、丁四个市场二月份每天的白菜价格进行调查,计算后发现这个月四个市场的价格平均值相同,方差分别为S 2甲=8.5,S 2,乙=

2.5,S 2丙=10.1,S 2,丁=7.4.二月份白菜价格最稳定的市场是( )

A .甲

B .乙

C .丙

D .丁 【答案】B

2.

A.24

B.25

C.26

D.27 【答案】C

3. (2012湖北荆州,5,3分)对于一组统计数据:2,3,6,9,3,7,下列说法错误..

的是( ) A .众数是3 B .中位数是6 C .平均数是5 D .极差是7 【答案】B

4. (2012湖北武汉,10,3分)对某校八年级随机抽取若干名学生进行体能测试,成绩记为1分,2分,3分,4分共4个等级,将调查结果绘制成如下条形统计图和扇形统计图。根据图中信息,这些学生的平均分数是( )

第10题图2

A .2.25 B. 2.5 C. 2.95 D. 3 【答案】C

5. (2012湖南怀化,7,3分)为了比较甲乙两种水稻秧苗是否出苗整齐,每种秧苗各取10株分别量出每株长度,发现两组秧苗的平均长度一样,甲、乙方差分别是3.9、15.8,则下列说法正确的是( ) A.甲秧苗出苗更整齐 B.乙秧苗出苗更整齐 C.甲、乙出苗一样整齐 D.无法确定

【答案】A

6.(2012湖南娄底,9,3分)一组数据为:2,2,3,4,5,5,5,6,则下列说法正确的是( ) A. 这组数据的众数是2 B. 这组数据的平均数是3 C. 这组数据的极差是4 D. 这组数据的中位数是5 【答案】C

7. (2012湖北随州,4,4分) 某校为了丰富校园文化,举行初中生书法大赛,决赛设置了6个获奖名额,共有11名选手进入决赛,选手决赛得分均相同.若知道某位选手的决赛的得分,要判断他是否获奖,只需知道这11名学生决赛得分的( ) A .中位数 B .平均数 C .众数 D .方差 【答案】A

8. (2012山东莱芜,2,3分)四名运动员参加了射击预选赛,他们成绩的平均环数x 及其方差s 2如下表所示:

如果选出一个成绩较好且状态稳定的人去参赛,那么应选()

A.甲B.乙C.丙 D.丁

【答案】B

9.(2012山东威海,7,3分)某外贸公司要出口一批食品罐头,标准质量为每听454克,现抽取10听样品进行

检测,它们的质量与标准质量的差值(单位:克)如下:

-10,+5, 0,+5, 0, 0,-5, 0,+5,+10.

则这10听罐头质量的平均数及众数为()

A.454,454 B.455,454 C.454,459 D.455,0

【答案】B

10.(2012山东潍坊,3,3分)某班6名同学参加体能测试的成绩如下(单位:分):75,95,75,75,80,80.关

于这组数据的表述错误的是()

A.众数是75 B.中位数是75 C.平均数是80 D.极差是20

【答案】B

11.(2012天津,5,3分)为调查某校2000名学生对新闻、体育、动画、娱乐、戏曲五类电视节目的喜爱情况,随机抽取部分学生进行调查,并结合数据作出如图所示的扇形统计图.根据统计图提供的信息,可估算出该校喜爱体育节目ide学生共有()

A.300名B.400名C.500名D.600名

【答案】B

12.(2012广西桂林,2,3分)下面是几个城市某年一月份的平均温度,其中平均温度最低的是()

A、桂林市11.2℃

B、广州13.5℃

C、北京-4.8℃

D、南京3.4℃

【答案】C

13.(2012

则达州市各县(市、区)人口数的极差和中位数分别是()

A、145万人130万人

B、103万人130万人

C、42万人112万人

D、103万人112万人

【答案】D

14.(2012北京,7,4分)某课外小组的同学们在社会实践活动中调查了20户家庭某月的

用电量,如下表所示:

则这20户家庭该月用

电量的众数和中位数

分别是()A.180,160 B.160,180 C.160,160 D.180,180

【答案】A

15.(2012江苏宿迁,6,3分)已知一组数据:1,3,5,5,6,则这组数据的方差是

A.16 B.5 C.4 D.3.2

答案:D.

16.(2012湖南怀化,7,3分)为了比较甲乙两种水稻秧苗是否出苗整齐,每种秧苗各取10株分别量出每株长度,发现两组秧苗的平均长度一样,甲、乙方差分别是3.9、15.8,则下列说法正确的是()

A.甲秧苗出苗更整齐

B.乙秧苗出苗更整齐

C.甲、乙出苗一样整齐

D.无法确定

【答案】A

17.(2012湖北宜昌,7,3分)爱华中学生物兴趣小组调查了本地区几棵古树的生长年代,记录数据如下(单

位:年):200,240,220,200,210.这组数据的中位数是()

A.200 B.210 C.220 D.240

【答案】B

18.(2012贵州遵义,5,3分)某班六名同学体能测试成绩(分)如下:80,90,75,75,80,80,对这组数据表述错误的是()

A.众数是80 B.极差是15 C.平均数是80 D.中位数是75

【答案】D

19.(2012贵州黔东南州,2,4分)七(1)班的6位同学在一节体育课上进行引体向上训练时,统计数据分别

为7,12,10,6,9,6则这组数据的中位数是()

A. 6

B. 7

C. 8

D. 9

【答案】C

20.(2012贵州毕节,14,3分)毕节市某地盛产天麻,为了解今年这个地方天麻的收成情况,特调查了20户

农户,数据如下:(单位:千克)则这组数据的()

300 200 150 100 500 100 350 500 300 400

150 400 200 350 300 200 150 100 450 500

A.平均数是285B.众数是300

C.中位数是325D.极差是500

【答案】A

21.

22.

23.

24.

25.

26.

27.

28.

29.

30.

31.

32.

33.

34.

35.

36.

37.

38.

39.

二、填空题

1.(2012福建泉州,11,4)某校初一年级段举行科技创新比赛活动,各班选送的学生分别为3、2、2、6、6、5,则这组数据的平均数是。

【答案】4

2.(2012湖北黄石,13,3分)某校从参加计算机测试的学生中抽取了60名学生的成绩(40~100分)进行分

析,并将其分成了六段后绘制成如图(6)所示的频数分布直方图(其中70~80段因故看不清),若60分以上(含60分)为及格,试根据图中信息来估计这次测试的及格率约为.

【答案】75%

3.(2012湖北武汉,14,3分)某校九(1)班8名学生的体重(单位:kg)分别是39,40,43,43,43,45,45,46.这组数据的众数是.

【答案】43

4.(2012湖南怀化,16,3分)某段时间,小明连续7天测得日最高温度如下表所示,那么这7天的最高温度的平均温度是℃.

【答案】26

,其中这组数据的极差是5,那么这组数据的平均数5.(2012内蒙古呼和浩特,15,3分)一组数据x,3,2,0,1

是.

【答案】1.6或0.4.

6.(2012四川巴中,16,3分)在巴中创建“国家森林城市”的植树活动中,初三某班某小组五名同学植树株数分

别为5,6,6,6,7,则这组数据的众数为_________.

【答案】6

7.(2012潜江仙桃天门江汉油田12,3分)

【答案】0.12

8.(2012广西桂林,15,3分)数据:1、1、3、3、3、4、5的众数是.

【答案】3

9.(2012,湖北孝感,17,3分)已知一组数据x 1,x 2,…,x n 的方差是S 2,则新的一组数据ax 1+1,ax 2+1,…,ax n +1(a 为常数,a ≠0)的方差是____________.(用含有a ,S 2的代数式表示). (友情提示:2222121

()()()n S x x x x x x n ??=

-+-++-?

? )

【答案】a 2s 2

10. (2012山东日照14,4分)下图是根据今年某校九年级学生体育考试跳绳的成绩绘制成的统计图.如果该校九年级共有200名学生参加了这项跳绳考试,根据该统计图给出的信息可得这些

同学跳绳考试的平均成绩为 .

【答案】175.55

11. (2012江苏南通,13,3分)某校9名同学的身高(单位:cm)分别是:163,165,167,164,165,166,

165,164,166,则这组数据的众数为

答案:165cm .

12. (2012湖南怀化,16,3分)某段时间,小明连续7天测得日最高温度如下表所示,那么这7天的最高温度的平均温度是 ℃.

【答案】26 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33.

34. 35. 36. 37. 38. 39.

三、解答题

1. (2012福建泉州,22,9)(9分)为了解参与“泉州市非物质文化进校园”活动的情况,某校就报名参加花灯、南音、高甲戏、闽南语四个兴趣小组的学生进行抽样调查,下面是根据收集的数据进行绘制的两幅不完整的统计图,请根据图中提供的信息,解答下面的问题:

(1)此次共调查了 名同学,扇形统计图中“闽南语”部分的圆心角是 度,请你把条形统计图补充完整; (2)如果每位教师最多只能辅导同一兴趣小组的学生20名,现该校共有1200名学生报名参加这4个兴趣小组,请你估计学校至少应安排对少名高甲戏兴趣小组的教师。

【答案】 解:(1)100名,90

条形统计图(略); (2)920100

15

1200=÷?

(名) ∴学校至少应安排9名高甲戏兴趣小组的教师。

2. (2012湖南娄底,21,7分)学校为了调查学生对教学的满意度,随机抽取了部分学生作问卷调查:用“A ”

表示“很满意“,“B ”表示“满意”,“C ”表示“比较满意”,“D ”表示“不满意”,图10是工作人员根据问卷调查统计资料绘制的两幅不完整的统计图,请你根据统计图提供的信息解答以下问题: (1)本次问卷调查,共调查了多少名学生? (2)将图10甲中“B ”部分的图形补充完整;

(3)如果该校有学生1000人,请你估计该校学生对教学感到“不满意”的约有多少人?

【答案】(1)40÷20%=200 ∴共调查了200名学生。 (2)

图10

(3)1000×5%=50

∴估计该校学生对教学感到“不满意”的约有50人。

3. (2012内蒙古呼和浩特,21,9分)如图是交警在一个路口统计的某个时段来往的车速情况(单位:千米/时) (1)找出该样本数据的众数与中位数; (2)计算这些车的平均速度;(结果精确互0.1)

(3)若某车以50.5千米/时的速度经过该路口,能否说该车的速度要比一半以上车的速度快?并说明判断理由

.

【答案】(1)该样本数据的众数为52,中位数为52; (2)

4.522

468522

55454653852551250≈+++++?+?+?+?+?+?千米/时

(3)不能.因为由(1)知该样本的中位数是52,所以可以估计该路段的车辆大约有一半的车速要快于52千米/时,有一半的车速要慢于52千米/时,该车的车速是50.5千米/时,小于52千米/时,所以不能说该车的车速要比一半以上车的车速快.

4. (2012湖北随州,21,9分) 在“走基层,树新风”活动中,青年记者石剑深入边远山区,随机走访农户,调查农村儿童生活教育现状.根据收集的数据,编制了不完整的统计图表如下:

山区儿童生活教育现状

请你用学过的统计知识,解决问题:

(1)记者石剑走访了边远山区多少家农户? (2)将统计图表中的空缺数据填写完整;

(3)分析数据后,请你提一条合理建议. 【答案】(1)由扇形图和表格可知,C 类占25%,A 类占:100%-15%-25%-10%=50%

A 、

B 、

C 、

D 类各占50%,10%,25%,15%

A 、

B 、

C 、

D 类各户数100,20,50,30,总户数为200.记者石剑走访了200户农家. …………2分 (2

…………2分

………2分 …………2分

(3)由图表可知孩子带在身边有益孩子的身心健康,建议社会关心留守儿童的生活状况. …………1分 5. (2012山东莱芜,19,8分)某校学生会准备调查六年级学生参加“武术类”、“书画类”、“棋牌类”、“器乐

类”四类校本课程的人数.

(1)确定调查方式时,甲同学说:“我到六年级(1

)班去调查全体同学”;乙同学说:“放学时我到校门口随机调查部分同学”;丙同学说:“我到六年级每个班随机调查一定数量的同学” .请你指出哪位同学的调查方式最合理.

(2)他们采用最为合理的调查方法收集数据,并绘制了如图所示的统计表和扇形统计图.

①a= ,b= ;

②在扇形统计图中器乐类所对应扇形的圆心角的度数是 ;

③若该校六年级有学生560人,请你估计大约有多少学生参加武术类校本课程.

【答案】 (1)丙 ……………………………………………………………2分 (2)①100 0.15 ……………………………………………………………4分

②1440 ……………………………………………………………6分

③560×0.25=140(人)

……………………………………………………………8分

D 类 15 %

C 类25%

B 类 10 %

A 类 50 %山区儿童各类所占比例

山区儿童身心健康状况

第19题图)

6.(2012山东威海,21,9分)某市为提高学生参与体育活动的积极性,2011年9月围绕“你最喜欢的体育运动

项目(只写一项)”这一问题,对初一新生进行随机抽样调查.下图是根据调查结果绘制成的统计图(不完整)

请你根据图中提供的信息解答下列问题: (1) 本次抽样调查的样本容量是多少?

(2) 根据条形统计图中的数据,求扇形统计图中“最喜欢足球运动”的学生数所对应扇形的圆心角的度数。 (3) 请将条形统计图补充完整.

(4) 若该市2011年约有初一新生21000人,请你估计全市本届学生中“最喜欢足球运动”的学生约有多少

人。 【答案】解:(1)100÷20%=500

∴本次抽样调查的样本容量是500. (2)360°×

060

=43.2500

, ∴扇形统计图中“最喜欢足球运动”的学生数所对应扇形的圆心角的度数为43.2° (3)如图:

60

(4)21000=2520()500

全市本届学生中“最喜欢足球运动”的学生约有2520人

7. (2012四川巴中,26,10分)我市建设森林城市需要大量的树苗,某生态示范园负责对甲、乙、丙、丁四个品种的树苗共500株进行树苗成活率试验,从中选取成活率高的品种进行推广. 通过实验得知:丙种树苗成活率为89.6%. 把实验数据绘制成下列两幅统计图(部分信息未给出)

(1)实验所用的乙种树苗的数量是_______株; (2)求出丙种树苗的成活数,并把图8补充完整;

(3)你认为应选哪一种树苗进行推广?请通过计算说明理由. 【答案】 (1) 100

(2) 00005002589.6112??=(株) 图略 (3)

,

,

选择丁种,它的成活率最高,为93.6% ∴选择丁种,它的成活率最高,为93.6% 8. (2012潜江仙桃天门江汉油田17,7分)

【答案】

9.(2012天津,21,8分)在开展“学雷锋社会实践”活动中,某校为了解全校1200名学生参加活动的情况,随机调查了50名学生每人参加活动的次数,并根据数据绘成条形统计图如下:

(Ⅰ)求这50个样本数据的平均数、众数和中位数;

(Ⅱ)根据样本数据,估算该校1200名学生共参加了多少次活动. 【答案】解:(Ⅰ)观察条形统计图,可知这组样本数据的平均数是132731741855

3.3

50

x

?+?+?+?+?

==,

∴这组样本数据的平均数为3.3,

∵在这组样本数据中,4出现了18次,出现的次数最多,∴这组样本数据的众数是4.

∵将这组样本数据按小到大的顺序排列,其中处在中间的两个数都是3,有33

3 2

+

=.

∴这组样本数据的中位数是3.

(Ⅱ)∵这组样本数据的平均数为3.3,

∴估计全校1200名参加活动次数的总体平均数是3.3,有3.3×1200=3960.

∴该校1200名学生共参加了约3960次.

10.(2012

(1)该班女生体重的中位数是;

(2)该班女生的平均体重是Kg;

(3)根据上表补全条形统计图

【答案】解:(1)40 (2)40.1 (3)如图

11.(2012四川达州,18,6分)(6分)今年5月31日是世界卫生组织发起的第25个“世界无烟日”.为了更好地宣传吸烟的危害,某中学八年级一班数学兴趣小组设计了如下调查问卷,在达城中心广场随机调查了部分吸烟人群,并将调查结果绘制成统计图.

根据以上信息,解答下列问题:

(1)本次接受调查的总人数是 人,并把条形统计图补充完整.

(2)在扇形统计图中, C 选项的人数百分比是 ,E 选项所在扇形的圆心角的度数是 .

(3)若通川区约有烟民14万人,试估计对吸烟有害持“无所谓”态度的约有多少人?你对这部分人群有何建

议?

【答案】(1)300(1分) 补全统计图如下:

(2)26% , 36°

(3)解:A 选项的百分比为:

300

12

×100%=4% 对吸烟有害持“无所谓”态度的人数为:14×4%=0.56(万)

建议:只要答案合理均可

12. (2012北京,21,5分)近年来,北京市大力发展轨道交通,轨道运营里程大幅增加,2011年北京市又调整

修订了2010至2020年轨道交通线网的发展规划.以下是根据北京市轨道交通指挥中心发布的有关数据制作的统计图表的一部分.

请根据以上信息解答下列问题:

(1)补全条形统计图并在图中标明相应数据;

(2)按照2011年规划方案,预计2020年北京市轨道交通运营里程将达到多少千米? (3)要按时完成截至2015年的轨道交通规划任务,从2011到2015这4年中,平均每年需 新增运营里程多少千米? 【答案】(1)

228

(2)336÷33.6﹪=1000(千米)。 (3)372-336=36 (367-36)÷4=82.75(千米)

13. (2012江苏宿迁,22,8

(1)这10天用电量的众数是 ▲ ,中位数是 ▲ ,极差是 ▲ ;

北京市轨道交通已开通线路

(2)求这个班级平均每天的用电量;

(3)已知该校共有20个班级,该月共计30天,试估计该校该月总的用电量. 解:(1)13,13,7;

(2)∵1

(8910213314152)10

x =

++?+?++?=12(度) ∴这个班级平均每天的用电量为12度;

(3)∵12×20×30=7200(度) ∴估计该校该月总的用电量为7200度.

20.14. (2012江苏南通,21,9分)为了了解学生参加家务劳动的情况,某中学随机抽取部分同学,统计他们双

休日两天劳动的时间,将统计的劳动时间(单位:分钟)分成5组:30≤x <60,60≤x <90,90≤x <120,120≤x <150,150≤x <180,绘制成频数分布直方图. (1)这次抽样调查的样本容量是 ;

(2)根据小组60≤x <90的组中值75,估计该组中所有数据的和为 ;(3)该中学共有1000名学生,估计双休日两天有多少名学生家务劳动的时间不少于90分钟?

解:(1)5+20+35+30+10=100; (2)75×20=1500(分); (3)

100

10

3035++=0.75,所以1000×0.75=750(人)

15. (2012湖北宜昌,20,8分)某超市销售多种颜色的运动服装,其中平均每天销售红、黄、蓝、白四种颜色

运动服的数量如下表,由此绘制的不完整的扇形统计图如下图: 四种颜色服装销量统计表

⑴求表中m ,α 的值,井将扇形统计图补充完整:

表中m = ,n = ,α = ;

⑵为吸引更多的顾客,超市将上述扇形统计图制作成一个可自由转动的转盘,并规定:顾客在本超市购买商品金额达到一定的数目,就获得一次转动转盘的机会.如果转盘停止后,指针指向红色服装、黄色服装区域,可分别获得60元、20元的购物券.求顾客每转动一次转盘获得购物券金额的平均数. 【答案】⑴m =160,n =40,α =90°.

60

90 120

150

180

时间/分

30

第21题

扇形统计图如图所示.

⑵由⑴知,P (红)=18

,P (黄)=1

4,每转动一次转盘获得购物券金额的平均数是:

60×18

+20×1

4=12.5(元).

答:每转动一敬转盘所获购物券金额的平均数是12.5元.

16.(2012黑龙江省哈尔滨市,25,8分)虹承中学为做好学生“午餐工程”工作,学校工作人员搭配了A 、B 、C 、D 四种不同类型的套餐,学校决定围绕“在A 、B 、C 、D 四种套餐中,你最喜欢的套擦种类是什么?(必选且只选一种)”的问题,在全校范围内随机抽取部分学生进行问卷调查,将调查问卷适当整理后绘制成如图所示的不完整的条形统计图,其中最喜欢D 种套餐的学生占被抽取人数的20%,请你根据以上信息解答下列问题:

(1)在这次调查中,一共抽取了多少名学生? (2)通过计算,补全条形统计图;

(3)如果全校有2000名学生,请你估计全校学生中最喜欢B 种套餐的学生有多少名?

【答案】解:(1)40÷20%=200(名) ……………….2分 ∴在这次调查中,一共抽取了200名学生。

(2) 200-90-50-40=20(名)………………….2分 正确画图……………………….1分

(3)

方法一:2000×

200

50

=500(名)…………….2分 ∴估计全校最喜欢B 种套餐的学生有500名。…………….1分 方法二:

200

50

×100%=25%............................1分 200×25%=500(名)............................1分

∴估计全校最喜欢B 种套餐的学生有500名。…………….1分 17. (2012河北,21,8分)(本小题满分8分)

某社区准备在甲、乙两位射箭爱好者中选出一人参加集训,两人各射了5箭,他们的总成绩(单位:环)相同.小宇根据他们的成绩绘制了如下尚不完整的统计图表,并计算了甲成绩的平均数和方差(见小宇的作业).

(1)a= ,x

乙= ;

(2)请完成图11中表示乙变化情况的折线;

(3)①观察图11,可看出 的成绩比较稳定(填“甲”或“乙”).参照小宇的计算方法,计算乙成绩的方差,并验证你的判断.

②请你从平均数和方差的角度分析,谁将被选中.

【答案】解:(1)4 6……………………………………………………………(2分) (2)如图1…………………………………………………………………………(3分)

(3)①乙……………………………………………………………………………(4分) S 2乙=

1

5

[(7﹣6)2+(5﹣6)2+(7﹣6)2+(4﹣6)2+(7﹣6)2]=1.6. ………(5分) 由于S 2乙<S 2甲,所以上述判断正确. ……………………………………………(6分) ②因为两人成绩的平均水平(平均数)相同,乙的成绩比甲稳定,所以乙将被选中.

………………………………………………………………………………………(8分)

18. (2012贵州遵义,23,10分)根据遵义市统计局发布的2011年遵义市国民经济和社会发展统计公报中相关

数据,我市2011年社会消费品销售总额按城乡划分绘制统计图①,2010年与2011年社会消费品销售总额按行业划分绘制条形统计图②,请根据图中信息解答下列问题:

(1)图①中“乡村消费品销售额”的圆心角是_______度,乡村消费品销售额为______亿元;

(2)2010年到2011年间,批发业、零售业、餐饮住宿业中销售额增长的百分数最大的行业是________; (3)预计2013年我市社会消费品销售总额达到504亿元,求我市2011~2013年社会消费品销售总额的年平均增

长率.

【答案】(1)72,70 (2)批发业

(3)设2011-2013年社会消费品销售总额的年平均增长率为 x ,根据题意得: 350(1+x )2=504 (1+x )2=1.44

x 1=0.2,x 2=—2.2(舍去)

答:2011-2013年平均增长率为20%.

19.(2012贵州黔东南州,19,10分)现在“校园手机”越来越受到社会的关注,为此某校九(1)班随机调查了本校若干名学生和家长对中学生带手机现象的看法,统计整理并制作了如下统计图。 (1)求这次调查的家长人数,并补全图①; (2)求图②中表示家长“赞成”的圆心角的度数;

(3)从这次接受调查的家长来看,若该校的家长为2500名,则有多少名家长持反对态度?

乡村消费 品销售额

城市消费 品销售额 占总额80%

图①(2011年按城乡划分)

图②(2010、2011年按行业划分)

批发业 零售业 餐饮食宿业 行业类别

图① 图②

【答案】解:(1)家长人数:120÷20%=600(人)

∴反对家长人数=600-60-120=420(人) 图略。

(2)

060

360600

?=36o (3) 2500×420

600

=1750(人)

20. (2012贵州毕节,24,10分)(本题10分)近年来,地震、泥石流等自然灾害频繁发生,造成极大的生命

和财产损失。为了更好地做好“防震减灾”工作,我市相关部门对某中学学生“防震减灾”的知晓率采取随机抽样的方法进行问卷调查,调查结果分为“非常了解”、“比较了解”、“基本连接”和“不了解”四个等级。小明根据调查结果绘制了如下统计图,请根据提供的信息回答问题:

(1)本次参与问卷调查的学生有 人;扇形统计图中“基本连接”部分所对应的扇形圆心角是 度;在该校2000名学生中随机提问一名学生,对“防震减灾”不了解...的概率为 。 (2)请补全频数分布直方图。

【答案】 解:(1)400; 144 ;1

20

(2)频数分布直方图

21.

22.

23.

24.

25.

26.

27.

28.

29.

30.

31.

32.

33.

34.

35.

36.

37.

38.

39.

调查结果与分析报告附数据整理分析报告总结报告

数据分析 我们设样本一为抽样总体,样本二为男生的抽样总体,样本三为女生的抽样总体。 一、生活费水平的分析 1. 对样本一的分析 由整理后输入计算机的数据,我们绘制出样本一生活费水平的频数分布表和直方图,结果如下: 样本一生活费水平的频数分布表 频率百分比有效百分比累积百分 500以下26 500-70024 700-9009 900以上6 总数65 由上图可以看出:样本一(即本科生抽样全体)月生活费500元以下所占频数最高。 样本一(总体)平均月生活费置信区间的构造表 One-Sample Statistics N Mean Std. Deviation Std. Error Mean 频数65

从上述分析可知:我们有95%的把握认为重庆工商大学本科生的月生活费平均水平在元~元之间。 样本一男生月生活费水平的频数分布表 Statistics 频数 N Valid38 Missing0 Mean Std. Error of Mean Std. Deviation 频数 Frequency Percent Valid Percent Cumulative Percent Valid500以下14 500-70015 700-9004 900以上5 Total38 由上图可以看出:样本二月生活费500-700所占频数最高,是月生活费的众数。分析众数后,我们进一步分析月生活费的平均水平,得出结果如下: T-Test

One-Sample Statistics N Mean Std. Deviation Std. Error Mean 频数38 从上述分析可知:我们有95%的把握认为重庆工商大学科生男生的月生活费平均水平在 元~元之间。 3.对样本三的分析 由整理后输入计算机的数据,绘制出样本三女生月生活费水平的频数分布表和直方图,结果如下: 样本三女生月生活费水平的频数分布表 Statistics 频数 N Valid27 Missing0 Mean Std. Error of Mean Std. Deviation

数据分析模板

下面是我对数据分析的一些格式及规范要求 数据分析应当包括以下几个主要部件: 1.样本情况分析及调查工具说明 2.调查结果分析 以图表加文字的方式呈现数据分析的结果,并对结果简单的解释与说明。(1)表格设计的要求 表格应为三线表(自动套用格式中的“简明Ⅰ型”),表格应当包括表序号、表题目,及数据内容。其中表格中的数据及文字小正文一号,表格序号在报告中进行统一设计与安排,且表格题目应当在表格的正中上方。 图表的设计要求,图表设计大小应当与正文的文字大小匹配,图表应当包括图序号,图题及图形。其中图序号在报告中也应当进行统一设计与安排,但不得与表格序号混用。图题目应当在图表的正中下方,图中的数据与文字也应当比正文文字小一号。 一些简单与明白的数据结果,仅以表格陈述就可以。但如果数据结果比较复杂,数据结果比较繁多,那么可以将表与图结合起来进行数据结果描述。这样既给读者具体的数据结果信息,亦能使数据信息以很具像的方式进行呈现。 (2)结果的分析应体现层次性。一般按大家的操作化结构,分专题进行结果分析。每个专题结束之后,应当进行简要的总结与归纳,突出其中一些主要或令人意外的结果。最后,在所有的专题分析完之后,应当有一个综合的分析,并在其中陈列本次调查结果中最具有价值的一些结果与结论。 (3)结果分析中,禁止用大量的文字对结果进行说明性的描述,请大家尽量使用简洁与简单的方式陈述结果,但也不能只为追求很少的文字,对一些内容结果进行有选择性的删除,务必做到二者的平衡。 (4)调查报告中,如果有引入统计符号,所有的统计符号均为斜体表示。 请大家先自学教材后面附录二中的社会调查报告实例,然后再参考下面的一份调查报告样例: 浙江农村广播调查报告

数据的收集、整理、描述与分析报告

数据的收集、整理与描述——备课人:发 【问题】统计调查的一般过程是什么?统计调查对我们有什么帮助?统计调查一般包括收集数据、整理数据、描述数据和分析数据等过程;可以帮助我们更好地了解周围世界,对未知的事物作出合理的推断和预测. 一、数据处理的一般程序 二、回顾与思考 Ⅰ、数据的收集 1、收集数据的方法(在收集数据时,为了方便统计,可以用字母表示调查的各种类型。) ①问卷调查法:为了获得某个总体的信息,找出与该信息有关的因素,而编制的一些带有问题的问卷调查。 ②媒体调查法:如利用报纸、、电视、网络等媒体进行调查。 ③民意调查法:如投票选举。 ④实地调查法:如现场进行观察、收集和统计数据。 例1、调查下列问题,选择哪种方法比较恰当。 ①班里谁最适合当班长()②正在播出的某电视节目收视率() ③本班同学早上的起床时间()④黄河某段水域的水污染情况() 2、收集数据的一般步骤: ①明确调查的问题;——谁当班长最合适 ②确定调查对象;——全班同学 ③选择调查方法;——采用推荐的调查方法 ④展开调查;——每位同学将自己心目中认为最合适的写在纸上,投入推荐箱 ⑤统计整理调查结果;——由一位同学唱票,另一位同学记票(划正字),第三位同学在旁边监督。 ⑥分析数据的记录结果,作出合理的判断和决策; 3、收集数据的调查方式 (1)全面调查 定义:考察全体对象的调查叫做全面调查。

全面调查的常见方法:①问卷调查法;②访问调查法;③调查法; 特点:收集到的数据全面、准确,但花费多、耗时长、而且某些具有破坏性的调查不宜用全面调查;(2)抽样调查 定义:只抽取一部分对象进行调查,然后根据调查数据来推断全体对象的情况,这种方法是抽样调查。 总体:要考察的全体对象叫做总体; 个体:组成总体的每一个考察对象叫做个体; 样本:从总体中抽取的那一部分个体叫做样本。 样本容量:样本中个体的数目叫做样本容量(样本容量没有单位); 特点:省时省钱,调查对象涉及面广,容易受客观条件的限制,结果往往不如全面调查准确,且样本选取不当,会增大估计总体的误差。 性质:具有代表性与广泛性,即样本的选取要恰当,样本容量越大,越能较好地反映总体的情况。(代表性:总体是由有明显差异的几个部分组成时,每一个部分都应该按照一定的比例抽取到) (3)实际调查中常常采用抽样调查的方法获取数据,抽样调查的要什么? ①总体中每个个体都有相等的机会被抽到;②样本容量要适当. 例2、〔1〕判断下面的调查属于哪一种方式的调查。 ①为了了解七年级(22班)学生的视力情况(全面调查) ②我国第六次人口普查(全面调查) ③为了了解全国农民的收支情况(抽样调查) ④灯泡厂为了掌握一批灯泡的使用寿命情况(抽样调查) 〔2〕下面的调查适合用全面调查方式的是 . ①调查七年级十班学生的视力情况;②调查全国农民的年收入状况; ③调查一批刚出厂的灯泡的寿命;④调查各省市感染禽流感的病例。 〔3〕为了了解某七年级2000名学生的身高,从中抽取500名学生进行测量,对这个问题,下面的说确的是〔〕 A、2000名学生是总体 B、每个学生是个体 C、抽取的500名学生是样本 D、样本容量是500〔4〕请指出下列哪些抽查的样本缺少代表性: ①在大学生中调查我国青年的上网情况; ②从具有不同文化层次的市民中,调查市民的法治意识; ③抽查电信部门的家属,了解市民对电信服务的满意程度。 Ⅱ、数据的整理1、表格整理2、划记法

数据分析的中国样本

数据分析的中国样本 业内一致认为,今年是大数据元年,渡过了概念的普及阶段,大数据真正进入实际应用阶段,数据分析、数据挖掘的重要性逐渐被认识。 IBM日前宣布了在华的大数据战略,并表示,目前已经构建了完整的大数据价值体系。对于大数据这个未来重要战略的业务。IBM预测,到2015年大数据分析方面的收入将有望达到160亿美元,而每年在相关领域的研发投入达30至40亿美元。 国外有早先的klout、splunk等公司,也有刚刚获得60万美元种子轮融资的文字分析引擎Synapsify。 文字数据分析系统Synapsify可以帮助用户快速的去分析文本内容。 Synapsify有着非常广泛的应用领域,网站可以借助Synapsify这个分析系统来提供内容质量,而出版商可以用Synapsify来评估市场,政府还可以用Synapsify来进行网络舆情监控。 参与此次融资的有ICG ventures,Fortify Venmres 和Middleland Capital。 最近几个月各类数据分析公司的估值一直在飙升,而自从去年起人们开始逐渐发现付费数据分析的价值所在。

阿里巴巴的前瞻性投资 阿里巴巴向金融领域的扩张终于迈出了一大步。 经过一系列调整,在多个领域摆出扩张的姿态,例如近期成立小微金融集团,为商家和用户提供支付、小贷、担保及保险业务。 其中,最为人传道的是被金融届人士称为“虚拟信用卡”的“信用支付”,它是阿里巴巴面对网上个人买家的个人消费金融信贷服务产品,将在今年4月由阿里金融正式推向市场,首先在湖南、浙江两地试点。 一些银行界人士由此担心,由于阿里巴巴集团拥有的庞大客户群和宝贵的数据库。阿里“虚拟信用卡”可能构成对银行信用卡的竞争,对传统银行造成一定冲击。 对此,阿里巴巴回应称,“阿里的小微金融业务仍只是在现行金融机制框架内对银行业的一个补充。”阿里金融真正的利益诉求并非金融业务,而是面向金融业务的数据服务。 按照阿里金融设计的“信用支付”商业模式。通过数据来确定买家信用支付额度,合作银行通过支付宝来授信,阿里巴巴成立的商诚担保公司将为买家的“信用支付”做担保,买家在手机支付时可使用自己的“信用支付”额度购物,合作银行把钱支付给卖家。支付宝从合作商家那里抽取1%的“信用支付”服务费。

数据整理分析方法

数据梳理主要是指对数据的结构、内容和关系进行分析 大多数公司都存在数据问题。主要表现在数据难于管理,对于数据对象、关系、流程等难于控制。其次是数据的不一致性,数据异常、丢失、重复等,以及存在不符合业务规则的数据、孤立的数据等。 1数据结构分析 1元数据检验 元数据用于描述表格或者表格栏中的数据。数据梳理方法是对数据进行扫描并推断出相同的信息类型。 2模式匹配 一般情况下,模式匹配可确定字段中的数据值是否有预期的格式。 3基本统计 元数据分析、模式分析和基本统计是数据结构分析的主要方法,用来指示数据文件中潜在的结构问题。 2 数据分析 数据分析用于指示业务规则和数据的完整性。在分析了整个的数据表或数据栏之后,需要仔细地查看每个单独的数据元素。结构分析可以在公司数据中进行大范围扫描,并指出需要进一步研究的问题区域;数据分析可以更深入地确定哪些数据不精确、不完整和不清楚。 1标准化分析 2频率分布和外延分析 频率分布技术可以减少数据分析的工作量。这项技巧重点关注所要进一步调查的数据,辨别出不正确的数据值,还可以通过钻取技术做出更深层次的判断。 外延分析也可以帮助你查明问题数据。频率统计方法根据数据表现形式寻找数据的关联关系,而外延分析则是为检查出那些明显的不同于其它数据值的少量数据。外延分析可指示出一组数据的最高和最低的值。这一方法对于数值和字符数据都是非常实用的。 3业务规则的确认 3 数据关联分析 专业的流程模板和海量共享的流程图:[1] - 价值链图(EVC) - 常规流程图(Flowchart) - 事件过程链图(EPC) - 标准建模语言(UML) - BPMN2.0图 数据挖掘 数据挖掘又称数据库中的知识发现,是目前人工智能和数据库领域研究的热点问题, 所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程 利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同的角度对数据进行挖掘。 ①分类。分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为

第4章 样本与数据的分析初步

4.1 抽样 〖教学目标〗 ◆1、知识与技能目标: 通过丰富的实例,感受抽样的必要性,了解总体、个体、样本等概念,体会不同的抽样可能得到不同的结果。 ◆2、过程与方法目标: 从一个学生比较熟悉的调查问题提出抽样的概念,并通过“做一做”及“合作学习”让学生进一步体验抽样的必要性,另一方面也是让学生从中去体验抽样中会遇到的问题和基本要求,并根据要求编制简单的柚样方案。 ◆3、情感与态度目标: 从学生的生活实际提出问题,既体现知识的学习过程,又体现知识的应用过程,同时还有利于激发学生的学习兴趣,有利于学生养成关注身边的事例、关注社会问题,培养一种社会的责任感。 〖教学重点与难点〗 ◆教学重点:抽样的概念和抽样的必要性。. ◆教学难点:本节中的“合作学习”情景比较复杂,学生缺乏抽样的经验是本节教学的难点。 〖教学方法和手段〗 基于本节课内容的特点和八年级学生的心理及思维发展的特征,在教学中选择演示法、讨论法和总结法相结合。与学生建立平等融洽的互动关系,营造合作交流的学习氛围。在演示、引导学生进行观察、分析、抽象概括、练习巩固各个环节中运用多媒体进行演示,增强直观性,提高教学效率,激发学生的学习兴趣。 〖教学过程〗 (一)创设情境,引入新知。 1.提出问题 随着人们生活水平的提高,电视、电脑的普及,中小学生的视力普遍下降,专家呼吁要保护学生的视力。 此时,教师安排活动一: (1) 调查我们班级近视的学生有多少人? (2) 调查我们学校近视的学生又有多少人? 这个问题,只有同学准确地统计自己班级和全校各班近视的学生。就可以解决上面两个问题。 教师指出,像这样为一定目的而全面的凋查叫做普查。例如人口普查; 为引出抽样的概念,此时,教师安排活动二: 想一想:要了解全国初中生的视力情况,有人设计了下三种调查方法: (1)对全国所有的初中生进行视力测试。 (2)对某一所著名中学的初中生进行视力测试。 (3)在全国按东、西、南、北、中分片,每个区域各抽3所中学,对这15所中学的

实验现象和实验数据的搜集整理与分析

实验现象和实验数据的搜集整理与分析 一.问题阐述 实验现象和数据是定量实验结果的主要表现形式,亦是定量研究结果的主要证据。数据对于实验教学来讲,有着重要的意义和价值。然而在我们的教学中,不尊重事实,漠视实验数据的现象仍经常出现,具体分析,在小学科学实验数据教学中主要存在以下一些问题: (一)数据收集存在的问题 1.数据收集不真实 如《摆的研究》一课教学中,由于测量的次数多,时间紧,而测同一摆重或同一摆长前后时间又几近相同,于是有小组就根据前面的实验数据,推测了后面的数据。又如教学《热是怎样传递的》一课时,有一小组的火柴掉下来的顺序明明不是有规律地从左往右,但听到其他小组火柴都是从左往右有顺序地掉下来,于是他们也修改了自己的数据。 2.数据收集不准确 如教学《水和食用油的比较》一课时,教师引导学生把水和食用油分别装入相同的试管中来比较,结果教学中却出现了相反的现象——装油的试管比装水的试管还要重,原来是装水的试管壁薄,装油的试管壁厚,实验准备时教师并没有发现这个现象,结果出现了上述问题。 3.数据收集不全面 教师在收集数据过程中,各小组虽然都做了同一个实验,但教师只挑选1-2个组的实验表进行展示汇报,而其他组的实验数据一概不论,就草草作结论,这样的实验过程和结果很难说服所有人,也很容易出错。 (二)数据整理存在的问题 1.整理方式简单 课堂上教师比较重视设计小组或个人填写的实验数据表格,但对全班汇总的实验数据形式容易忽视,呈现方式比较简单。在数据呈现时,要么逐一呈现小组原始记录单,要么按小组顺序呈现数据,平时更少使用统计图来整理。黑板上数据显得杂乱无章,不易发现其中的规律。 2.数据取舍不清

《数据收集整理》教材分析与重难点突破(第1课时)

《数据收集整理》教材分析与重难点突破 重难点: 本节课教学的重点是用调查法收集整理数据,难点是用调查法收集整理数据的过程 突破建议: 1.挖掘情境内涵,理解“选择校服”的本质。 教学这部分内容时,教师首先要创设定校服的情境, 在叙述情境的过程中出示例1红、黄、蓝、白四种颜色,然后提问“选哪种颜色合适?”回答这个问题时,要让学生充分进入情境,真正参与进来。 首先让学生自己观察、思考、交流。在交流中可能大部分学生会选自己喜欢的颜色,因此五花八门。 然后教师要注意引导学生:刚才同学们是针对自己喜欢的颜色来确定校服的。谁来说一说什么是校服?从而引发学生思考、讨论。 最后使学生明确校服的颜色不是以个人的观点为主的,它需要统筹大家的意见。使学生明白,最合理的是选择大部分同学都喜欢的颜色。到底是什么颜色呢?这就需要确定4种颜色中哪种颜色是大多数学生最喜欢的,引出用统计解决问题的方法,即体现了统计的必要,也体现了统计的作用与价值,同时引发下个研讨内容。 2.抓住问题冲突,引出收集信息的方法。 本课解决问题的方法是抽样调查法,调查法是学生首次运用,学生没有这部分知识经验。因此在教学时先通过小组研讨制定解决问题的方案,然后通过全班交流,教师适时的引导从而制定好调查计划。

从研讨到制定计划这一环节中教师要注意倾听学生的发言,能够在顺应学生思维的前提下,顺思导学,引导学生总结解决问题的方法即调查法。 比如:当学生知道校服的颜色不是以个人的观点为主的,它需要统筹大家的意见后,引发学生思考:如何来听取大家的意见呢? 学生的意见可能很多,预设到的答案可能是: (1)在学门口挨个询问?对此学生会反驳太麻烦了,全校人数太多,一天也问不完。 (2)打电话询问。 (3)听老师的。 当学生出现这样的问题时,教师不要立刻给出答案。而是把多种方法都呈现给孩子,让他们针对这些方法进行讨论,指出不足及修改的方案。在这样的前提下,教师抓住学生的一些有用信息进行引导,全校人数太多不好操作,我们可以划分成班级来统计,然后根据众多班级同学的想法来确定校服颜色。这样抽样调查的名词学生不会说出,但是他们会用自己的语言来描述即先调查人数少的同学的意见,在慢慢到人数多同学的意见,从而把这种方法具体的形象的让学生理解。 3.优化调查方式,便于统计。 在学生懂得调查本班同学的意见后,思考用什么方式来记录哪种颜色的人数呢?一般的方法举手、起立、投票等。让学生充分地想、说。可以引导学生多说几种方式,使其体会到调查方式的多样化。在

样本与数据的分析初步

抽样 〖教学目标〗 ◆1、知识与技能目标: 通过丰富的实例,感受抽样的必要性,了解总体、个体、样本等概念,体会不同的抽样可能得到不同的结果。 ◆2、过程与方法目标: 从一个学生比较熟悉的调查问题提出抽样的概念,并通过“做一做”及“合作学习”让学生进一步体验抽样的必要性,另一方面也是让学生从中去体验抽样中会遇到的问题和基本要求,并根据要求编制简单的柚样方案。 ◆3、情感与态度目标: 从学生的生活实际提出问题,既体现知识的学习过程,又体现知识的应用过程,同时还有利于激发学生的学习兴趣,有利于学生养成关注身边的事例、关注社会问题,培养一种社会的责任感。 〖教学重点与难点〗 ◆教学重点:抽样的概念和抽样的必要性。. ◆教学难点:本节中的“合作学习”情景比较复杂,学生缺乏抽样的经验是本节教学的难点。 〖教学方法和手段〗 基于本节课内容的特点和八年级学生的心理及思维发展的特征,在教学中选择演示法、讨论法和总结法相结合。与学生建立平等融洽的互动关系,营造合作交流的学习氛围。在演示、引导学生进行观察、分析、抽象概括、练习巩固各个环节中运用多媒体进行演示,增强直观性,提高教学效率,激发学生的学习兴趣。 〖教学过程〗 (一)创设情境,引入新知。 1.提出问题 随着人们生活水平的提高,电视、电脑的普及,中小学生的视力普遍下降,专家呼吁要保护学生的视力。 此时,教师安排活动一: (1) 调查我们班级近视的学生有多少人? (2) 调查我们学校近视的学生又有多少人? 这个问题,只有同学准确地统计自己班级和全校各班近视的学生。就可以解决上面两个问题。 教师指出,像这样为一定目的而全面的凋查叫做普查。例如人口普查; 为引出抽样的概念,此时,教师安排活动二: 想一想:要了解全国初中生的视力情况,有人设计了下三种调查方法: (1)对全国所有的初中生进行视力测试。 (2)对某一所著名中学的初中生进行视力测试。 (3)在全国按东、西、南、北、中分片,每个区域各抽3所中学,对这15所中学的全部初中进行视力测试。

16种常用数据分析方法66337

一、描述统计 描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。 1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率回归法、决策树法。 2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W检验、动差法。 二、假设检验 1、参数检验 参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验。 1)U验使用条件:当样本含量n较大时,样本值符合正态分布 2)T检验使用条件:当样本含量n较小时,样本值符合正态分布 A 单样本t检验:推断该样本来自的总体均数μ与已知的某一总体均数μ0 (常为理论值或标准值)有无差别; B 配对样本t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面扱为相似; C 两独立样本t检验:无法找到在各方面极为相似的两样本作配对比较时使用。 2、非参数检验 非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。 适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的。

A 虽然是连续数据,但总体分布形态未知或者非正态; B 体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下; 主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。 三、信度分析 检査测量的可信度,例如调查问卷的真实性。 分类: 1、外在信度:不同时间测量时量表的一致性程度,常用方法重测信度 2、内在信度;每个量表是否测量到单一的概念,同时组成两表的内在体项一致性如 何,常用方法分半信度。 四、列联表分析 用于分析离散变量或定型变量之间是否存在相关。 对于二维表,可进行卡方检验,对于三维表,可作Mentel-Hanszel分层分析。列联表分析还包括配对计数资料的卡方检验、行列均为顺序变量的相关检验。 五、相关分析 研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。 1、单相关:两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量; 2、复相关:三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变量和因变量相关; 3、偏相关:在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量之间的相关关系称为偏相关。 六、方差分析

《数据的整理和分析》教学设计

《数据的整理和分析》教学设计 学习目标 1、会用画图的方法整理和表示数据,并进行简单的分析。 2、让学生体验数据整理和分析的过程,进一步了解统计的意义和作用。 3、通过教学培养学生的实践能力、合作精神和创新精神。 学习重点 使学生能根据统计表中的数据绘制较简单的点线统计图,并能够进行简单的分析。 学习难点 使学生能根据统计表中的数据绘制较简单的点线统计图,并能够进行简单的分析 教学准备 师:课件、作业纸,电脑安装好授课助手。 生:记好自己身高、睡眠时间等信息。 教学过程 一、创设情境,导入新课。 师:上星期老师陪同一位同学到南昌参加机器人竞赛。这是我们从南丰到南昌的动车票。(课件出示两张火车票)你发现这两张票有什么不同吗?标有“孩网折”的票就是儿童票比另一张成人票便宜不少。那儿童票的购买有什么要求呢?课件出示:我国铁道部规定身高在120—150厘米的小朋友就可以买儿童票。

师:大家想不想去南昌参加机器人比赛?(想)那就请大家积极参加学校培训,争取明年去参赛。现在我们就一起来看看我们班上有多少同学可以买儿童票。(板书课题:快乐成长) 二、师生互动,探究新知。 师:这是我们班同学的身高数据统计表。观察这个统计表,你能快速地告诉我身高是135的同学共有多少吗?140的呢?(稍等一会,指名回答)生1:……生2:……生2:…… (由于时间短,可能部分同学不能说出,可能说出不同的答案。)师:看来大家不能很快地准确看出答案。我们有没有什么更好的方法呢?生:…… 师:很好,请你采用这种画图的方法以第一组同学的身高数据为大家演示一下吧!(如果学生没说到老师直接说,老师有一种画图的方法,想不想一起来体验一下?)老师或同学演示时强调表示了的数据统计表上要作好记号。并对下总数。 师:这里我们是用画“×”来表示,你还有其它表示方法吗? 生:…… 师:能用其中一种符号继续表示全班同学的身高情况吗?(能)那就开始吧!看看谁画得又快又好。画完之后要和统计表对一下总数是否一样。确认没错的同学用你端正的坐姿告诉老师。 学生边画,老师巡视,发现问题及时指导。有代表性的拍照,大家完成后进行展示。 师:好,看来大家都完成了,老师这里收集了几位同学画的,我

浙教版八上第四章《样本与数据分析初步》测试卷

第四章《样本与数据分析初步》测试卷 班级姓名 一、选择题:(每题4分,共32分) 1、2,3,4,x,5,这五个数的平均数是4,则x=() A 4 B 5 C 6 D 7 2、A居民区的月底统计用电情况,其中3户用电45度,5户用电50度,6户用 电42度,则平均用电()度 A 41 B 42 C 45.5 D 46 3、10名初中毕业生的体育考试成绩如下: 25,26,26,27,26,30,29,26,28,29。这成绩的中位数是() A 30 B 26.5 C 26 D 25 4、上题这组体育成绩的众数是() A 25 B 26 C 27 D 29 5、某校要了解八年级女生的体重,以掌握她们的身体发育情况,从八年级500 名女生中抽出50名进行检测,就这个问题来说,下面说法中正确的是() A 500名女生是总体 B 500名女生是个体 C 500名女生是总体的一个样本 D 50是样本容量 6、甲、乙两人射靶,他们命中环数的平均数相等,但方差不同,S2甲=2.5,S2乙 =1.8,则射击较稳定的是() A 甲 B 乙 C 甲乙一样稳定 D 无法确定 7、一组数据x1,x2,x3,x4,x5的平均数是x,另一组数据2x1+5,2x2+5,2x3+5, 2x4+5,2x5+5的平均数是() A x B 2x C 2x+5 D10x+25 8、已知某5个数的和是a,另6个数的和是b,则这11个数的平均数是()

A B C D 二、填空题:(每题4分,共28分) 9、某班10名学生为支援“希望工程”,将平时积攒的零花钱捐献给贫困地区的 失学儿童,每捐款金额如下(单位:元): 10,12,13.5,40.8,19.3,20.8,25,16,30。这10名同学平均捐款元。 10、某食品店购进2000箱苹果,从中抽取10箱,称得重量分别为(单位:千克) 16,16.5,14.5,13.5,15,16.5,15.5,14,14,14.5。若每千克苹果售价为2.8元,则利用样本平均数值估计这批苹果的销售额是元。 11、已知一个样本:1,2,3,4,5,那么这个样本的标准差是。 12、已知n个数据的和为128,他的平均数为16,则n= 。 13、某校举行演讲比赛,六名评委对某位选手打分如下:77,82,78,99,85, 68。去掉一个最高分和一个最低分后的平均分是分。 14、某公司员工的月工资如下:580,650,880,900,1200,650,730,810 问:(1)公司所有员工的平均工资是; (2)所有员工工资的中位数是; (3)所有员工工资的众数是; (4)用平均数还是中位数或是众数描述该公司员工工资的一般水平比较恰当,答。 15、小明骑自行车的速度是15千米/时,步行的速度是5千米/时。若小明先骑自 行车1小时,然后又步行2小时,那么他的平均速度是。 三、解答题:(6/+6/+6/+6/+8/+8/) 16、某超市招聘收银员一名,对三名申请人进行了三次素质测试,下面是三名后

(整理)数据整理与数据分析

实验1 数据整理与数据分析 1.1 数据整理 一、实验目的和要求: 能熟练的进行统计数据的录入、分组、汇总及各种常用统计图表的绘制。 二、实验内容: 1、数据的录入 2、数据的排序 3、数据的分组 4、数据透视分析 5、常用统计图表的绘制 三、统计函数 频数分布函数(FREQUENCY)的语法形式为: FREQUENCY(data_array,bins_array) 其中:Data_array为用来编制频数分布的数据,Bins_array为频数或次数的接收区间。 四、实验步骤: 1、数据的录入 数据的录入是指把调查得到的结果输入到一张叫数据清单的EXCEL工作表中。数据清单是指包含相关数据的一系列工作表的数据行,如发货单数据库,或一组客户名称和联系电话。数据清单可以作为数据库使用,其中行表示记录,列表示字段。 例某集团公司欲在某地区投资于医疗卫生事业,为了减少风险,获得利润,该集团企划部门决定先了解一下市场潜力。企划部王经理随机访问了该地区几家医院中就医的36名患者,询问其等候看病的时间,根据这些数据,王经理会得到什么信息呢?打开EXCEL工作表,在列中输入数据的名称,称为变量。然后依次输入相应调查数据。 2、数据的排序 ①打开“数据整理.xls” 工作簿,选定“等候时间”工作表。 ②利用鼠标选定单元格A1:B37区域 ③在菜单中选择“数据”中的“排序”选项,则弹出排序对话框。 ④在排序对话框窗口中,选择“主要关键字”列表中的“等候时间”作为排序关键字,并选择按“递增”排序。由于所选取数据中已经包含标题,所以在“当前数据清单”中选择“有标题行”,然后单击“确定”按钮,即可得到排序的结果。 在数据清单中使用分类汇总的方法如下: 先选择需要分类汇总的数据区域A1:B37,然后选择“数据”菜单中的“分类汇总”选项,则打开“分类汇总”对话框。在“分类字段”的下拉式列表中选择要进行分类的列标题,在“汇总方式”的下拉式列表中选择行汇总的方式,本例中选择按“等候时间”进行分类,

数据处理与分析教案

授课教案 班级:17计1班课程:office2010 授课教师:黄媚

教学过程设计 教学环节及 时间分配 教学内容师生活动设计意图导入新课 ( 3分钟) 讲授新课 ( 20分 钟) 通过一个与该节相同的例子观看, 导入本次新课。 第七章电子表格中的数据处理 7、2 数据处理与分析 7.2.1 数据的查找与替换 1、数据查找 单击任意单元格-开始-【编辑】组-查 找和替换-查找-在“查找和替换”的对 话框输入查找内容-选择“查找全部” 2、数据替换 单击任意单元格-开始-【编辑】组-查 找和替换-替换-在“查找和替换”的“替 换”对话框输入查找内容和替换内容- 选择“全部替换” 教师示范操作 学生认真听课并回 答教师提出的问 题。 当堂的师生互动 能让学生更能加 深对操作步骤的 印象,对其中运用 到的按钮印象更 深刻

序 选 7.2.2 数据排序 1、使用排序按钮快速排序 开始-【编辑】组-排序和筛选 表示数据按递增顺序排列,使最小值位于列的顶端 表示数据按递减顺序排列,使最大值位于列的顶端 2、使用“排序”对话框进行排序 选择需要排序的单元格-数据-【排序和筛选】组-排序-确定 列——选择要排序的列 排序依据——选择排序类型 次序——选择排序方式 数据包含标题——排序时保留字段名称 通过学生自主练习,提高学生动手操作能力。

7.2.3 数据筛选 1、自动筛选 按值列表、按格式、按条件 选择所需单元格-数据-【排序和筛选】组- “筛选”下拉按钮-选择所需值-确定 2、自定义筛选 选择所需的单元格区域或表-数据-【排序和筛选】组-筛选

2018年中考数学专题《数据的整理与分析》复习试卷含答案解析

2018年中考数学专题复习卷: 数据的整理与分析 一、选择题 1.一组数据2,1,2,5,3,2的众数是() A. 1 B. 2 C. 3 D. 5 【答案】B 【解析】:“2”出现3次,出现次数最多,∴众数是2.故答案为:B. 【分析】一组数据中出现次数最多的数据是众数.这组数据中一共有6个数,数据“2”出现次数最多. 2.为调查某大型企业员工对企业的满意程度,以下样本最具代表性的是() A. 企业男员工 B. 企业年满50岁及以上的员工 C. 用企业人员名册,随机抽取三分之一的员工 D. 企业新进员工 【答案】C 【解析】A、调查对象只涉及到男性员工,选取的样本不具有代表性质; B、调查对象只涉及到即将退休的员工,选取的样本不具有代表性质; C、用企业人员名册,随机抽取三分之一的员工,选取的样本具有代表性; D调查对象只涉及到新进员工,选取的样本不具有代表性, 故答案为:C. 【分析】为调查某大型企业员工对企业的满意程度,那么做抽样调查的对象必须具有代表性而且调查对象的数量必须要达到一定的量,一个企业的所有员工中,它是包括男女老少,故可得出最具代表性样本。 3.若一组数据3、4、5、x、6、7的平均数是5,则x的值是()。 A.4 B.5 C.6 D.7 【答案】B 【解析】:∵一组数据3、4、5、x、6、7的平均数是5,∴3+4+5+x+6+7=6×5, ∴x=5. 故答案为:B. 【分析】根据平均数的定义和公式即可得出答案. 4.下列说法正确的是()

A. 了解“孝感市初中生每天课外阅读书籍时间的情况”最适合的调查方式是全面调查 B. 甲乙两人跳 绳各10次,其成绩的平均数相等,,则甲的成绩比乙稳定 C. 三张分别画有菱形,等边三角形,圆的卡片,从中随机抽取一张,恰好抽到中心对称图形卡片的概率 是 D. “任意画一个三角形,其内角和是”这一事件是不可能事件 【答案】D 【解析】:A、了解“孝感市初中生每天课外阅读书籍时间的情况”最适合的调查方式是抽样调查,不符合题意; B、甲乙两人跳绳各10次,其成绩的平均数相等,S甲2>S乙2,则乙的成绩比甲稳定,不符合题意; C、三张分别画有菱形,等边三角形,圆的卡片,从中随机抽取一张,恰好抽到中心对称图形卡片的概率 是,不符合题意; D、“任意画一个三角形,其内角和是360°”这一事件是不可能事件,符合题意. 故答案为:D. 【分析】根据全面调查及抽样调查适用的条件;根据方差越大数据的波动越大;根据中心对称图形,轴对称图形的概念,三角形的内角和;一一判断即可。 5.如果一组数据6、7、x、9、5的平均数是2x,那么这组数据的方差为() A. 4 B. 3 C. 2 D. 1 【答案】A 【解析】:根据题意,得:=2x 解得:x=3, 则这组数据为6、7、3、9、5,其平均数是6, 所以这组数据的方差为 [(6﹣6)2+(7﹣6)2+(3﹣6)2+(9﹣6)2+(5﹣6)2]=4, 故答案为:A. 【分析】根据这组数据的平均数,列出方程,求解得出x的值,进而得出这组数据的平均数,再根据方差公式即可得出这组数据的方差。 6.为了了解内江市2018年中考数学学科各分数段成绩分布情况,从中抽取400名考生的中考数学成绩进行统计分析在这个问题中,样本是指() A.400 B.被抽取的400名考生 C.被抽取的400名考生的中考数学成绩 D.内江市2018年中考数学成绩

数据的收集、整理、描述与分析

数据的收集、整理与描述——备课人:李发 【问题】统计调查的一般过程是什么?统计调查对我们有什么帮助?统计调查一般包括收集数据、整理数据、描述数据和分析数据等过程;可以帮助我们更好地了解周围世界,对未知的事物作出合理的推断和预测. 一、数据处理的一般程序 二、回顾与思考 Ⅰ、数据的收集 1、收集数据的方法(在收集数据时,为了方便统计,可以用字母表示调查的各种类型。) ①问卷调查法:为了获得某个总体的信息,找出与该信息有关的因素,而编制的一些带有问题的问卷调查。 ②媒体调查法:如利用报纸、电话、电视、网络等媒体进行调查。 ③民意调查法:如投票选举。 ④实地调查法:如现场进行观察、收集和统计数据。 例1、调查下列问题,选择哪种方法比较恰当。 ①班里谁最适合当班长()②正在播出的某电视节目收视率() ③本班同学早上的起床时间()④黄河某段水域的水污染情况() 2、收集数据的一般步骤: ①明确调查的问题;——谁当班长最合适 ②确定调查对象;——全班同学 ③选择调查方法;——采用民主推荐的调查方法 ④展开调查;——每位同学将自己心目中认为最合适的写在纸上,投入推荐箱 ⑤统计整理调查结果;——由一位同学唱票,另一位同学记票(划正字),第三位同学在旁边监督。 ⑥分析数据的记录结果,作出合理的判断和决策; 3、收集数据的调查方式 (1)全面调查 定义:考察全体对象的调查叫做全面调查。 全面调查的常见方法:①问卷调查法;②访问调查法;③电话调查法; 特点:收集到的数据全面、准确,但花费多、耗时长、而且某些具有破坏性的调查不宜用全面调查; (2)抽样调查 定义:只抽取一部分对象进行调查,然后根据调查数据来推断全体对象的情况,这种方法是抽样调查。 总体:要考察的全体对象叫做总体; 个体:组成总体的每一个考察对象叫做个体; 样本:从总体中抽取的那一部分个体叫做样本。 样本容量:样本中个体的数目叫做样本容量(样本容量没有单位); 特点:省时省钱,调查对象涉及面广,容易受客观条件的限制,结果往往不如全面调查准确,且样本选取不当,会增大估计总体的误差。 性质:具有代表性与广泛性,即样本的选取要恰当,样本容量越大,越能较好地反映总体的情况。(代表性:

数据的整理与分析

第一单元数据收集整理 教材分析:本单元学生主要学习一些简单的统计图表知识,初步体验数据的收集、整理、描述和分析的过程,学会用简单的方法收集和整理数据,掌握统计数据的记录方法,并能根据统计图表的数据提出并回答简单的问题,使学生了解统计的意义和作用,初步了解统计的基本思想方法,认识统计的作用和意义,逐步形成统计观念,进而养成尊重事实、用数据说话的态度。 学情分析:上学期学生已经学习了比较、分类,能正确地进行计数,所以填写统计表时不会感到太困难,其关键在于引导学生学会收集信息,整理数据,根据统计表解决问题。学生在生活中积累了较多的生活经验,能利用统计图表中的数据作出简单的分析,能和同伴交流自己的想法,体会统计的作用。本单元教材选择了与学生生活密切联系的生活场景,激发了学生的学习兴趣。如,学生的校服、讲故事比赛、春游的人数情况统计等,同时渗透一些生活基本常识,使学生明确统计的知识是为生活服务的。教学内容更加注重对统计数据的初步分析。在教学时,教师要注意让学生经历统计活动的全过程,要鼓励学生参与到活动之中,在活动中不断培养动手实践能力和独立思考能力,并加强与同伴的合作与交流。 教学目标知识技能: 使学生经历数据的收集、整理、描述和分析的过程,能利用统计表的数据提出问题并回答问题。数学思考:了解统计的意义,学会用简单的方法收集和整理数据。问题解决:能根据统计图表中的数据提出并回答简单的问题,并能够进行简单的分析。情感态度:通过对周围现实生活中有关事例的调查,激发学生的学习兴趣,培养学生的合作意识和创新精神。

教学重点:使学生初步认识简单的统计过程,能根据统计表中的数据提出问题、回答问题,同时能够进行简单的分析。教学难点:使学生亲历统计的过程,在统计中发展数学思考,提高学生解决问题的能力。 课时安排:3课时 1.数据收集整理………………………………2课时 2.练习一………………………………………1课时 数据收集整理 教学目标: 1.体验数据收集、整理、描述和分析的过程,了解统计的意义。 2.能根据统计表中的数据提出并回答简单的问题,同时能够进行简单的分析。根据统计表的数据提出有价值的数学问题及解决策略。 教学重点、难点: 1.重点:使学生初步认识简单的统计过程,能根据统计表中的数据提出问题、回答问题,同时能够进行简单的分析。 2.难点:引导学生通过合作讨论找到切实可行的解决统计问题的方法。 教学准备:多谋体课件、表格 教学课时: 1课时 教学过程: 一、情境引入 教师引导提问:同学们,你们入学都要穿上我们学校的校服,你们喜欢我们校服的颜色吗?(指名3~5个学生说一说)。师:有的同学喜欢这个颜色,有的同学不喜欢,如果我们学校要给一年级的新生订做校服,

中考专题-数据的整理与分析-含答案

数据的整理与分析 1. (2019重庆江北区模拟)距离中考体考时间越来越近,某校想了解初三年级1500名学生跳绳情况,从中随机抽查了20名男生和20名女生的跳绳成绩,收集到了以下数据: 男生:192,166,189,186,184,182,178,177,174,170, 188,168,205,165,158,150,188,172,180,188, 女生:186,198,162,192,188,186,185,184,180,180, 186,193,178,175,172,166,155,183,187,184, 根据统计数据制作了如下统计表: 两组数据的极差、平均数、中位数、众数如下表: (1)请将上面两个表格补充完整: a=________,b=________,c=________; (2)请根据抽样调查的数据估计初三年级学生中考跳绳成绩能得满分(185个及以上)的同学大约能有多少人? (3)体育组的江老师看了表格数据后认为初三年级的女生跳绳成绩比男生好,请你结合统计数据,写出支持江老师观点的理由.

2.(2019重庆沙坪坝区模拟)为践行习总书记提出的“绿水青山就是金山银山”重要思想,我市举办了“重庆市第五届生态文明知识竞赛”.某校从七、八年级中各随机抽取20名同学的竞赛成绩(百分制)进行整理分析(成绩得分用x表示,共分成五组:A. 75≤x<80,B. 80≤x<85,C. 85≤x<90,D. 90≤x<95,E. 95≤x≤100),绘制了如下不完整的统计图表: 七年级成绩频数分布直方图 第2题图 注:七年级D组中的成绩分别是:90,92, 92,94. 根据以上信息,解答下列问题: (1)补全频数分布直方图,并写出上表中a,b的值:a=________,b=________; (2)七年级小明的成绩为93分,八年级小白的成绩为95分,哪位同学的成绩在各自年级抽取的同学中排名更靠前,请说明理由; (3)七年级共有400人,估计该年级此次竞赛成绩高于平均分91分的有多少人? 3.(2019重庆三校一诊)某中学初三年级积极推进走班制教学.为了了解一段时间以来,“至善班”的

(整理)数据分析总结

回归分析 1线性回归模型: Y 为随机变量(可观测),受p-1个因素X1,X2,…X p-1的影响。随机误差ε的均值为0,方差δ2>0(即正态分布ε~N(0,δ2)),不可观测。 Y=Xβ+ε X为设计矩阵,且rank(X)=p;ε为误差项。 前提条件:ε的平方和尽量小:∑εi2=εTε=(Y-Xβ)T(Y-Xβ)偏导为0。 求得正规方程X T Xβ=X T Y 得到β的最小二乘估计值β^=(X T X)-1X T Y,易知E(β^)=β 拟合值Y^=Xβ^ 残差向量e=Y-Y^=(I-H)Y 标准化残差(在0-1间取值)e i/ 残差平方和e T e=εT(I-H) ε期望E(e T e)=δ2(n-p) δ2的无偏估计δ^2= e T e/(n-p) 2线性回归方程的使用 2.1前提条件: 回归关系的显著性检验: 检验统计量F=MSR/MSE F0≤Fα(p-1,n-p),接受H0;则拒绝H0,认为y与x线性相关。其中α为显著性 水平,可以取0.8. 若检验P值,则P≤0.0001,线性相关。 2.2剔除对y影响小的X i 由Cov(β^)==δ2(X T X)-1 得S(β^)=δ^2(X T X)-1

t=k=0,1,…,p-1 其中为S(β^)在主对角线上的第k个元素的平方和。 若|t0|≤t a/2(n-p),接受H0;否则拒绝,X i有交大影响。其中1-α为置信区间,一般取0.95. 2.3逐步回归法 用于一个个筛选自变量X i,直至得到所有对y有显著影响的X i。因为预报值的方差会随着自变量数目的增加而增大,且计算量大。 偏F检验统计量:F=A为现有自变量x集合 SSR(X k|A)=SSE(A)-SSE(A,X k) 为额外回归平方和,描述了引入一个X k到A中后,SSE 的相对减小量。 步骤: 1)先选取显著性水平αE(选取自变量),αD(剔除自变量)。(默认均为0.15) 2)假设每个X k自成一个A,分别计算它们的 k=1,2,…,P-1 找到最大的F,若F k1>FαE(1,n-1-1),(n后第一个1是A中元素个数)接受自 变量,对应X就是A中的第一个元素。 3)其余p-2个元素在现有A基础上计算) 找到最大值,若F k2>FαE(1,n-2-1),接受自变量。 判断是否剔除X k1: )(即把X k2放入A,看此时加入X k1时。F增大还是减小)。若≤FαD(1,n-2-1),则剔除X k1,否则保留。 4)接下来对其余p-3个元素计算,取最大值比较F k3>FαE(1,n-3-1),判 断是否接受X k3。 分别从A中取出X k1,X k2,计算F(2),判断是否剔除X k1,X k2. 5)软件会自动标准化,转化成P值,可以直接与α比较 主成分分析 1原理 变量间有一定的相关性,即信息有重叠。主成分之间线性无关,没有重叠。原变量重新进行正交分解,分解到各个主成分上。这些主成分就是新的变量,它们互不相关,便于单独

相关文档
相关文档 最新文档