文档库 最新最全的文档下载
当前位置:文档库 › 变量间的相关关系导学案1

变量间的相关关系导学案1

变量间的相关关系、统计案例(学案)B

一、知识梳理:(必修3教材84-93选修1-2,1-19;选修2-3,79-100)

1.散点图:表示具有相关关系的两个变量组成一组数据,将各级数据在平面直角坐标系中描点,这种图形叫散点图。

2.两个变量的线性关系

(1)正相关:在散点图中,点散布在从左下角到右上角的区域,两个变量的这种相关关系称为正相关;

(2)负相关:在散点图中,点散布在从右下角到左上角的区域,两个变量的这种相关关系称为正负相关;

(3)线性相关关系,回归直线

如果散点图中的点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。

3.线性回归方程:

(1)最小二乘法:求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法。

(2)线性回归方程

方程是两个具有线性相关关系的变量的一组数据(x 1,y1),(x2,y2),……,(x n,y n)的线性回归方程,其中b是回归方程斜率,a是截距,计算公式如下:

4.回归分析:

通过散点图直观了解两个相关变量间的关系,然后通过最小二乘法建立回归模型,最后通过分析相关指系数、随机误差评价回归模型的好坏,这就是回归分析的基本思想。如果回归比较好地刻画了两个相关变量的关系,以自变量的某个值,就可以通过回归模型预测相应回归变量的值。

(1)相关系数:统计中用相关系数r来衡量两个变量之间的线性关系的强弱,若相应于变量x的取值x i,变量y的观测值为y i (1),则两个变量的相关系数的计算公式为

r= ,当r时,表明两具变量正相关,当r

时,表明两个变量负相关,r的绝对值越接近1,表明两个变量的相关性越强,当r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系,通常当r的绝对值大于0.75时,认为两个变量有很强的线性相关关系.

(2)随机误差:

①在线性回归模型:y=bx+a+e中,a,b为模型中的未知数,e是y与=bx+a之间的误差,通常e为随机变量,称为随机误差.

②线性回归方程完整表达方式为:,随机误差e的方差越小,通过回归直线=bx+a预报真实值y的精确度越高.

(3)残差分析:

①残差:对于样本点(x1,y1),(x2,y2),……,(x n,y n)而言,它们的随机误差为

=-==--

()残差。

②残差图:作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形为残差图。

③残差平方和:==,称为残差的平方和。

我们可以用残差的平方和衡量回归方程的预报精度;残差平方和越小,模型的拟合效果越好;残差的平方和越大,模型的拟合效果越差。

(4)相关指数:我们也可以用=来刻画回归效果,越小,意味着残差平方和越大,模型的拟合效果越差;越大,意味着残差平方和越小,模型的拟合效果越好,说明解释变量和预报变量的线性相关性越强。

5、独立性检验:

(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量。

(2)列联表:列出两个分类变量的频数表,称为列联表。

(3)2列联表:假设有两个分类变量X和Y,它们的可能取值分别为和,其样本频数列联表称为2列联表。

相关文档
相关文档 最新文档