文档库 最新最全的文档下载
当前位置:文档库 › 第14章 简单回归分析与相关分析

第14章 简单回归分析与相关分析

第14章 簡單迴歸分析與相關分析

A. 一般練習題

14.1 圖書館想知每天使用圖書館的人數(百人)(X )與借出的書本數(百本)

(Y )之間的關係,已知上個月圖書館共開放25天,且得下列資料:

200=∑X ,300=∑Y ,16602=∑X ,36962=∑Y ,2436=∑XY 。

①試求迴歸直線X Y

βα???+=。 ②試檢定「使用圖書館的人愈多,借出的書也愈多」的假設(α=5%)。

③若某一天有300人使用該圖書館,預測當天借出書本數的95%信賴區間。 解

①X =8,Y =12,

β=

-∑-∑XY n X Y

X n X

2

2

=

--==243625812166025836

60

06

2()()().

αβ=-Y X =-=1206872.().,迴歸直線為: ..Y X =+7206 ②因∑∑--∑-=∑-=)(?)(?2

2

2

Y X n XY Y n Y xy y

SSE β

β

=---=[()].[()()].36962514406243625812744

?=

--∑S SSE n X n X

/()

β2

2

2

2=

-=74423

1660256400539

./().

欲檢定:H H 0100:,:ββ≤>,因t t =

-=>=060

005392581714

23005....,.

故知使用圖書館的人愈多,借出的書也愈多。 ③

S SSE n n X X nX e =-?? ???++--∑??????=?? ???++--?

????

?=211374423112538166025642172222().()()

.

Y X |=3的95%信賴區間

=+±?=±=7206321794504501350230025..()..(.,.),.t

預測當天借出的書本數約在450本到1350本之間。

14.2 一唱片公司欲知打歌費用(十萬元)(X )與唱片銷售量(千張)(Y )之間的

關係,乃從其所發行的唱片中隨機抽選了10張,得如下的資料:

28=∑X ,4.3032=∑X ,75=∑Y ,5.5982=∑Y ,237=∑XY 。

①試求迴歸直線X Y

βα???+=。 ②是否打歌費花得愈多,唱片的銷售量就愈高(%5=α)?

③試分別求α與β的95%信賴區間。 ④試求判定係數。 解

① β=-∑-∑XY n X Y X n X 22=--==23710287530341028272250122(.)(.).(.).

αβ=-Y X =-=75012287164..(.).,迴歸直線: ..Y X =+7164012 ②欲檢定H H 0100:,:ββ≤>

SSE y xy Y nY XY n XY =-∑=-∑--∑∑222 () ()ββ

=---=-=[.

(.)].[(.)(.)]..598510750122371028753632432762 S SSE n X n X /().β=--∑=2013522,t t =-=<=012001350891868005....,.。 拒絕虛無假設,打歌費花得愈多,唱片銷售量未必就愈高。

③S X n X X SSE n ()α

=∑-∑?-=2

22

0.743 α的信賴區間=±=±= ..(.,.),. α

α

t S 800257164171354518877 β的信賴區間=±=±=- ..(.,.),. ββt S 80025012031101910431 ④

ββ=?==r S S r S S XY

Y X

XY X Y 012225936903

.//.=

判定係數:r r XY 222

03009===..

14.3 一家庭問題研究機構想知道是否夫妻所受的教育愈高愈不願生孩子,

現隨機抽樣了8對夫妻,計算夫妻所受教育的總年數(X )與孩子數(Y ),得結果如下:

X 19 17 21

18 15 12 14 20 Y 1 3

1

1

2

3

2

1

①試求迴歸直線X Y

βα???+=。 ②證明殘差值相加會等於零。

③試求迴歸方程式的變異數的95%信賴區間。

④試檢定是否夫妻所受的教育愈高愈不願生孩子(%5=α)? 解

①X =17,Y =175.,X 22380=∑,,Y 2

30=∑,XY =∑223。

β

=-∑-∑XY n X Y

X n X

2

2

=

--=-22381717523808170221

2

()(.)

,().

α

β=-Y X =--=1750221175507.(.)().

迴歸直線為: ..Y

X =-55070221

,殘差項之和為零。

③SSE Y Y

e =-=∑∑=( ).22219 變異數的95%信賴區間==(,)(.,.),.,.SSE SSE

χχ600252

60975

20152177

④欲檢定:H H 0100:,:ββ≥<

S SSE n X n X /()./().β=--∑=-=2219623808170073222

t t =

--=-<-=-02210

007330271943

3005....,.

拒絕虛無假設,故知夫妻所受教育愈高愈不願生孩子。

14.4 若要分析豬肉的需求與其價格的關係時,

①請問如何利用回歸分析來分析之?

②承①,若以相關分析來分析,則有何異同? 解

①設Y :豬肉需求量,X 為豬肉價格 建立迴歸模型如下:

Y X =++αβε

搜集(,)Y X 資料,利用OLS 估計迴歸模型,可估計豬肉價格影響豬肉需求量的大小。

②若以相關分析分析豬肉需求量與豬肉價格間之關係,則利用(,)Y X 資料計算相關係數的正負及大小,可知兩者的關係程度。但由相關分析無法得知豬肉價格對豬肉需求量的影響力大小。((參閱課本543~544頁))

14.5 某五星級大飯店的住屋率(%)(X )與每天每間客房的成本(元)(Y )如下

: X

100 75 65 55 50 Y

2000

2500

2800

3200

4000

①試求迴歸直線X Y

βα???+=。 ②試檢定此迴歸直線的斜率是否為零(%5=α)?

③若將Y 的單位換成千元,試求此新的迴歸直線,並檢定其斜率是否

為零(%5=α)? ④若Y 的單位仍為元,但將X 以小數點表示(如75%表為0.75),求此新的迴歸直線,並檢定其斜率是否為零(%5=α)? ⑤比較以上四小題的答案,若將自變數或依變數的單位改變,是否會影響斜率的檢定?

①X =69,Y =2900,,X 2

25375=∑,,Y 244330000=∑,,,XY =∑945500,

β

=-∑-∑XY n X Y

X n X

2

2

=

--=-=-94550056929002537556955000

1570

350318

2()()().

αβ=-Y X =--=29003503186953171942(.)().。

迴歸直線為 ..Y

X =-53171942350318

②欲檢定:H H 0100:,:ββ=≠

計算得

SSE Y Y y x =-=∑-∑=∑-=( ) ..22222280000192674633532537β,

S S S E n X n X

/()

β=

--∑=

22

2

35325373

1570

8660

./,.=

因t t =

--=-<-=-3503180

86604045318230025....,.,故拒絕虛無假設,斜率不為零。

③Y Y Y Y XY XY **

*

/,/,,/,=?==∑∑100010001000。

?==- /,.ββ1

1000003503, /,.αα1100004828== 迴歸直線為:

..*Y

X =-0482******* SSE SSE S S 1100000010000008661

===/,,,/,. ββ t t =--=-<-=-0030530000866

4045318230025....,.,故拒絕虛無假設,斜率

不為零。

X X X X X X X Y XY **

**//,()/,,/=?==∑∑=∑∑1001001000010022?==== ., .ββαα2

210035031853171942。 迴歸直線為:

..*Y

X =-53171942350318 SSE SSE S S 22

100866===, ββ 因t t =

--=-<-=-3503180

866

4045318230025...,.,故拒絕虛無假設,斜率不為零。

⑤當自變數或依變數的單位改變時,斜率的檢定統計量之值不會變,因為其分子與分母的變化會相互抵消掉,故不影響斜率的檢定。

14.6 某人欲知皮鞋的價格(X )與其可穿著的月數(Y )是否有關,根據其三年

來買鞋的經驗得Y 對X 的迴歸直線為:X Y

0138.061.0?+-=,已知52=n ,83.270=X S ,39.4=Y S ,695=X 。

①試求X 與Y 之相關係數與判定係數。 ②試求相關係數的95%信賴區間。

③當800=X ,Y 平均值為何?並求其95%信賴區間。

④當000,1=X ,Y 預期值為何?並求其95%信賴區間。 解

①r S S XY X Y

== .β0851,r r XY 2207242==.。 ②Z r =+-=0510851

10851126

.ln(

..).

Z ρ的信賴區間=±-=±=12615231260280981540025./()..(.,.).Z 11+-ρρ的信賴區間==??(,)(.,.)..

e e 20982154709921758

ρ的信賴區間﹦(0.753,0.912)

③E Y X ()..().==-+=800061001388001043 SSE n S S Y X

=--=()[ ].127048222β S SSE n n X X X Y X

()[()()

].==-+--∑=800

2

2

218000346 E Y X ()=800的信賴區間

=±=±=1043104306789752111080025...(.,.).Z S

④E Y X (,)..(,).==-+=10000610013810001319

S SSE n n X n S e X X

==-++--=1000

2

2

211100012377()[()()].

Y X =1000,的信賴區間

=±=±=1319131946598531178490025...(.,.).Z S

14.7 過去五年內某電腦產品的全世界產量(X )與我國產量(Y )如下(單位:

千件):

X 38 46 54 65 77 Y

11

15

20

26

33

①試求Y 對X 的迴歸直線X Y

βα???+=。 ②試求國外產量(Z)對X 的迴歸直線X Z

βα'+'=???。 ③題1與題2中兩條迴歸直線的係數彼此之間有何關係? 解

①X =56,Y =21,X 216630=∑,,Y 2

2511=∑,,XY =∑6419,。

β

=-∑-∑XY n X Y

X n X

2

2

=

--==64195562116630556539

95005672

()()().

αβ=-Y X =-=-2105675610752.().。 迴歸直線為:

..Y

X =-+107520567

②35=Z ,Z 2

6303=∑,,XZ =∑10211,。

X 38 46 54 65 77

Z

27

31 34 39 44 β=-∑=X n X 229509500433==.

αβ=-=Z X 3504335610752-=.().,迴歸直線: ..Z

X =+107520433

③ , α

αββ+=+=01。因為X Y Z =+,所以X Y Z =+,故: ()()

β

β+=+-+∑-∑=

-∑-∑=X Y Z n X Y Z X n X X n X

X n X 2

2

2

2

2

2

1

()( )ααββ+=+-+=-=Y Z X X X 0

14.8 在簡單迴歸分析中請說明「樣本判定係數」之意義?若為0則其意義

為何?其與相關係數、迴歸係數(β)間有何關係? 解

樣本判定係數是指迴歸方程式解釋的變異佔總變異的比例,亦即代表迴歸方程式的釋能力。若判定係數為0,表示迴歸方程式無解釋能力。在簡單迴歸方程式中,判定係數恰好為X 與Y 相關係數的平方,且與

估計的迴歸係數

β間有如下之關係:

r S S X

Y 2

22

2=? β

B. 應用題

14.9 下表為30家銀行財報揭露的每股淨值(=財報公告淨值/90年12月21

日止公司總股本加上特別股股本)與90年12月21日的股市收盤價:

(資料來源:李明哲,「金控公司換股套利研究」,《貨幣觀測與信用評等》,2002年1月。)

①試求迴歸估計式X Y

βα???+=,並檢定此迴歸模型是否具解釋能力?(05.0=α)

自由度 SS MS F 顯著值 迴歸 1 766.1669 766.1669 46.81928

1.96E-07

殘差 28 458.2017 16.36435

總和 29

1224.369

係數 標準誤 t 統計 P-值 截距

-5.79259 2.437102 -2.37683 0.024535 X 變數 1 1.1755 0.171795 6.842461 1.96E-07

迴歸統計 R 的倍數 R 平方 調整的R 平方

標準誤

觀察值個數

0.791053

0.625765

0.612399 4.045287 30 迴歸估計式為:X Y

18.179.5?+-=。

因F 檢定統計量的顯著值1.96E-07小於05.0=α,故知此迴歸模型具解釋能力。

②截距α的95%信賴區間: )79.0,79.10()44.2048.2(79.5??2/,2--=?±-=±-αααS t n 斜率β的95%信賴區間:

)53.1,83.0()17.0048.2(18.1??2/,2=?±=±-β

αβS t n 14.10 下表為93年臺灣省11個縣市烏魚的產量(公噸)及產值(千元):

縣市 數量 價值 臺北縣 25 3163 桃園縣 11 2281 新竹縣 354 88482 臺中縣

19 2132 彰化縣 382 83952 雲林縣 19 4266 嘉義縣 1010 101525 臺南縣 578 27328 高雄縣 31 9079 屏東縣 28 2746 新竹市

1099

207472

(資料來源:《農業統計年報》,行政院農委會,2004年。)

①試求迴歸估計式X Y βα???+=,並檢定此迴歸模型是否具解釋能力?(05.0=α)

②試分別檢定α與β是否為0?(05.0=α)題①的迴歸模型是否需要修正?若要修正,求修正後的迴歸估計式。

③續題②,已知92年每公斤鯉魚平均約112元,問93年的鯉魚價格是否高於112元?

迴歸估計式為:X Y

141.21052752.876+=。 因F 檢定統計量的顯著值0.00034小於05.0=α,故知此迴歸模型具解釋能力。 ②檢定截距α是否為0:

因截距的t 檢定統計量的p 值0.834925大於05.0=α,故知截距為0。

檢定斜率β是否為0:

因斜率的t 檢定統計量的p 值3.97E-17小於05.0=α,故知斜率不為0。(或由①的結果知此迴歸模型具解釋能力,也就是說斜率不為0。)

故①的迴歸模型可修正為εβ+=X Y 。

迴歸估計式為:X Y

144.6617=。 ③由②的迴歸估計式知β即代表鯉魚93年的平均價格。 兩個假設為:

112

:112:10>=ββH H

為右尾檢定,臨界值為796.105.0,11=t 。

t 檢定統計量如下:

762.118.53602

112

6617.144=-=

t

因762.1=t 小於796.105.0,11=t ,故不拒絕0H ,結論為93年的鯉魚平均價格與去年無差異。

14.11 某人以臺北市政府主計處1998至2004年家庭收支概況調查為主要資

料來源,研究每戶每月平均可支配所得和每戶每月平均育樂費用的關係,資料如下表所示(單位:元):

年度 每戶可支配所得

每戶育樂費 1998 93466 10703 1999 95808 9945 2000 96921 11734 2001 98645 11757 2002 92402 11072 2003 93212 10978 2004

89780

10470

(資料來源:台北市統計年報,台北市政府主計處,2005年。)

①請劃出每戶每月平均可支配所得和每戶每月平均育樂費用散佈圖,並說明兩者之關係。

②利用最小平方法求出估計的迴歸方程式Y

?。 ③解釋β

?之含義為何?及此一含義在X 的範圍為何時才有意義? ④承③,若假設2005年台北市每戶每月平均可支配所得為90000元,試問根據②所估計的迴歸方程式,2005年每戶每月平均育樂費用為多少?此一結果是否有意義?

①每戶每月平均可支配所得和每戶每月平均育樂費用散佈圖如下圖,由圖可知,兩者略呈正向線性之關係。

②X Y

11.0180?+=。 ③β

?之含義為:當每戶每月平均可支配所得增加1元時,每戶每月平均育樂費用平均約增加0.11元。此一迴歸方程式Y

?在每戶每月平均可支配所得介於89780元和98645元之間才有意義。

④若2005年台北市每戶每月平均可支配所得為90000元,則

2005年每戶每月平均育樂費用為100809000011.0180?=?+=Y

元。因為每戶每月平均育樂費用90000元在樣本範圍內,故此計算結果有意義。

14.12 台灣和美國的股市之間是否有連動的關係?2001年12月21個營業

日的三種股價指數:(資料置於磁片中Dataset 4) ①試檢定那斯達克指數與道瓊工業指數之間是否(線性)相關?(1.0=α)

②試檢定道瓊工業指數與台灣股價指數之間是否(線性)相關?(1.0=α)

令X 、Y 、Z 分別表示那斯達克指數、道瓊工業指數與台灣股價指數。 ①兩個假設為:

:0

:10≠=XY XY H H ρρ

用Excel 可得X 與Y 之間的樣本相關係數428.0=XY r 。 利用公式可得檢定統計量為: 064.22

21428.01428.02

=--=

t

在1.0=α下,檢定統計量064.2=t 大於右尾臨界值729.105.0,19=t ,拒絕0H ,結論為那斯達克指數與道瓊工業指數之間(線性)相關。 兩個假設為:

:0:10≠=YZ YZ H H ρρ

用Excel 可得Y 與Z 之間的樣本相關係數105.0=YZ r 。 利用(13.21)式可得檢定統計量為: 460.02

21105.01105.02

=--=

t

在1.0=α下,檢定統計量460.0=t 小於右尾臨界值

729.105.0,19=t ,不拒絕0H ,結論為道瓊工業指數與台灣股價指數之間不(線性)相關。

14.13 某人欲知國內研究發展經費(X )和美國核准專利數(Y )是否有關,

從行政院主計處網站和2005年的科學技術統計要覽中得到下表的資料

年(民國) 美國核准專利 (單位:件數) 全國研究展經費 (單位:新台幣百萬元)

83年 1814 114682 84年 2087 125031 85年 1897 137955 86年 2057 156321 87年 3100 176455 88年 3693 190520 89年 4667 197631 90年 5371 204974 91年 5431 224428 92年 5298 240820

93年

5938

260851

(資料來源:行政院主計處網站和科學技術統計要覽,2005年版。)

並利用普通最小平方法求出Y 對X 的迴歸直線為: 0.032634X 2262.19?+-=Y ,已知11=n ,47602.35=X

S ,1634.5105=Y S , 84515

1=X 。 ①試求X 與Y 之相關係數與判定係數。

②試求相關係數的95%信賴區間。

③當250000=X ,Y 平均值為何?並求其95%信賴區間。 ④當270000=X ,Y 預期值為何?並求其95%信賴區間。

①0.95045105

.163435.47602032634.0?===Y X XY S S r β

,9033.02

2==XY r r 。 ②84.1)9504

.019504.01ln(5.0=-+=r Z ,ρZ 的信賴區間

)53.2,15.1(69.084.1)311/(184.1025.0=±=-±=Z ,故

ρ

ρ-+11的信賴區

間)591.157,974.9(),(53.2215.12==??e e ,可得ρ的信賴區間﹦

(0.818,0.987)。

③31.5896)250000(0.0326342262.19)250000(=+-==X Y E ,故

2583320]?)[1(222=--=X

Y S S n SSE β,可得57.283])

()250000(1)[2(2

2

250000

?

=--+-=∑

=X X X n n SSE S X Y 因此,)250000(=X Y E 的信賴區間

)

11.6452,51.5340(80.55531.589631.5896250000

?

025.0=±=±==X Y S Z

④99.6548)270000(032634.019.2262)270000(=+-==X Y E

18.606])1()270000(11)[2(2

2270000

=--++-==X

X e S n X n n SSE S 270000=X Y 的信賴區間

)1.7737,88.5306(11.118899.654899.6548270000025.0=±=±==X e S Z 。

14.14 下列是1991-2004台灣地區家戶可支配所得以及家戶消費、家戶儲蓄

的資料,請估計消費函數與儲蓄函數(假設該二函數為線性函數),並說明此二條迴歸方程式有何關聯?

年 可支配所得Y 消費 儲蓄

1991 4485935 3472239 1013696 1992 4988158 3881271 1106887 1993 5485977 4272537 1213440 1994 5979035 4715034 1264001 1995 6458545 5123821 133**** **** 7074132 5637619 1436513 1997 7631618 6119345 151**** **** 8156919 6586423 157**** **** 8436381 6837349 159**** **** 8749992 7196910 155**** **** 8534696 7256726 1277970 2002 8833148 7376247 1456901 2003 8972716 7437078 153**** **** 9224718 7702046

1522672

(資料來源:行政院主計處網頁,國民經濟「統計年鑑資料」,2005。)

消費函數估計結果為:X Y

0.899715647628?+-= )5.23514(- )54.68823(

0.9960042=R ,0.9956712=R

儲蓄函數估計結果為:X Y

0.100285647627.5?+= )5.235141( )6.095708(

0.7558872=R ,0.7355452=R

兩條迴歸方程式的斜率和恰為10.1002850.899715=+。

14.15 某人整理了自2004年1月至2005年12月的國內進口原油價格和國

內消費者物價指數,試回答下列問題: 日 期 國內進口原油價格

平均單價(美元/桶)

國內消費者物價指數

2004年01月 30.37 100.00

2004年02月 30.83 99.22 2004年03月 30.40 99.15 2004年04月 32.42 100.30 2004年05月

33.72

100.20

2004年06月 35.98 100.44 2004年07月 35.58 101.59 2004年08月 37.38 101.18 2004年09月 40.08 101.73 2004年10月 38.94 102.07 2004年11月 40.56 100.77 2004年12月 37.79 100.83 2005年01月 36.80 100.49 2005年02月 38.72 101.14 2005年03月 42.20 101.43 2005年04月 47.99 101.94 2005年05月 47.69 102.52 2005年06月 47.55 102.84 2005年07月 52.17 104.02 2005年08月 54.60 104.81 2005年09月 57.70 104.95 2005年10月 56.79 104.87 2005年11月 53.64 103.28 2005年12月

53.22

103.05

(資料來源:1.國內進口原油價格取自經濟部能源局網站

(http://210.69.152.10/oil102/?group=g );2.消費者物價指數取自行政院主計處網站(https://www.wendangku.net/doc/cf9374653.html,.tw/ct.asp?xItem=393&CtNode=2850))

①利用簡單迴歸分析法估計國內進口原油價格(X )和國內消費者物價指數(Y )的普通最小平方估計式。 ②計算X Y S |,並說明其函意。

③此資料是否充分顯示國內進口原油價格和國內消費者物價指數的關係可以利用線型迴歸模型來估計?

①國內進口原油價格(X )和國內消費者物價指數(Y )的普通最小平方估計式如下:

42.21=X , 44578.352=∑X , 101.78=Y , 248706.552=∑Y , 103450.90=∑XY ,可得

()()()0.18302742.212435.44578101.7842.2142 103450.90?2

2

2

=--=--=∑∑X

n X Y X n XY β

94.0578121.24183027.078.101?=?-=α

;故迴歸直線為X Y

0.18302794.05781?+=。 ②迴歸模型的X Y S |如下:

∑∑

---=-=

)(?)(

?2

22Y X n XY Y n Y xy y SSE β

β

()()

()()()6.31377

101.78 42.2124 103450.90183027.0 101.7824 248706.552=---=

05357.02

2431377

.62|=-=-=

?n SSE S X Y ,其函意為;約有95%國內消費者 物價指數之值會介於迴歸模型估計值的

10714.005357.022|=?X Y S 之間。

③檢驗此資料是否充分顯示國內進口原油價格和國內消費者物價指數的關係可以利用線型迴歸模型來估計,即檢定

0:,0:10≠=ββH H ()()

0.012588 42.2124 44578.3505357

.02

2

2

|?=-=

-=

∑X

n X

S S X

Y β,

074.214.539940.012588

183027.0025.0,22=>=-=

t t ,拒絕虛無假設,故此資

料充分顯示國內進口原油價格和國內消費者物價指數 的關係

可以利用線型迴歸模型來估計。

相关文档
相关文档 最新文档