所屬科目:迴歸分析
⑴圖 1 是探討美國在游泳池溺斃(Swimming-pool drownings)的人數和美國核能發電廠發電(Nuclear power plants)數量數之間的關係,這兩個變數的相關係數為 90.12%。 請試述以簡單線性迴歸分析是否具有因果關係或意義?請說明理由。
⑵一位數據分析師擬研究滷肉飯銷售量受到那些因素所影響。所蒐集的可能解釋變數有價格、店內坪數、客流量、附近店家數、店內位置數、營業時間、店齡、配菜種類、選取肉的部位、米的種類等十個可能的解釋變數。該分析師計畫作複迴歸分析,要選擇重要解釋變數來描述反應變數(滷肉飯銷售量),請試述四種選擇重要變數的方法。又大數據的時代來臨,我們應用迴歸分析,有時會遇到高維度解釋變數的情況,解釋變數的個數(p)大到超過於樣本數(n)的情況,在高維度的解釋變數情況,請試述上述四種選擇重要變數之方法是否仍適用?如果你的答案為不適用,請說明理由。
⑴假設該分析師採用模型 1。在顯著水準 α=0.05 之下,請檢定 X3和 X4兩個解釋變數是否可以從給定模型 1 中刪除。也就是用 α=0.05 檢定H0﹕β3=β4=0,並試述對立假設,檢定統計量之值、決策法則和結論。並請計算偏相關係數 (partial R2)。
⑵假設該分析師採用模型 2。也就是在模型中僅考慮了兩個解釋變數,這兩個解釋變 數是學生的左前臂長度(X1)和左腳長度(X2)。該分析師想知道這兩個解釋變數 是否與身高(Y)有線性關係。在顯著水準 α=0.05 之下,請檢定 H0。並請試述檢定統計量之值、決策法則和結論。另請計算模型 2 的調整的複判定係數數 R2(adj R2 ,the adjusted R-squared)並試述其意義。又該分析師要把身高的單位英吋轉公分(英吋乘以 2.54),試述模型 2 的 adj R2是否改變?
⑶假設該分析師採用模型 3。只考慮模型中具有一個解釋變數,為學生的左前臂長度 (X1)。在顯著水準 α=0.05 下,該分析師想知道一個額外的解釋變數 X2 是否在解 釋身高上具有顯著的貢獻。也就是說,該分析師想知道 X2對模型 3 的貢獻。請協助回答此問題並說明對立假設、檢定統計量之值、決策法則和結論。在表 1 和表 2 的 F 檢定中,請試述需要做何假設,才能執行這些 F 檢定。
三、(1) 在作迴歸分析時,經常會遇到離群值和有影響力觀察值(influential data point)的問題。請試述何謂離群值和有影響力觀察值。並請分別試述兩種判斷準則偵測歸分析中的離群值和有影響力觀察值。
(2)圖 2A 是一組數據的散佈圖,圖 2B 提供兩條估計線,實線估計式包括第 51 點觀察值=(4,50)),虛線估計式不包括第51點觀察值。請試述這組數據集是否包含任何離群值?並請試述這組數據是否包含任何有影響力觀察值?另請說明理由。
㈢圖3A是另一組數據的散佈圖,圖3B提供兩條估計線,實線估計式.包括第41點觀察值 = (10,16)),虛線估計式 不包括第41點觀察值。請試述這組數據集是否包含任何離群值?並請試述這組數據集是否包含任何有影響力觀察值?另請說明理由。
⑴在配適E(Y│X=x)=α+ 的簡單線性迴歸方程式下,請利用最小平方法計算參數估計值與分別之標準誤。並請試述的共變異數,也就是 Cov
⑵請在試卷上,完成下列變異數分析表。在顯著水準 α=0.05,請協助檢定H0﹕β1=0。 並請試述檢定統計量之值、決策法則、結論和所需要之假設。
五、一位分析師擬以 估計簡單線性迴歸模型,...,n 之 斜率 β1。他可以證明 是一個不偏估計式。請寫出β1的最小平方估計式。在無須推導的變異數下,試述相較於最小平方估計式 ,何者為最佳之估計式?請詳細敘述所依據的理由或定理。