36. 以下何者不是探索性資料分析經常關心的議題?
(A) 資料的四分位數
(B) 資料是否有離群值
(C) 與應變數相關的自變數
(D) 資料模型的準確度

答案:登入後查看
統計: A(9), B(3), C(3), D(27), E(0) #3156405

詳解 (共 1 筆)

#6330687

解析題目與選項:

探索性資料分析(Exploratory Data Analysis, EDA) 的目標是對數據進行初步分析,以發現數據的結構、特徵、異常值等,為後續建模和決策提供基礎。常見的 EDA 技術包括:

  • 計算基本統計量(如平均數、中位數、四分位數)
  • 檢查數據分佈(如直方圖、箱形圖)
  • 發現異常值(outliers)
  • 檢查變數之間的關係(如相關係數)

然而,EDA 主要是描述性分析,而不會關注機器學習模型的準確度

選項分析:

(A) 資料的四分位數(EDA 會關心)
四分位數(quartiles) 是 EDA 中常用的統計量,主要用來描述數據的分佈情況,例如:

  • Q1(第一四分位數):25% 數據點以下的值
  • Q2(中位數,第二四分位數):50% 數據點以下的值
  • Q3(第三四分位數):75% 數據點以下的值
  • IQR(四分位距):Q3 - Q1,幫助檢測異常值

(B) 資料是否有離群值(EDA 會關心)
EDA 會關心離群值(outliers),因為它們可能影響數據分析的結果。離群值通常使用 箱形圖(Boxplot)、Z-score、IQR 方法來檢測。

(C) 與應變數相關的自變數(EDA 會關心)
變數之間的關係 是 EDA 重要的一部分。例如:

  • 計算變數之間的 皮爾森相關係數(Pearson correlation)
  • 繪製 散佈圖(scatter plot) 來檢查變數之間的關聯性

(D) 資料模型的準確度(EDA 不關心,正確答案!)
EDA 是探索數據的步驟,並不涉及模型的準確度(accuracy)。

  • 模型準確度(accuracy) 屬於機器學習模型評估階段,而不是 EDA 的核心目標。
  • EDA 主要在數據處理之前,幫助我們理解數據,而不是評估模型的表現。

正確答案:

(D) 資料模型的準確度 (EDA 不關心模型的準確度,而是關心數據本身的特性!)

0
0