36. 以下何者不是探索性資料分析經常關心的議題?
(A) 資料的四分位數
(B) 資料是否有離群值
(C) 與應變數相關的自變數
(D) 資料模型的準確度
答案:登入後查看
統計: A(9), B(3), C(3), D(27), E(0) #3156405
統計: A(9), B(3), C(3), D(27), E(0) #3156405
詳解 (共 1 筆)
#6330687
解析題目與選項:
探索性資料分析(Exploratory Data Analysis, EDA) 的目標是對數據進行初步分析,以發現數據的結構、特徵、異常值等,為後續建模和決策提供基礎。常見的 EDA 技術包括:
- 計算基本統計量(如平均數、中位數、四分位數)
- 檢查數據分佈(如直方圖、箱形圖)
- 發現異常值(outliers)
- 檢查變數之間的關係(如相關係數)
然而,EDA 主要是描述性分析,而不會關注機器學習模型的準確度。
選項分析:
(A) 資料的四分位數 ✅ (EDA 會關心)
→ 四分位數(quartiles) 是 EDA 中常用的統計量,主要用來描述數據的分佈情況,例如:
- Q1(第一四分位數):25% 數據點以下的值
- Q2(中位數,第二四分位數):50% 數據點以下的值
- Q3(第三四分位數):75% 數據點以下的值
- IQR(四分位距):Q3 - Q1,幫助檢測異常值
(B) 資料是否有離群值 ✅ (EDA 會關心)
→ EDA 會關心離群值(outliers),因為它們可能影響數據分析的結果。離群值通常使用 箱形圖(Boxplot)、Z-score、IQR 方法來檢測。
(C) 與應變數相關的自變數 ✅ (EDA 會關心)
→ 變數之間的關係 是 EDA 重要的一部分。例如:
- 計算變數之間的 皮爾森相關係數(Pearson correlation)
- 繪製 散佈圖(scatter plot) 來檢查變數之間的關聯性
(D) 資料模型的準確度 ❌ (EDA 不關心,正確答案!)
→ EDA 是探索數據的步驟,並不涉及模型的準確度(accuracy)。
- 模型準確度(accuracy) 屬於機器學習模型評估階段,而不是 EDA 的核心目標。
- EDA 主要在數據處理之前,幫助我們理解數據,而不是評估模型的表現。
正確答案:
✅ (D) 資料模型的準確度 (EDA 不關心模型的準確度,而是關心數據本身的特性!)
0
0