39. 下列哪一項「不」是探索式資料分析( Exploratory Data Analysis, EDA)會做的事？
(A) 檢視各欄位的資料型別(Dtypes)
(B) 類別欄位次數統計(Value_Counts)
(C) 繪製數值欄位直方圖(Hist)
(D) 預測結果的混淆矩陣(Confusion Matrix)

答案：登入後查看
統計： A(1), B(0), C(2), D(18), E(0) #3323469

hchungw

B1 · 2025/03/12

#6329840

探索式資料分析（EDA）是 機器學習和統計分析 中的 初步資料分析步驟，目的是 理解數據的分佈、變數間的關係，以及檢查異常值，從而為後續建模和分析提供基礎。

EDA 常見的步驟包括：

(A) 檢視各欄位的資料型別（Dtypes）
- ✅ 正確，在 EDA 過程中，我們會檢查每個欄位的資料類型（如 int64, float64, object）來確保數據格式正確。
(B) 類別欄位次數統計（Value_Counts）
- ✅ 正確，對於類別變數（Categorical Data），我們通常會使用 value_counts() 來計算各類別的數量分佈，以了解變數的特徵。
(C) 繪製數值欄位直方圖（Hist）
- ✅ 正確，直方圖（Histogram）是 EDA 中常用的視覺化工具，可以檢查數據分佈是否為常態分佈、是否有偏態或異常值。
(D) 預測結果的混淆矩陣（Confusion Matrix）
- ❌ 錯誤，混淆矩陣（Confusion Matrix）用於評估監督式學習分類模型的表現，例如評估預測結果與實際標籤的準確度。然而，EDA 主要關注數據的結構與特性，而不是評估模型的預測結果，因此 混淆矩陣不是 EDA 會做的事情。

✅ (D) 預測結果的混淆矩陣（Confusion Matrix）（這不是 EDA 的步驟，而是模型評估的方法）