39. 下列哪一項「不」是探索式資料分析( Exploratory Data Analysis, EDA)會做的事?
(A) 檢視各欄位的資料型別(Dtypes)
(B) 類別欄位次數統計(Value_Counts)
(C) 繪製數值欄位直方圖(Hist)
(D) 預測結果的混淆矩陣(Confusion Matrix)

答案:登入後查看
統計: A(1), B(0), C(2), D(18), E(0) #3323469

詳解 (共 1 筆)

#6329840

探索式資料分析(Exploratory Data Analysis, EDA)

探索式資料分析(EDA)是 機器學習和統計分析 中的 初步資料分析步驟,目的是 理解數據的分佈、變數間的關係,以及檢查異常值,從而為後續建模和分析提供基礎。

EDA 常見的步驟包括:

  • 數據結構檢視(如 dtypes、info())
  • 統計描述(如 describe())
  • 欄位分佈檢查(如 value_counts())
  • 數據視覺化(如 直方圖 hist()、箱型圖 boxplot())
  • 缺失值檢查
  • 相關性分析

分析選項

  • (A) 檢視各欄位的資料型別(Dtypes)

    • ✅ 正確,在 EDA 過程中,我們會檢查每個欄位的資料類型(如 int64, float64, object)來確保數據格式正確。
  • (B) 類別欄位次數統計(Value_Counts)

    • ✅ 正確,對於類別變數(Categorical Data),我們通常會使用 value_counts() 來計算各類別的數量分佈,以了解變數的特徵。
  • (C) 繪製數值欄位直方圖(Hist)

    • ✅ 正確,直方圖(Histogram)是 EDA 中常用的視覺化工具,可以檢查數據分佈是否為常態分佈、是否有偏態或異常值。
  • (D) 預測結果的混淆矩陣(Confusion Matrix)

    • ❌ 錯誤,混淆矩陣(Confusion Matrix)用於評估監督式學習分類模型的表現,例如評估預測結果與實際標籤的準確度。然而,EDA 主要關注數據的結構與特性,而不是評估模型的預測結果,因此 混淆矩陣不是 EDA 會做的事情

正確答案:

(D) 預測結果的混淆矩陣(Confusion Matrix)這不是 EDA 的步驟,而是模型評估的方法

0
0