39. 下列哪一項「不」是探索式資料分析( Exploratory Data
Analysis, EDA)會做的事?
(A) 檢視各欄位的資料型別(Dtypes)
(B) 類別欄位次數統計(Value_Counts)
(C) 繪製數值欄位直方圖(Hist)
(D) 預測結果的混淆矩陣(Confusion Matrix)
答案:登入後查看
統計: A(1), B(0), C(2), D(18), E(0) #3323469
統計: A(1), B(0), C(2), D(18), E(0) #3323469
詳解 (共 1 筆)
#6329840
探索式資料分析(Exploratory Data Analysis, EDA)
探索式資料分析(EDA)是 機器學習和統計分析 中的 初步資料分析步驟,目的是 理解數據的分佈、變數間的關係,以及檢查異常值,從而為後續建模和分析提供基礎。
EDA 常見的步驟包括:
- 數據結構檢視(如 dtypes、info())
- 統計描述(如 describe())
- 欄位分佈檢查(如 value_counts())
- 數據視覺化(如 直方圖 hist()、箱型圖 boxplot())
- 缺失值檢查
- 相關性分析
分析選項
-
(A) 檢視各欄位的資料型別(Dtypes)
- ✅ 正確,在 EDA 過程中,我們會檢查每個欄位的資料類型(如 int64, float64, object)來確保數據格式正確。
-
(B) 類別欄位次數統計(Value_Counts)
- ✅ 正確,對於類別變數(Categorical Data),我們通常會使用 value_counts() 來計算各類別的數量分佈,以了解變數的特徵。
-
(C) 繪製數值欄位直方圖(Hist)
- ✅ 正確,直方圖(Histogram)是 EDA 中常用的視覺化工具,可以檢查數據分佈是否為常態分佈、是否有偏態或異常值。
-
(D) 預測結果的混淆矩陣(Confusion Matrix)
- ❌ 錯誤,混淆矩陣(Confusion Matrix)用於評估監督式學習分類模型的表現,例如評估預測結果與實際標籤的準確度。然而,EDA 主要關注數據的結構與特性,而不是評估模型的預測結果,因此 混淆矩陣不是 EDA 會做的事情。
正確答案:
✅ (D) 預測結果的混淆矩陣(Confusion Matrix)(這不是 EDA 的步驟,而是模型評估的方法)
0
0