3. 下列哪一項「不」是資料前處理的步驟?
(A) 資料清理(Data Cleaning)
(B) 資料整合(Data Integration)
(C) 資料建模(Data Modeling)
(D) 資料變形(Data Reshaping)

答案:登入後查看
統計: A(1), B(0), C(47), D(1), E(0) #3103428

詳解 (共 1 筆)

#6324653

(C) 資料建模(Data Modeling) ❌不屬於資料前處理的步驟

解析:

資料前處理 (Data Preprocessing) 是機器學習和數據分析的重要步驟,目的是清理、轉換和準備數據,以便提升模型的準確性和效能。前處理的主要步驟包括資料清理、資料整合、資料變形等

選項分析

(A) 資料清理(Data Cleaning) ✅ 屬於資料前處理

  • 目標是處理缺失值、異常值、重複數據,確保數據品質。
  • 常見方法:
    • 移除或填補遺缺值 (Missing Values Imputation)。
    • 移除重複數據 (Duplicate Removal)。
    • 修正不一致數據 (Data Consistency Checking)。

(B) 資料整合(Data Integration) ✅ 屬於資料前處理

  • 合併來自多個來源的數據,確保數據一致性。
  • 常見場景:
    • 不同資料庫的整合 (如 SQL 合併)。
    • 去除重複的屬性 (Duplicate Attributes)
    • 標準化不同數據格式

(C) 資料建模(Data Modeling) ❌不屬於資料前處理

  • 資料建模是機器學習的核心步驟,不是前處理
  • 建模 (Modeling) 主要是指選擇演算法、訓練模型、調整超參數、評估效能,例如:
    • 訓練線性回歸、決策樹、神經網路等模型。
    • 進行交叉驗證 (Cross-validation) 和超參數調整 (Hyperparameter Tuning)。

(D) 資料變形(Data Reshaping) ✅ 屬於資料前處理

  • 目標是將數據轉換成適合分析或建模的結構。
  • 常見方法:
    • 正規化 (Normalization) / 標準化 (Standardization)
    • 資料轉置 (Transpose) / 重新塑形 (Reshape)
    • 特徵工程 (Feature Engineering)

結論

「不屬於資料前處理的步驟」的選項是 (C) 資料建模(Data Modeling),因為建模是機器學習的主要階段,而非數據預處理的一部分。

0
0