題組內容

二、資料探勘常用歐幾里得距離來定義相似度(或不相似度),資料前處理時,常需對每一欄位 分別做正規化(或稱標準化)。

(二)請說明常用之 3 種正規化方法。

詳解 (共 1 筆)

詳解 提供者:hchungw
  • 最小-最大縮放 (Min-Max Scaling) 適合範圍已知且數據分佈均勻的情況。
  • 標準化 (Standardization) 適合數據呈正態分布或近似正態分布,並且在梯度基於演算法中效果較好。
  • 最大絕對值縮放 (Max Abs Scaling) 適合稀疏數據,保持稀疏結構。