題組內容
二、資料探勘常用歐幾里得距離來定義相似度(或不相似度),資料前處理時,常需對每一欄位 分別做正規化(或稱標準化)。
(二)請說明常用之 3 種正規化方法。
詳解 (共 1 筆)
詳解
- 最小-最大縮放 (Min-Max Scaling) 適合範圍已知且數據分佈均勻的情況。
- 標準化 (Standardization) 適合數據呈正態分布或近似正態分布,並且在梯度基於演算法中效果較好。
- 最大絕對值縮放 (Max Abs Scaling) 適合稀疏數據,保持稀疏結構。