監督式機器學習和非監督式機器學習是兩種主要的機器學習方法,它們有以下主要差異:
監督式機器學習(Supervised Learning)
- 資料標籤:使用標記資料集進行訓練,即每個輸入樣本都有對應的正確輸出(標籤)。
- 目標:學習輸入和輸出之間的映射,以便在未來對新樣本進行準確預測。
- 應用:分類問題(如垃圾郵件檢測)、回歸問題(如房價預測)。
非監督式機器學習(Unsupervised Learning)
- 資料標籤:使用未標記資料集進行訓練,即沒有對應的輸出(標籤)。
- 目標:從數據中發現內在結構或模式,如分群(clustering)和降維(dimensionality reduction)。
- 應用:客戶分群、異常檢測、資料視覺化。
主要差異
- 資料標籤:監督式需要標記資料,非監督式不需要。
- 目標:監督式學習預測輸出,非監督式學習發現數據模式。