題組內容

三、當一個資料集中有兩個類別的資料,且其中一個類別的資料筆數遠大於另一個類別的資料筆數時,則稱其為不平衡(imbalanced)資料集,在這類資料集中,一般較受到關注的是少數類別的資料。請回答下列問題:(2 題,每題 13 分,共 26 分)

(一)請論述分類方法決策樹(Decision Tree)、支持向量機(Support Vector Machine)和基於規則演算法(Rule-based Algorithm),何者較適合用來做不平衡資料的分類?