資料探勘(data minimg)
使用資訊科技,利用統計或其他方法分析技術,從大量的資料中找到未知、有價值且可付諸行動的規則,用於預測未來的行為,以決策支援
目標
描述:一發生的現象
預測:對未來狀況假設預測事件結果
方法->分分關順推*分類->多維屬性
又稱判別,從大量以標籤類別的原始資料中,根據預先定義好類別,找出其各屬性對類別的影響
如信用評等預測、股價漲跌預測
*分群->由已知推未知放同一群
從性質未知,無法事先定義類別的資料,根據預先訂好的群聚數,將屬性相似的資料群聚,以對已知資料進行歸納,或判讀未知資料之群組
例如顧客群組、網路使用者族群資料群組、買書網站上自動推薦使用者購買相同類型的書籍
*關聯->關聯性
從大量交易資料中找出資料間相互影響的關聯性,以協助了解兩件事件的相互影響程度
例如購物籃分析,找出商品間的關聯性,如啤酒和尿布在星期五晚上常被同事購買
*順序->行程分析
從大量交易資料中找出資料間出現順序的規則,了解當出現了A之後,再出現B的機率
如網頁網頁點擊分析,找出使用者點選超連結的路徑,分析網站架構關聯,
*推估->用於推測連續變數的數值。
推估問題重點在於如何透過已知的屬性來推估未知的連續數值的走向趨勢
例如金融商品價格趨勢變化預測、進銷存價格變化趨勢、顧客貢獻度,顧客價值預測