關聯規則分析(Association Rule Mining)是一種在大型數據集中尋找變數間有趣關係的方法,通常用於購物籃分析等場景。這種分析的三項主要衡量指標是:
支持度(Support):這是一個規則在所有交易中出現的頻率。支持度可以看作是該規則的重要性,因為它反映了規則中涉及的項目組合在數據集中的普及程度。計算方法是規則中項目組合出現的次數除以所有交易的總次數。
信賴度(Confidence):這是一個條件概率,表示在一個項目(或一組項目)出現的情況下,另一個項目(或一組項目)也出現的概率。信賴度衡量了一個規則的可靠性。計算方法是規則的頭部和尾部項目組合一起出現的次數除以只有尾部項目組合出現的次數。
提升度(Lift):這是一個規則的有效性衡量指標,表示了規則頭部和尾部項目組合一起出現的概率與它們各自獨立出現概率的乘積之比。提升度值大於1意味著頭部和尾部的出現不是獨立的,且有正相關;提升度值等於1表示頭部和尾部出現是獨立的;提升度值小於1則表示頭部和尾部的出現有負相關。
這些指標共同幫助我們確定規則的有效性和可靠性,從而在大量數據中挖掘出有意義的模式。