在計算相關規則(association rules)的過程中,如果我們知道所有的 2-itemset 中哪些是頻繁項目集(frequent itemset),我們可以利用這些信息來推斷哪些 3-itemset 可能是頻繁項目集。根據 Apriori 演算法的屬性,頻繁 k-itemset 的所有 (k-1)-itemset 也必須是頻繁的。因此,我們可以使用這個屬性來篩選可能的 3-itemset。
給定的頻繁 2-itemset
{A, B}
{B, C}
{A, D}
{A, C}
{C, D}
生成的 3-itemset
為了生成候選的 3-itemset,我們需要找出所有的 2-itemset 中有交集的組合。具體地說,我們要找出這些 2-itemset 是否能組成一個 3-itemset。
步驟
找出有共同元素的 2-itemset:
{A, B} 和 {A, C} → {A, B, C}
{A, B} 和 {B, C} → {A, B, C}
{A, D} 和 {A, C} → {A, C, D}
{B, C} 和 {C, D} → {B, C, D}
{A, C} 和 {C, D} → {A, C, D}
確保所有子集都是頻繁的:
{A, B, C} 的所有 2-item 子集是:{A, B}, {A, C}, {B, C}(這些都是頻繁的)
{A, C, D} 的所有 2-item 子集是:{A, C}, {A, D}, {C, D}(這些都是頻繁的)
{B, C, D} 的所有 2-item 子集是:{B, C}, {B, D}, {C, D}(其中 {B, D} 不在給定的頻繁 2-itemset 中,因此 {B, C, D} 不是候選)
結果
根據上面的分析,只有以下的 3-itemset 可能是頻繁項目集:
{A, B, C}
{A, C, D}
結論
根據給定的頻繁 2-itemset,可以推測出以下可能的 3-itemset 是頻繁項目集:
{A, B, C}
{A, C, D}
這些是通過檢查每個 3-itemset 的所有 2-item 子集是否都是頻繁的來確定的。