阿摩線上測驗 登入

申論題資訊

試卷:107年 - 107 經濟部所屬事業機構_新進職員甄試_統計資訊:1.資料庫及資料探勘 2.程式設計#92162
科目:國營事業◆1.資料庫及資料探勘 2.程式設計
年份:107年
排序:0

題組內容

一、針對各類資料探勘工具的使用與計算,請回答下列問題:(每小題 5 分,共 15 分)

申論題內容

(二)在相關規則的計算中,假設 A、B、C、D 與 E 代表各 item,如果在所有 2-itemset 中, 只有{A,B}、{B,C}、{A,D}、{A,C}、{C,D}是頻繁項目集(frequent itemset),請問 3- itemset 有哪些可能是 frequent itemset?

詳解 (共 1 筆)

詳解 提供者:hchungw

在計算相關規則(association rules)的過程中,如果我們知道所有的 2-itemset 中哪些是頻繁項目集(frequent itemset),我們可以利用這些信息來推斷哪些 3-itemset 可能是頻繁項目集。根據 Apriori 演算法的屬性,頻繁 k-itemset 的所有 (k-1)-itemset 也必須是頻繁的。因此,我們可以使用這個屬性來篩選可能的 3-itemset。
給定的頻繁 2-itemset
{A, B}
{B, C}
{A, D}
{A, C}
{C, D}
生成的 3-itemset
為了生成候選的 3-itemset,我們需要找出所有的 2-itemset 中有交集的組合。具體地說,我們要找出這些 2-itemset 是否能組成一個 3-itemset。
步驟
找出有共同元素的 2-itemset:
{A, B} 和 {A, C} → {A, B, C}
{A, B} 和 {B, C} → {A, B, C}
{A, D} 和 {A, C} → {A, C, D}
{B, C} 和 {C, D} → {B, C, D}
{A, C} 和 {C, D} → {A, C, D}
確保所有子集都是頻繁的:
{A, B, C} 的所有 2-item 子集是:{A, B}, {A, C}, {B, C}(這些都是頻繁的)
{A, C, D} 的所有 2-item 子集是:{A, C}, {A, D}, {C, D}(這些都是頻繁的)
{B, C, D} 的所有 2-item 子集是:{B, C}, {B, D}, {C, D}(其中 {B, D} 不在給定的頻繁 2-itemset 中,因此 {B, C, D} 不是候選)
結果
根據上面的分析,只有以下的 3-itemset 可能是頻繁項目集:
{A, B, C}
{A, C, D}
結論
根據給定的頻繁 2-itemset,可以推測出以下可能的 3-itemset 是頻繁項目集:
{A, B, C}
{A, C, D}
這些是通過檢查每個 3-itemset 的所有 2-item 子集是否都是頻繁的來確定的。