阿摩線上測驗 登入

申論題資訊

試卷:110年 - 110 專技高考_資訊技師:資料結構與資料庫及資料探勘#104174
科目:資料結構與資料庫及資料探勘
年份:110年
排序:0

題組內容

一、請試述下列名詞之意涵:(30 分)

申論題內容

(一) Apriori-property

詳解 (共 1 筆)

詳解 提供者:hchungw
Apriori-property 是關聯規則學習中的一個重要概念,主要用於 Apriori 算法中,這是一種發現頻繁項目集的經典算法。Apriori-property,也稱為反單調性質或 Apriori 原則,它的基本理念是:如果一個項目集不是頻繁的,那麼它的任何超集也不會是頻繁的。相對地,如果一個項目集是頻繁的,則其所有子集也必定是頻繁的。
定義和應用
這一原則在 Apriori 算法中發揮著關鍵作用,用於減少需要檢查的項目集的數量,從而提高算法的效率。算法運作的方式是首先生成候選項目集,然後計算這些集合在數據庫中的支持度,以確定它們是否足夠頻繁。
如何應用
生成候選項目集:Apriori 算法從檢查單個項目的頻繁程度開始,這些項目稱為1-項目集。只有那些滿足最小支持度閾值的項目才被認為是頻繁的。
構建更大的集合:接著利用頻繁的1-項目集生成2-項目集(項目對),然後再檢查這些項目集的支持度。根據 Apriori-property,只有當一個項目集的所有子集都是頻繁的時,這個項目集才有可能是頻繁的。這樣可以有效過濾掉那些不可能頻繁的較大項目集。
反覆迭代:此過程持續到不再能生成更大的頻繁項目集為止。每一步中,所有不滿足最小支持度閾值的項目集都會被排除,這樣確保了算法的效率和可行性。
效益
Apriori-property 的主要效益在於它大大減少了搜索空間。這是因為它允許算法在不進行昂貴的計算支持度的情況下,排除大量的項目集。這對於包含大量項目和/或交易的大型數據庫特別有用,能夠有效地篩選出真正有意義的項目集,為生成強關聯規則打下基礎。