所屬科目:資料結構與資料庫及資料探勘
(一)在這種情況下,使用 Insertion Sort、Merge Sort、Quick Sort,請比較 其平均與實際效能,並說明那一種最適合。
(二)在 Quick Sort 中實作上可採用多種 pivot 選擇策略(如:第一個元素、最後一個元素與中位數三取法 median-of-three) ,請說明這些策略對於上述資料進行反向(Reversed Order)排序的效能影響,並指出最推薦的選擇方法及理由。
(一)為何 Dijkstra 不適合在權重頻繁變動的情境下重複執行?試設計一種 “增量式更新演算法”(incremental update approach) ,能在部分邊權更 新後有效地維護最短路徑樹(SPT)。
(二)若圖使用 Fibonacci heap 實作 priority queue,請比較時間複雜度與一般 binary heap 的差異。
(一)在四種不同隔離等級下,T1 是否可能讀到不同的 A 值,並說明理由?
(二)試分析異常現象(dirty read、non-repeatable read、phantom read)在何種隔離等級會發生?
(一)請繪出最終的 B+ Tree 結構(節點鍵值排列)。並執行範圍查詢 WHERE key BETWEEN 10 AND 30,請說明實際 I/O 步驟(指明訪問那些節點) 。
(二)若鍵值 25 被刪除,請說明重新平衡(redistribution 或 merge)的過程。
(一)整體熵(Entropy of dataset)。
(二)以屬性 A 為分裂條件的資訊增益(Information Gain),並請修改其中一筆的 Class 值可以提高屬性 A 的資訊增益。