阿摩線上測驗
登入
首頁
>
ACL 資料分析與電腦稽核
> 無年度 - ACL電腦審計證照:Ch11機器學習在稽核的應用#106429
無年度 - ACL電腦審計證照:Ch11機器學習在稽核的應用#106429
科目:
ACL 資料分析與電腦稽核 |
選擇題數:
10 |
申論題數:
16
試卷資訊
所屬科目:
ACL 資料分析與電腦稽核
選擇題 (10)
1. 下列何者非分類(CLASSIFICATION) 培訓模型的評量指標? (A) ACCURACY (B) AUC (C) F1 (D) R2 (E) 以上皆非
2. 下列何者非迴歸(REGRESSION) 培訓模型的評量指標? (A) LOGLOSS (B) MAE (C) MSE (D) R2 (E) 以上皆非
3. ACL 進行機器學習最大的資料量限制為何? (A) 10,000筆資料 (B) 1,000,000筆資料 (C) 100 M Bytes 資料檔 (D) 1 G Bytes資料檔 (E) 無限制
4. ACL為強化機器學習的機制,如何分配訓練資料的時間? (A) 每分鐘 10,000筆資料 (B) 每分鐘 1,000,000筆資料 (C) 每100 K B資料檔分配45分鐘 (D) 每100 M B資料檔分配45分鐘 (E) 無任何機制
5. 若想要預測未來的房屋價格,應使用ACL的哪一個機器學習指令? (A) Train 指令的 CLASSIFICATION 模式 (B) Train 指令的 REGRESSION 模式 (C) Train 指令的 OUTLIER 模式 (D) Train 指令的 Neural Network 模式 (E) 目前ACL僅可以預測文字分類,無任何機制可以預測數值。
6. 關於 K 平均法(K-means)的分群,下列敘述何者正確? (A) 一開始不須告知該演算法欲分群的群數 (B) 每次分群結果必須讓組內平方和最大 (C) 每次分群的結果都一模一樣 (D) 容易受雜訊與離群值影響其群集中心 (E) 可以處理類別型資料
7. 下列哪種方法可以避免機器學習模型過度擬合(Overfitting)? (A) 選擇特徵(Feature Selection) (B) 交叉驗證(Cross Validation) (C) 對目標函數施加懲罰(Penalty) (D) 增加使用的正規化(Normalization)數量 (E) 以上皆是
8. 關於集群分析(Clustering Analysis),下列敘述何者正確? (A) 依照相似度將資料分群 (B) K-means 每次分群結果一定會相同 (C) 各群之間的相似度大 (D) 同一群內的相似度小 (E) 同樣的起始群集中心,可能會造成不同的分群結果
9. 假設廣告推薦系統透過每次廣告的推薦,得到用戶是否點擊的資訊, 後不斷改進修正其策略以得到最佳的廣告推薦效果,則此廣告系統較 適合採用下列何種學習方法? (A) 監督式學習(Supervised Learning) (B) 非監督式學習(Unsupervised Learning) (C) 半監督式學習(Semi-supervised Learning) (D) 增強式學習(Reinforcement Learning) (E) 以上皆可
10. 資料科學家經常使用多個演算法進行預測,並將多個機器學習演算法 的輸出結合起來,以獲得比所有個體模型都更好的更健壯的輸出。則 下列說法何者不正確? (A) 又稱為「整合學習」 (B) 基本模型之間相關性低 (C) 整合方法中,使用加權平均代替投票方法 (D) 基本模型來自於不同演算法 (E) 基本模型之間相關性低
申論題 (16)
1. 請說明監督式機器學習和非監督式機器學習的差異。
2. 請畫出監督式機器學習的作業流程圖並說明之。
3. 請列出要執行集群分析(CLUSTER)選擇最佳集群個數(K值)的準則。
4. 請說明在人工智慧時代電腦主機CPU 和GPU 的差異。
5. 請說明如何在監督式學習中使用聚類演算法。
6. 請說明如何確保您的模型沒有過度擬合。
7. 請說明該如何評估機器學習模型的有效性。
8. 請簡要說明一個完整機器學習專案的流程
(1) 若 Train指令的總執行時間希望在 1 小時內完成,則SEARCHTIME和 MAXEVALTIME 應設定的值為何?
(2) Train指令執行後產出的評估報表,評估指標最高者為何? 值為何?
(3) 將所產出的預測模型導入到「預測資料集_電信客戶」資料表,則預測有幾位客戶會流失?
(1) 請利用ACL對LOAN的資料進行監督式分類機器學習方法,學習的目標欄位(LOAN_DECISION) 是否同意貸款,建立以LOGLOSS為主的知識模型Loan_Model_1,並列出 LOGLOSS 和ACCURACY 的值。
(2) 請利用ACL萃取出在LOAN資料表內LOAN_DECISION=”Y”的資料成為一新資料檔進行監督式分類機器學習方法,學習的目標欄位(PS_IS_VIOLATE) 是否有違約,建立以AUC為主的知識模型Loan_Model_2,並列出 AUC值 和最重要的欄位名稱與值。
(3) 請使用Loan_Model_1預測在新申請貸款戶LOAN_NEW資料檔內,哪些資料會通過同意貸款,其筆數為何?
(4) 使用Loan_Model_2預測在新申請貸款戶LOAN_NEW資料檔內,哪些資料可能會違約,其筆數為何?
(5) 請列出在LOAN_NEW資料檔內預計會取得貸款且預測會違約的案件數。