所屬科目:iPAS◆AI應用規劃師◆初級
1. 關於 AI,下列敘述何者正確? (A)AI 僅能處理結構化數據的分析 (B) AI 涵蓋多種專業領域與技術 (C) AI 系統只能在學術研究中應用 (D)AI 無法應用於金融領域
2. 下列何者最適合訓練電腦下圍棋、自動駕駛等動態重複地互動的問題? (A) 監督式學習(Supervised Learning) (B) 非監督式學習(Unsupervised Learning) (C) 半監督式學習(Semi-supervised Learning) (D)強化學習(Reinforcement Learning)
3. 深度學習模型中,下列哪一項通常用來降低過擬合(Overfitting)問題? (A) 增加訓練數據量 (B) 增加模型的複雜度 (C) 增加學習率 (D) 增加正則化項
4. 下列哪一項敘述符合 AI 治理的核心原則? (A)AI 系統的風險等級應在設計階段預先評估,並於部署後持續監控; (B) 只要 AI 模型輸出結果準確,是否公平或透明並非治理重點; (C) AI 治理應聚焦在企業內部自行負責,不需外部規範參與; (D)對於低風險 AI 系統皆可免除透明性與問責機制之要求
5. 若要設計一個能夠辨識並過濾垃圾郵件的系統,應該選擇下列哪一種機器學習演算法以實現最佳效果? (A) 監督式學習(Supervised Learning) (B) 非監督式學習(Unsupervised Learning) (C) 半監督式學習(Semi-supervised Learning) (D) 強化式學習(Reinforcement Learning)
6. 假設某國正在考慮使用 AI 技術來進行社會信用評分,並根據年齡、缺陷、種族等特徵來評定個人的信用;同時,該國計劃在公眾場所使用遠 程生物辨識系統進行執法,目的在於提高社會秩序和安全。上述 AI 應 用可能會引發對隱私和個人權利的重大關注,根據歐盟《人工智慧法》 (Artificial Intelligence Act, AIA)的風險分級,這類應用屬於哪一風 險等級? (A) 不可接受風險 (B) 高風險 (C) 有限風險 (D) 小或低風險
7. 某生成式 AI 模型接收一段語音輸入:「一隻戴著太空帽的企鵝正在火星上跳舞」,並根據該語音內容產生一張圖像呈現相對應的場景。此類模型最符合下列哪一種生成任務分類? (A) 語音生成圖片 (B) 圖像生成語音 (C) 語音翻譯 (D) 圖像標註
8. 下列何者非大數據時代資料的特性? (A) 資料量大 (B) 資料變動速度快 (C) 資料多樣性 (D) 資料存儲位置固定
9.關於 K 平均法(K-means),下列敘述何者「不」正確?(A) 希望找出 k 個互不交集的群集(B) 不同的起始群集中心,可能會造成不同的分群結果(C) 容易受雜訊與離群值(Outlier)影響其群集中心(D) 可以處理類別型資料
10. 在公司財務資料中,發現某筆支出金額達 1,000,000 元,若希望合理判 斷該筆資料是否為異常值,下列哪一種處理方式最為合適? (A) 以 Z-score 方法量化異常程度,判斷是否為極端值; (B) 以資料中的眾數作為參考基準,判斷其是否異常; (C) 先透過主成分分析(PCA)降低維度,再進行異常值判定; (D) 直接將該筆金額替換為資料中位數,以降低其對分析結果的影響
11. 下列哪一種資料類型不屬於非結構化資料? (A) X 光醫學影像 (B) 監控錄影畫面 (C) 客服電話錄音 (D) 組織內部的關係型資料庫記錄
12. 下列資料型態,何者最常用來儲存員工年齡、員工年資、貨品銷售量等 資料? (A) 文字型(Text) (B) 數值型(Numeric) (C) 日期型(Date) (D) 布林型(Boolean)
13. 某行銷公司欲針對新客戶進行「行銷活動推播」,目前擁有資料包含:客 戶基本資料(尚未有購買紀錄)、客戶過往點擊行為(未標記是否完成購 買)、類似客戶是否曾購買過(已標記「有/無購買」標籤)。若該公司希 望預測新的單一客戶是否可能完成購買行為,下列哪一種學習方式與資 料搭配最合適? (A) 使用非監督式學習,分析所有客戶點擊路徑進行異常偵測 (B) 使用非監督式學習,將客戶分群後預測其轉換率 (C) 使用監督式學習,針對未標記資料直接預測轉換可能性 (D) 使用監督式學習,以已知購買結果作為標籤進行訓練
14. 在品質管理中,若一產品的生產過程中標準差顯著偏大,通常意味著什 麼? (A) 資料點高度集中,產品質量穩定 (B) 生產過程波動大,產品品質不穩定 (C) 資料無法反映產品實際狀況 (D) 中位數數值高,品質良率較高
15. 某 AI 團隊在分析一組連續型數據時,發現部分紀錄的數值明顯高於其 他資料點。若專案目標是識別高價值客戶的行為模式,下列哪一種處理 方式最為合適? (A) 立即刪除離群值,以避免模型訓練時出現偏差 (B) 視為錯誤值並全部替換為平均值 (C) 保留離群值並標註為高價值異常點,納入後續模型訓練考量 (D) 將離群值全數轉換為中位數,避免影響平均計算
16. 在檢視資料品質時,可參考資料的變異程度及資料的集中趨勢。下列何 者不屬於資料集中趨勢衡量的方法? (A) 平均數(Mean) (B) 中位數(Median) (C) 眾數(Mode) (D) 標準差(Standard Deviation)
17. 某醫院研究特定心血管疾病的成因,收集了 50 名病患與 150 名正常人 的年齡、血壓、血型等三項屬性變數。此研究適合使用下列哪一種機器 學習模型來建立? (A) 決策樹(Decision Tree) (B) 線性廻歸(Linear Regression) (C) 基於密度之含噪空間聚類法(Density-Based Spatial Clustering of Application with Noise, DBSCAN) (D) K-means 聚類(K-means Clustering)
18. 公司在整合資料時,發現同一客戶的姓名在不同系統中拼寫不一致(例 如「陳大文」與「陳大文先生」),導致資料無法正確對應。請問此類資 料品質問題應該在 ETL 哪一個流程步驟中進行處理? (A) 資料轉換(Data Transformation) (B) 資料擷取(Data Extraction) (C) 資料載入(Data Loading) (D) 型態轉換(Type Conversion)
19. 銀行想建立聊天機器人,可透過下列哪一種領域技術來達成? (A) 資料庫管理技術 (B) 機器學習與自然語言處理 (C) 網頁開發技術 (D) 網路安全技術
20. 線性迴歸模型最適合解決哪種類型的問題? (A) 圖像分類 (B) 銷售額預測 (C) 聚類分析 (D) 遊戲策略學習
21. 某金融機構已部署的 AI 模型遭客戶抱怨有不公平情形,經數據分析發現不同族群之間的模型預測結果存在顯著差異。根據金融監督管理委員會發布之《金融業運用人工智慧(AI)指引》,此情形下最適當的處置方式為何? (A) 重新訓練新的模型,並重新部署以修正結果 (B) 啟動人工覆核與調整機制,並持續監控族群間預測效果 (C) 記錄模型預測結果並提交備查,待未來法規修正後再行處理 (D) 若模型偏誤屬於高風險用途,可由風控或合規單位先行審視其公平性影響,再決定是否啟動調整機制
22. 請問下列何者不是常見的特徵選取技術或方法? (A) 皮爾森積差相關分析(Pearson Correlation) (B) 主成分分析(Principal Components Analysis, PCA) (C) 迴歸分析(Regression Analysis) (D) 隨機森林(Random Forest)
23. 交叉驗證的主要目的是什麼? (A) 提高模型的訓練速度 (B) 驗證數據是否線性可分 (C) 減少模型的過擬合風險 (D) 測試模型的容錯能力
24. 一家智慧工廠使用機器學習分類模型預測關鍵設備是否會異常停機。完成模型訓練後,團隊希望全面評估模型在不同面向的表現。請問下列哪項指標最適合用來衡量模型在偵測異常停機時的「漏報率」(即未能正確偵測出異常事件的比例)? (A) 準確率(Accuracy),即模型整體預測正確的比例 (B) 召回率(Recall),即模型能正確找出異常停機的比例 (C) F1 分數(F1 Score),準確率與召回率的調和平均數 (D) 假陽性率(False Positive Rate),即將正常事件誤判為異常的比例
25. 神經網路與傳統機器學習模型的主要區別是什麼? (A) 神經網路無法處理非線性數據 (B) 神經網路透過多層結構學習複雜特徵 (C) 神經網路只適用於迴歸問題 (D) 神經網路不需要大量數據支持
26. 下列關於生成對抗網路(GAN)的描述正確的是哪一項? (A) GAN 由生成器和鑑別器組成 (B) GAN 僅用於分類問題 (C) GAN 的結果始終高度可解釋 (D) GAN 不能生成高品質的數據
27. 一位資料分析師希望減少輸入特徵的維度,以提升模型運算效率,並觀 察變數間潛在的整體結構關係。若欲保留最大資訊量、同時減少特徵數量,下列哪一項方法最適合? (A) 套用主成分分析(PCA)以擷取主要變異方向並轉換新變數; (B) 利用離散化方法將連續變數轉為分類型欄位; (C) 使用標準化方法將所有特徵縮放至相同數值區間; (D) 以 ETL 技術移除空值欄位並改儲為 JSON 格式
28. 關於目前生成式 AI 的主要應用,不包括下列哪一項? (A) 創建合成數據樣本 (B) 模擬數據分佈 (C) 分類醫學影像 (D) 生成文本
29. 下列哪項是生成式 AI 支援鑑別式 AI 的典型案例? (A) 模擬交通場景以訓練自動駕駛模型 (B) 使用 CNN 對腫瘤分類 (C) 使用 SVM 分析風險 (D) 創建更好的分類演算法
30. 關於自然語言處理(NLP)核心技術,下列敘述何者不正確? (A) 語音識別技術將語音轉換為文本,並用於語音助理和語音輸入 (B) 自然語言生成技術可以生成自然流暢的文本,用於聊天機器人和自動文案生成 (C) 語意分析技術理解文本的語意,並主要用於語音識別和機器翻譯 (D) 機器翻譯技術自動翻譯文本,促進多語言支援和全球溝通
31. 關於「負責任的 AI」,下列敘述何者較為正確? (A) AI 系統的開發者對 AI 系統的行為負責 (B) AI 系統的使用者對 AI 系統的結果負責 (C) AI 系統本身對其行為負責 (D) 政府對 AI 系統的發展負責
32. 關於生成式 AI 的基本原理,下列敘述何者較正確? (A) 生成式 AI 通過分析大量數據來生成新數據,模擬數據分佈以創造與訓練數據相似的結果 (B) 生成式 AI 主要通過預定義的規則來進行數據處理和分類 (C) 生成式 AI 專注於數據分類和迴歸預測,幫助識別已知數據中的模式 (D) 生成式 AI 通過自動化的方式清洗數據,提升數據分析的準確性
33. 關於下列模型在生成式人工智慧(Generative AI)中的角色,何者並非以「產生新資料」為主要設計目的? (A) 支援向量機(Support Vector Machine) (B) 變分自編碼器(Variational Autoencoder) (C) 自迴歸模型(Autoregressive Model) (D) 擴散模型(Diffusion Model)
34. 某份資料中出現多個欄位(如 score1、score2、score3)儲存相同的成績資訊,造成資料結構重複與使用混淆,此種情形屬於下列哪一種資料品質問題? (A) 重複資料(Duplicate Data) (B) 冗餘資料(Redundant Data) (C) 格式錯誤資料(Malformed Data) (D) 缺失資料(Missing Data)
35. 某電商平台希望預測商品的退貨機率,以協助降低營運風險。若模型使 用的輸入資料包含「商品售價」、「顧客年齡」、「運送天數」,而模型的輸出為是否退貨(是/否)。請問在此模型中,「是否退貨」應歸類為下列哪 一類變數? (A) 特徵(Feature) (B) 標籤(Label / Target) (C) 超參數(Hyperparameter) (D) 正則化係數(Regularization Coefficient)