41. 在大型語言模型(LLM)的效能優化中，Flash Attention 常被用來改善 Transformer
注意力機制的運算效率。關於 Flash Attention 的主要效益，下列敘述何者最正確？

(A)透過忽略影響較小的注意力權重，減少模型需要計算的關聯數量，以降低運算
成本；

(B)透過調整注意力計算與資料處理方式，減少中間結果的儲存需求，進而改善速
度與資源使用效率；

(C)透過增加注意力計算的並行程度，使模型可同時處理更多注意力頭部；

(D)透過將注意力結果暫存於高速快取記憶體，以避免重複計算造成延遲

答案：登入後查看
統計： 尚無統計資料

相關試題

1. 下列何者不屬於資料整合(Data Integration)的主要目的？ (A)統一不同來源資料的格式與欄位定義，以確保分析一致性； (B)識別並處理重複資料，避免影響模型訓練結果； (C)整併多來源資料，以提升資料完整性與應用價值； (D)依資料保存政策延長原始資料留存期限，以利未來可能的分析需求

2. 某智慧城市專案導入 AI 技術，以優化垃圾收集路線調度並即時監測空氣品質變化。系統需持續蒐集環境數據(如 PM2.5、氣體濃度)與設備狀態(如垃圾桶滿溢度)。下列何種技術最直接支援上述需求？ (A)專家系統(Expert System)； (B)決策支援系統(Decision Support System)； (C)啟發式決策引擎(Heuristic Decision Engine)； (D)感知器網路(Sensor Network)

3. 下列何者不符合非監督式學習(Unsupervised Learning)的典型特徵？ (A)模型可依據資料中的特徵相似性進行自動分群； (B)訓練過程中不需仰賴事先定義的標籤資料； (C)常用於探索資料的潛在結構或隱含模式； (D)模型主要學習輸入特徵與既定目標標記之間的對應關係

4. 某保險公司建立 AI 理賠金額預測模型。歷史理賠資料經檢定後呈近似常態分佈，但仍存在少數極端高額案件。資料科學團隊在不破壞整體分佈特性的前提下，規劃進行離群值處理。下列何者最不適當？ (A)依統計準則(如 Z-score 或 IQR)評估後，再決定是否調整或處理極端值； (B)採用截尾(Trimming)處理極端值，以提升模型穩定性； (C)使用 One-hot 編碼(One-hot Encoding)將離群值轉換為類別特徵以改善數值穩定性； (D)結合領域知識評估其合理性，再決定保留或修正

5. 某銀行建立 AI 詐欺交易偵測模型。歷史交易資料中，詐欺樣本比例極低，導致模型訓練時偏向預測為「正常交易」。資料科學團隊評估採用 SMOTE(Synthetic Minority Over-sampling Technique)改善訓練資料分佈。下列何者最符合 SMOTE 技術的主要功能？ (A)透過隨機刪除部分正常交易資料，以降低類別失衡程度； (B)依據少數類別樣本的特徵空間，合成產生新的少數類別樣本； (C)調整模型的損失函數(Loss Function)權重，使誤判少數類別時的懲罰提高； (D)以交叉驗證(Cross-validation)方式重新分割資料集，使各折資料類別比例一致

6. 資料科學團隊在模型訓練前，需對數值特徵進行正規化(Normalization)或標準化(Standardization)。為確保模型評估結果具真實性並避免資料洩漏(Data Leakage)，下列何者為最適當的作法？ (A)於資料分割前，先對完整資料集計算統計量並進行標準化處理； (B)先分割訓練資料(Training Data)和測試資料(Test Data)，並各自獨立計算統計量後進行標準化； (C)先分割訓練資料(Training Data)和測試資料(Test Data)，僅以訓練資料計算統計量，再套用至測試資料； (D)僅對訓練資料(Training Data)進行標準化處理，測試資料(Test Data)保持原始數值

7. 某電信公司建立機器學習模型預測用戶流失風險。資料中包含多個類別型特徵 (Categorical Features)，例如「資費方案類型」與「客戶地區」。為使模型能有效使用這些特徵，下列何者最直接用於將類別型特徵轉換為模型可處理的數值格式？ (A)資料分群(Data Clustering)； (B)特徵交叉(Feature Cross)； (C)One-hot 編碼(One-hot Encoding)； (D)寬深模型(Wide and Deep)

8. 某零售企業在建置機器學習模型預測顧客購買機率時，資料同時包含大量稀疏類別特徵與數值型特徵。團隊希望模型既能學習過去已出現的特徵組合規律，也能對未出現的特徵組合做出合理預測。下列哪一種模型架構最適合此類需求？ (A)線性迴歸(Linear Regression)； (B)決策樹(Decision Tree)； (C)支援向量機(Support Vector Machine, SVM)； (D)寬深模型(Wide and Deep)

9. 某影音串流平台建立神經網路模型，用於預測使用者最可能感興趣的影片類型。模型輸出層需將結果轉換為各類別的機率分佈，以便系統依機率高低推薦內容。下列哪一種函數最適合用於模型輸出層？ (A)Softmax 函數(Softmax Function)； (B)Sigmoid 函數(Sigmoid Function)； (C)線性函數(Linear Function)； (D)ReLU 函數(Rectified Linear Unit Function)

10. 某設計公司導入生成式 AI(Generative AI)工具，用於自動產生產品概念圖與風格草圖。為了讓系統能依據既有圖像資料產生具有變化且風格一致的新圖像，模型必須具備學習資料特性並生成新樣本的能力。下列哪一種模型技術或方法最符合上述需求？ (A)隱變量自編碼器(Variational Autoencoder, VAE)； (B)隨機森林(Random Forest)； (C)K-近鄰演算法(K-Nearest Neighbors, KNN)； (D)貝氏網路(Bayesian Network)

相關試卷

115年 - 115-1 AI 應用規劃師-初級能力鑑定公告試題_第一科：人工智慧基礎概論#139146

2026 年 · #139146

114年 - 114-4 AI 應用規劃師-初級能力鑑定公告試題：人工智慧基礎概論#139118

2025 年 · #139118

114年 - 114-1 中國工業工程學會_工業工程師等相關證照考試：人工智慧#133860

2025 年 · #133860

114年 - IPAS AI應用規劃師初級能力鑑定-考試樣題(114/09)_科目二：生成式 AI 應用與規劃#132596

2025 年 · #132596

114年 - IPAS AI應用規劃師初級能力鑑定-考試樣題(114/09)_科目一：人工智慧基礎概論#132595

2025 年 · #132595

114年 - iPAS◆AI應用規劃師◆初級-科目1-L1101#130994

2025 年 · #130994

114年 - iPAS AI應用規劃師初級能力鑑定_科目二：生成式 AI 應用與規劃#128027

2025 年 · #128027

114年 - iPAS AI應用規劃師初級能力鑑定_科目一：人工智慧基礎概論#128026

2025 年 · #128026

114年 - iPAS AI應用規劃師能力鑑定初級考試試題#127151

2025 年 · #127151

114年 - 人工智慧與大數據概念測驗#127045

2025 年 · #127045