25 在驗證生成式 AI 應用的概念驗證(Proof of Concept, POC)時，若企業希望確保模型生成的公平性，最適合採用哪種評估策略？ (A) 壓力測試(Stress Testing) (B) 對抗性測試(Adversarial Testing) (C) 偏差檢測(Bias Detection) (D) 延遲測試(Latency Testing)

。

B1 · 2025/07/03

#6518538

正確答案：(C) 偏差檢測 (Bias...

(共 274 字，隱藏中）

前往觀看

10

0

halk92312

B2 · 2025/10/21

#6939967

這題的關鍵詞是「確保模型生成的公平性」。在 AI 領域中，「公平性」（Fairness）對應的評估策略就是「偏差檢測」（Bias Detection）。

(C) 偏差檢測(Bias Detection):
- 目的： 專門用來評估 AI 模型是否對特定群體（例如基於性別、種族、年齡、宗教等）產生不公平、帶有偏見或刻板印象的輸出。
- 方法： 這會涉及設計特定的測試集和提示詞，比較模型在不同受保護群體上的表現是否一致，以確保其輸出的「公平性」。

(A) 壓力測試(Stress Testing): 這是為了測試系統在極端負載（例如大量用戶同時請求）下的穩定性和效能，與「公平性」無關。
(B) 對抗性測試(Adversarial Testing): 這是測試模型在面對「惡意」或「非預期」的輸入時的安全性與穩健性（Robustness），例如測試模型是否容易被誘導產生有害內容或洩漏資訊。雖然它可以被用來引發偏見，但它的核心目標是「安全性」和「穩健性」，而非「公平性」本身。
(D) 延遲測試(Latency Testing): 這是測試模型產生回應所需的時間（即速度），屬於效能評估，與「公平性」無關。

1

0

風之遊子

B3 · 2025/12/31

#7269670

這題的正確答案是：

作為 AI 規劃師，在企業導入生成式 AI 的 POC 階段，「負責任的 AI (Responsible AI)」是至關重要的一環，而公平性 (Fairness) 正是其核心指標。

1. 為什麼是 (C) 偏差檢測？

定義對應： 在 AI 領域中，「公平性」的相反詞即是「偏差 (Bias)」。如果模型對特定性別、種族、年齡或社會群體產生歧視性或刻板印象的內容，即視為不公平。
執行方式： 偏差檢測策略會使用特定的資料集或提示詞（Prompts）來掃描模型。例如，輸入「醫生正在做什麼？」，檢查模型生成的圖片是否全為男性；或輸入關於特定族群的描述，檢查是否帶有負面情緒詞彙。
目的： 透過量化這些偏差（例如計算不同群體的呈現比例），企業才能在系統上線前進行微調或設置過濾器，確保輸出的公平性。

2. 為什麼其他選項不是針對公平性？

❌ (A) 壓力測試 (Stress Testing)：
- 這是效能 (Performance) 相關的測試。目的是在極高流量或並發請求下，測試系統會不會崩潰、伺服器資源是否足夠。這與內容是否公平無關。
❌ (B) 對抗性測試 (Adversarial Testing)：
- 這是安全性 (Security) 與魯棒性 (Robustness) 的測試。目的是透過惡意設計的輸入（例如隱藏雜訊或誘導性指令）來試圖「欺騙」模型，讓它輸出錯誤結果或繞過安全機制（Jailbreak）。雖然紅隊演練（Red Teaming）有時也會包含誘導偏見，但就「確保公平性」這個特定目標而言，(C) 才是最直接的定義。
❌ (D) 延遲測試 (Latency Testing)：
- 這是使用者體驗 (UX) 相關的測試。目的是測量從發出請求到收到回應所需的時間（毫秒數）。

在 POC 階段，我通常建議客戶使用具體的指標與工具來執行偏差檢測，例如：

0