2.下列何者最適合訓練電腦下圍棋、自動駕駛等動態重複地互動的問題？
(A) 監督式學習(Supervised Learning)
(B) 非監督式學習(Unsupervised Learning)
(C) 半監督式學習(Semi-supervised Learning)
(D)強化學習(Reinforcement Learning)

答案：登入後查看
統計： A(48), B(24), C(16), D(490), E(0) #3416788

詳解 (共 2 筆)

C17

B2 · 2025/04/02

#6356664

圍棋、自動駕駛等動態重複地互動，比較適合...

(共 451 字，隱藏中）

前往觀看

鄭祖安

B1 · 2025/04/01

#6355780

最適合訓練電腦進行圍棋對弈、自動駕駛等動態且需要重複互動的問題的是 (D) 強化學習 (Reinforcement Learning)。
強化學習是一種機器學習方法，讓代理人 (agent) 在環境中反覆進行決策，透過試錯來學習最佳策略。在這種學習過程中，代理人會根據行動獲得獎勵或懲罰，進而調整其策略，以最大化累積獎勵。這種方法特別適用於需要連續決策並與環境進行互動的問題，如：

其他選項簡要比較：

圍棋：電腦圍棋程式，如 AlphaGo，就是利用強化學習來學習並超越人類棋手。

自動駕駛：透過強化學習，車輛能根據感測器數據和環境狀態進行決策，提高行駛安全性和效率。

私人筆記 (共 1 筆)

一個月就上榜

2025/05/01

私人筆記#6930665

未解鎖

補充相關知識速解及口訣來了~ 關鍵判...

(共 201 字，隱藏中）

前往觀看

2.下列何者最適合訓練電腦下圍棋、自動駕駛等動態重複地互動的問題？
(A) 監督式學習(Supervised Learning)
(B) 非監督式學習(Unsupervised Learning)
(C) 半監督式學習(Semi-supervised Learning)
(D)強化學習(Reinforcement Learning)

詳解 (共 2 筆)

私人筆記 (共 1 筆)

相關試題

相關試卷

2.下列何者最適合訓練電腦下圍棋、自動駕駛等動態重複地互動的問題？ (A) 監督式學習(Supervised Learning) (B) 非監督式學習(Unsupervised Learning) (C) 半監督式學習(Semi-supervised Learning) (D)強化學習(Reinforcement Learning)

詳解 (共 2 筆)

私人筆記 (共 1 筆)

相關試題

相關試卷

2.下列何者最適合訓練電腦下圍棋、自動駕駛等動態重複地互動的問題？
(A) 監督式學習(Supervised Learning)
(B) 非監督式學習(Unsupervised Learning)
(C) 半監督式學習(Semi-supervised Learning)
(D)強化學習(Reinforcement Learning)