2 下列何者最適合訓練電腦下圍棋、自動駕駛等動態重複地互動的問題？
(A) 監督式學習(Supervised Learning)
(B) 非監督式學習(Unsupervised Learning)
(C) 半監督式學習(Semi-supervised Learning)
(D)強化學習(Reinforcement Learning)

答案：登入後查看
統計： A(92), B(30), C(26), D(822), E(0) #3472193

。

B1 · 2025/07/03

#6518562

正確答案：(D) 強化學習 (Rein...

(共 292 字，隱藏中）

前往觀看

jacky chou

B2 · 2025/08/10

#6598292

在訓練電腦下圍棋、自動駕駛等動態重複互動的問題中，最適合的選擇是：

(D) 強化學習 (Reinforcement Learning)

強化學習 是一種讓智能體在環境中學習的方式，通過與環境的互動來獲得回饋，並根據回饋調整行為策略。這非常適合需要動態決策和長期策略的問題，如圍棋和自動駕駛。
其他選項如監督式學習和非監督式學習主要用於靜態數據集，並不適合處理需要持續互動和即時反應的情境。