2 下列何者最適合訓練電腦下圍棋、自動駕駛等動態重複地互動的問題?
(A) 監督式學習(Supervised Learning)
(B) 非監督式學習(Unsupervised Learning)
(C) 半監督式學習(Semi-supervised Learning)
(D)強化學習(Reinforcement Learning)
答案:登入後查看
統計: A(92), B(30), C(26), D(822), E(0) #3472193
統計: A(92), B(30), C(26), D(822), E(0) #3472193
詳解 (共 2 筆)
#6598292
在訓練電腦下圍棋、自動駕駛等動態重複互動的問題中,最適合的選擇是:
(D) 強化學習 (Reinforcement Learning)
理由:
- 強化學習 是一種讓智能體在環境中學習的方式,通過與環境的互動來獲得回饋,並根據回饋調整行為策略。這非常適合需要動態決策和長期策略的問題,如圍棋和自動駕駛。
- 其他選項如監督式學習和非監督式學習主要用於靜態數據集,並不適合處理需要持續互動和即時反應的情境。
4
1