阿摩線上測驗 登入

申論題資訊

試卷:109年 - 109 臺灣銀行_新進人員甄試_七職等-電子金融-數據分析人員:數據分析#88192
科目:數據分析
年份:109年
排序:0

題組內容

第二題: 在建立資料預測模型時,通常會將手頭上所持有的資料區分為兩大類,包含訓練資料集 (training set) 與測試資料集(test set),請回答下列問題:

申論題內容

(一)請簡述「訓練資料集」與「測試資料集」的各自用途為何?【5 分】

詳解 (共 1 筆)

詳解 提供者:hchungw

訓練資料集(Training Set):
訓練資料集是用來建立或訓練模型的資料。在機器學習中,這部分的資料用來讓演算法辨識和學習資料中的模式和關聯性。模型會試著在這些資料上進行學習,以便能夠準確地從輸入變量預測目標變量。訓練過程中,模型的參數會根據訓練資料進行調整,目的是最小化預測誤差或損失函數。

測試資料集(Test Set):
測試資料集是在模型訓練完畢後用來評估模型泛化能力的資料。它不會在訓練過程中被使用,因此模型未曾見過這些資料。通過在測試資料集上評估模型,我們可以得到模型對於未知數據的預測能力,這可以幫助我們評估模型的實際效能,並檢測是否存在過擬合(Overfitting)的問題。過擬合指的是模型對訓練資料學得太好,以至於失去了對新、未見過資料的預測能力。

總之,訓練集用於建立模型,而測試集用於評估模型的預測性能和泛化能力。這種區分確保了模型評估的公正性和客觀性,是避免模型過度擬合訓練數據的重要步驟。