30. 某情感分析模型在英文資料集上取得 macro F1-score = 0.91。當該模型部署於西班牙文資料集時,F1-score 驟降至 0.58。下列哪一項解釋最合理,且與 F1-score 變化相關?
(A)macro F1-score 本身波動性高,建議改用 micro-average F1-score 評估;
(B)模型在西班牙文語料上過度擬合,導致評估結果偏高;
(C)語言轉移造成召回率(Recall)下降,模型無法正確辨識關鍵情緒詞 彙;
(D)以均方誤差(MSE)取代 F1-score 評估可獲得更準確的結果
答案:登入後查看
統計: A(0), B(0), C(2), D(0), E(0) #3774704
統計: A(0), B(0), C(2), D(0), E(0) #3774704