5. 某企業以詞頻–逆文件頻率(Term Frequency–Inverse Document Frequency, TF-IDF)方法分析顧客意見內容,但發現模型在處理篇幅較長的回饋文本時,無法準確反映關鍵詞的重要性。下列何者為造成此現象的主要原因?
(A)長文本中的詞頻偏高,導致常見詞權重被過度放大;
(B)長文本中缺乏明確句子邊界,造成 TF-IDF 無法計算詞頻;
(C)TF-IDF 無法同時處理多份文件;
(D)長文本會改變 IDF(Inverse Document Frequency)的計算,使所 有詞權重趨於相近
答案:登入後查看
統計: A(1), B(0), C(0), D(1), E(0) #3773556
統計: A(1), B(0), C(0), D(1), E(0) #3773556