13.在使用線性模型時,下列哪一種方法用來將名目(Nominal)類型資料轉 為實數(Real Number)類型資料,可以最公平的進行轉換而沒有對特定的 可能值(Possible Value)造成偏差?
(A) 直接將所有不同數值轉為單一維度的布林值,如將性別(男、女)轉為二 維向量男=(1,0)及女=(0,1)
(B) 依照名目(Nominal)類型資料的數值資訊轉為相對應的實數值,如將體 重(過重、一般、過輕)轉為(1, 0, -1)
(C) 直接將特徵值給予對應的實數值,如將天氣(晴、陰、雨)轉為(0, 1, 2)
(D) 依照特徵值給予範圍內隨機數值,如里程(遠、中、近)分別給予 100~ 1000(遠)、50~100(中)、0~50(近)的隨機數值

答案:登入後查看
統計: A(32), B(6), C(0), D(11), E(0) #3103438

詳解 (共 1 筆)

#6324663

(A) 直接將所有不同數值轉為單一維度的布林值,如將性別(男、女)轉為二維向量男=(1,0)及女=(0,1)

解析:

當使用 線性模型 (Linear Models) 進行機器學習時,名目 (Nominal) 類型的特徵 需要轉換為數值型特徵,因為線性模型無法直接處理類別變數。

最公平且不造成偏差的方式是 獨熱編碼 (One-Hot Encoding, OHE),即將每個類別值轉換為多維的二進制向量,這樣能避免數值大小帶來的錯誤影響。

選項分析

(A) 直接將所有不同數值轉為單一維度的布林值(One-Hot Encoding, OHE) ✅最公平,正確選項

  • One-Hot Encoding (OHE) 是最常見的類別數據轉換方法,適用於線性模型,且不會造成數值偏差
  • 例如,性別「男、女」可轉換為:
    • 男 → (1, 0)
    • 女 → (0, 1)
  • 優點
    • 不會產生數值大小的誤導,例如「男=1, 女=2」會讓模型誤以為「女」比「男」大,這是不合理的。
    • 這種編碼方式不會引入數值關係的偏差,適合線性模型。

(B) 依照名目類型資料的數值資訊轉為相對應的實數值,如將體重(過重、一般、過輕)轉為(1, 0, -1) ❌錯誤

  • 這種轉換方式會引入數值關係,但體重的類別 (過重、一般、過輕) 並不一定符合線性數值變化的關係。
  • 例如,「過重=1, 一般=0, 過輕=-1」會讓模型誤以為「過重」與「過輕」在數值上是對稱的,這並不合理。

(C) 直接將特徵值給予對應的實數值,如將天氣(晴、陰、雨)轉為(0, 1, 2) ❌錯誤

  • 名目型 (Nominal) 數據是沒有順序關係的,但這種方法會讓模型誤以為「晴 < 陰 < 雨」有數值大小的關係,導致偏差。

(D) 依照特徵值給予範圍內隨機數值,如里程(遠、中、近)分別給予 100~1000(遠)、50~100(中)、0~50(近)的隨機數值 ❌錯誤

  • 隨機數值會引入不穩定性,模型無法學到穩定的數據模式。
  • 例如,每次運行模型時,「遠」的數值可能不同,這會影響模型的一致性和準確性。

結論

最公平、最不會造成數值偏差的方式是 (A) One-Hot Encoding,因為它不會引入數值順序的誤導,適合線性模型。

0
0