題組內容

一、某公司欲建立【考績】的預測模型,假設【表 1】是 10 名員工的資料,請以此為例,依序 回答下列問題。
5fb229a55fe08.jpg

(一)採用 k-均值分群法(k-means clustering)將【年齡】分成青年與壯年二族群,以標籤取代 數值,離散化(discretization)或稱二分法(dichotomization)的結果為何?請簡述計算過 程,而且要明確指出哪些員工被歸類為青年,哪些屬於壯年。(10 分)