43.在非結構化(Unstructured)的大數據分析中,下列敘述何者錯誤?
(A)非結構化資料中,資料本身格式相對不固定,資料型態也較為多元
(B)非結構化資料很容易以數位化直接處理及運用
(C)新聞資料通常屬於非結構化資料
(D)非結構化資料的表達及呈現較為直覺清楚,例如:影片、音樂
答案:登入後查看
統計: A(295), B(7756), C(662), D(426), E(0) #3158096
統計: A(295), B(7756), C(662), D(426), E(0) #3158096
詳解 (共 5 筆)
#6216677
(B) 非結構化資料很容易以數位化直接處理及運用->難。
(A)非結構化資料指的是資料本身格式相對不固定,資料的型態也較為多元,但(B)資料的表達及呈現卻也是最直覺清楚,例如一篇文章、一段音樂、一支影片、一個網頁等,內容則具備有完整的意思表現。但是(D)非結構化資料通常較「難」以數位化直接處理及運用,例如我們無法快速從一堆小說中找有哪幾篇小說發生地點在台北市?或者從一堆影片中找到女主角的姓名?我們必須經過一些前置處理程序,將這些非結構化資料進行格式標準化,產生對這些非結構化資料的結構化描述資訊,作為未來更多加值的利用。例如若要從每日新聞中發現當天影響股票市場的訊息,從中判斷當日股市/個股可能的漲跌變化(前文中提及大數據資料的真實性待確認,此處不考慮新聞的真實性),(C)新聞資料屬於非結構化的資料,為了將每篇新聞中重要的訊息擷取出來,通常利用斷字斷詞技術,找出文章中名詞、動詞及形容詞,將這些斷詞結果,以結構化方式儲存,再透過語法、語意分析技術來判斷該文章對於股票市場或個股的評價,藉此預測可能的變化。
25
0
#6221414
2024 p66
非結構化資料的格式通常不規則。例如一個pdf 、一個網頁內容、一段音樂、一支影片....我們必須經過一些前置處理程序,將這些非結構化資料進行格式標準化。
8
0
#5994360
金融科技力2024 版 p66
0
1