43.在非結構化(Unstructured)的大數據分析中,下列敘述何者錯誤?
(A)非結構化資料中,資料本身格式相對不固定,資料型態也較為多元
(B)非結構化資料很容易以數位化直接處理及運用
(C)新聞資料通常屬於非結構化資料
(D)非結構化資料的表達及呈現較為直覺清楚,例如:影片、音樂

答案:登入後查看
統計: A(295), B(7756), C(662), D(426), E(0) #3158096

詳解 (共 5 筆)

#6216677

(B) 非結構化資料很容易以數位化直接處理及運用->難。

 

非結構化資料(UnstructuredData)

 

(A)非結構化資料指的是資料本身格式相對不固定,資料的型態也較為多元,但(B)資料的表達及呈現卻也是最直覺清楚,例如一篇文章、一段音樂、一支影片、一個網頁等,內容則具備有完整的意思表現。但是(D)非結構化資料通常較「難」以數位化直接處理及運,例如我們無法快速從一堆小說中找有哪幾篇小說發生地點在台北市?或者從一堆影片中找到女主角的姓名?我們必須經過一些前置處理程序,將這些非結構化資料進行格式標準化,產生對這些非結構化資料的結構化描述資訊,作為未來更多加值的利用。例如若要從每日新聞中發現當天影響股票市場的訊息,從中判斷當日股市/個股可能的漲跌變化(前文中提及大數據資料的真實性待確認,此處不考慮新聞的真實性),(C)新聞資料屬於非結構化的資料,為了將每篇新聞中重要的訊息擷取出來,通常利用斷字斷詞技術,找出文章中名詞、動詞及形容詞,將這些斷詞結果,以結構化方式儲存,再透過語法、語意分析技術來判斷該文章對於股票市場或個股的評價,藉此預測可能的變化。

25
0
#5952943
ch3.大數據、第三節:資料類型2.非結...

(共 71 字,隱藏中)
前往觀看
17
0
#6221414
2024 p66
非結構化資料的格式通常不規則。例如一個pdf 、一個網頁內容、一段音樂、一支影片....我們必須經過一些前置處理程序,將這些非結構化資料進行格式標準化。
8
0
#5956255
43.在非結構化(Unstructu...
(共 268 字,隱藏中)
前往觀看
6
1
#5994360

金融科技力2024 版 p66

0
1

私人筆記 (共 4 筆)

私人筆記#5635203
未解鎖
(B) 非結構化資料很容易以數位化直接處...
(共 128 字,隱藏中)
前往觀看
9
0
私人筆記#5591358
未解鎖
金融科技力 2025 P.66    ...
(共 487 字,隱藏中)
前往觀看
0
0
私人筆記#5599833
未解鎖
43.在非結構化(Unstructur...
(共 155 字,隱藏中)
前往觀看
0
1
私人筆記#7833838
未解鎖
非結構化資料(Unstructured...
(共 138 字,隱藏中)
前往觀看
0
0