何為大數據:又被稱為巨量資料(Big data),指的是傳統數據處理應用軟體不足以處理的大型或複雜的數據集的術語。其也可以定義為「來自各種來源的大量非結構化或結構化數據」,從學術角度而言,巨量資料的出現促成廣泛主題的新穎研究,也導致各種巨量資料統計方法的發展。它並沒有統計學的抽樣方法,它只是觀察與追蹤發生的事情。因此,巨量資料通常包含的數據大小超出傳統軟體在可接受的時間內處理的能力。由於技術發展的進步,發布新技術的便捷性,以及全球大多數政府對資訊透明化的高度要求,巨量資料分析在現代越來越突出。
圖書館學定義與內涵:
定義—是一門研究圖書館蒐集、加工、整理、保藏、控制、傳遞和利用文獻訊息的理論、方法、以及圖書館事業發展規律的科學,屬於一門綜合性學科。
內涵—
1.以科學方法,研究圖書館的發展與運作的各種必備知識之理論與實際的學科。
2.圖書館這個機構的資料蒐集與整理,及如何管理這個機構的學問。
3.圖書館因地、時、人而異,以此機構命名之學科,缺少知識體系為邏輯衍生整體,因此科學邏輯要素不嚴謹、分明、完善。
資訊科學:
定義:早期對資訊科學的定義,有些視為一種技術及任務的研究,包括索引、摘要、編寫、翻譯、資訊中心行政管理、使用者文獻檢索、系統分析及資訊研究等方面。也有些將資訊科學與圖書館學區分開來,認為資訊科學應是包含整個資訊傳輸的連續過程。
鮑克(Harold Borko)在美國文獻學會(American Documentation Institute,簡稱ADI)決定改名為美國資訊科學學會(American Society for Information Science,簡稱ASIS)後,提出了對資訊科學的綜合性定義:「資訊科學是研究資訊本質及行為的學科、是管理資訊流向的力量、是為提供最合適的檢索與利用所處理資訊的方法。資訊科學是和資訊的產生、蒐集、組織、貯存、翻譯、傳遞、改變、使用等有關的知識整體。其包括了在自然與人工系統上資訊展現的研究、有效訊息傳遞中符號的使用、及如電腦硬軟體等資訊處理的裝置與技術之研究。它也是一種跨學科的科學,衍生於或相關於數學、邏輯學、語言學、心理學、電腦技術、作業研究、繪圖藝術、通訊、圖書館學、及管理科學等領域。而資訊科學同時具有純科學的成分與應用科學的成分。」
內涵:
1.關心資訊的本質、通道/載體、使用者
2.負載知識的文獻,提供有獲取與使用的系統與技術
3.資訊儲存與檢索理論,並尋找實證規律、行為法則的研究
Machlup與Mansfile的看法(由四種層面來看)
(1)在最廣的層次而言,它包括任何針對資訊進行系統性研究的學科
(2)電腦科學:資訊代表以電腦為資訊處理器的資訊研究
(3)圖書館學與資訊科學:代表以新法訪與新科技的運用來處理圖書館業務的學問
(4)狹義而言,資訊科學關心的是對科技資訊交流的研究,資訊系統與服務的研討
●Shere的看法
(1)資訊科學的目標是提供一個能提供文獻檢索的系統。
(2)資訊科學是一個探究與研究的領域。
圖書資訊學
定義:於20世紀70年代由圖書館學與資訊學兩大領域合併而成。圖書館學側重於圖書館業務流程和相關學科的研究,包括圖書館哲學、圖書館學理論、圖書館管理和圖書館業務技術等。
內涵:
1. 吳美美教授於《重新定義圖書館與圖書資訊學》一文中談到「圖書館學」與「資訊科學」逐漸整合,主要原因為兩者之研究基礎均建立在使用者(人)、資訊(文獻、知識、資料)、承載資訊的新儲存媒體與傳播科技,相同的研究對象、環境與目的促成兩者之結合。
2. 美國圖書館學會於《圖書館與資訊研究碩士學程認可標準》中界定「圖書館與資訊研究」為「研究可記錄性資訊與知識,增進其管理與利用之服務與技術的一門學科,此學科涵蓋資訊與知識之創造、溝通、辨識、選擇、採訪、徵集、組織與描述、儲存與檢索、保存、分析、解釋、評估、綜合、傳播及管理。」
3. 綜合各項定義,「圖書資訊學」因應資訊社會的需求,由圖書館機構為主體,轉變為以資訊為中心的發展,以使用者、資訊、載體為主軸,研究可記錄性資訊與知識,增進其管理與應用的學科。
資料科學
定義:是一門利用資料學習知識的學科,其目標是通過從資料中提取出有價值的部分來生產資料產品。它結合了諸多領域中的理論和技術,包括應用數學、統計、圖型識別、機器學習、資料視覺化、資料倉儲以及高效能計算。資料科學通過運用各種相關的資料來幫助非專業人士理解問題。 資料科學技術可以幫助我們如何正確的處理資料並協助我們在生物學、社會科學、人類學等領域進行研究調研。此外,資料科學也對商業競爭有極大的幫助。
內涵:因為現今資料量太過龐大,而且也有許多是影片、語音類的資料,因此資料科學其中一個重要的步驟就是抓取、判讀、清洗資料。而其延伸研究方法包括機器學習、資料探勘、語意分析等等。機器學習和人工智慧的發展大大的提升了資料科學的成長性,許多資料科學家都是利用程式去抓取、清洗大量的資料。另外也因為社群網路的發達,分析社群網站的資訊也是資料科學的熱門研究方向。資料科學家會經由蒐集、觀察資料,提出假設,然後再去驗證結果。在整個過程中會需要用到蒐集、篩選、分析數據的能力,並且資料科學家也需要學會管理各種不同的數據,另外也需要擁有處理資料視覺化的能力。資料科學目前在許多領域都有相關的應用,包括翻譯,語音識別,機器人,搜索引擎,數位行銷等等,同時也與生命科學、醫學、人文社會科學等相關研究領域合作。
四者之同:同樣都是為了提升對於讀者能夠好好善用資訊、並且能夠為了更好的保藏、統整、加工、蒐集資訊,而誕生出來的不同的使用方法。
四者之異:圖書館學主要是著重在以理論來探討和解決問題的方法;而資訊科學則是著重在於以實務來進行資訊儲存與關心的是對科技資訊交流的研究,資訊系統與服務的研討;而圖書資訊學則是著重在以資訊為中心的發展,以使用者、資訊、載體為主軸,研究可記錄性資訊與知識,增進其管理與應用的學科;而資料科學則是著重在蒐集、觀察資料,提出假設,然後再去驗證結果。在整個過程中會需要用到蒐集、篩選、分析數據的能力。