阿摩線上測驗
登入
首頁
>
國營事業◆1.統計學 2.巨量資料概論
> 104年 - 104 經濟部所屬事業機構_新進職員甄試_統計資訊:1.統計學 2.巨量資料概論#71785
104年 - 104 經濟部所屬事業機構_新進職員甄試_統計資訊:1.統計學 2.巨量資料概論#71785
科目:
國營事業◆1.統計學 2.巨量資料概論 |
年份:
104年 |
選擇題數:
25 |
申論題數:
0
試卷資訊
所屬科目:
國營事業◆1.統計學 2.巨量資料概論
選擇題 (25)
1. 抽樣分配是指下列何者的分配? (A)母數 (B)統計量 (C)母數與統計量 (D)非母數也非統計量
2. 某一公司有4個零件供應商(S1、S2、S3、S4),其零件在S1、S2、S3、S4之供應比例分別是 30%、20%、10%、40%,根據該公司之統計S1、S2、S3、S4所供應的零件之不良率分別是 2%、4%、3%、2%,如果該公司隨機抽出一個零件為不良品,則該零件來自S2供應商的機率為下列何者? (A) 0.008 (B) 0.2 (C) 0.24 (D) 0.32
3. 某甲欲研析全臺灣地區加油站之服務量,而執行一抽樣調查以推估總服務量,為顧及各地區之特性,宜使用下列何種抽樣設計? (A)集群抽樣 (B)分層抽樣 (C)簡單隨機抽樣取出不放回 (D)簡單隨機抽樣取出放回
4. 在簡單線性迴歸模型,斜率的估計值代表下列何種意涵? (A)在獨立變數為0時,依變數的平均估計值 (B)在獨立變數為0時,依變數的估計值 (C)當獨立變數變動一單位時,依變數的平均變動估計值 (D)觀察值的預測值
5. 下列何者正確? (A)互斥事件彼此獨立 (B)獨立事件彼此互斥 (C)互斥事件不會同時發生 (D)獨立事件彼此互相影響
6. 若每一個可能的樣本被抽到的機會相等,此抽樣方法為下列何者? (A)簡單隨機抽樣(Simple random sampling) (B)分層隨機抽樣(Stratified random sampling) (C)部落抽樣(Cluster sampling) (D)系統抽樣(Systematic sampling)
7. 若A與B事件互相獨立,
為下列何者? (A) 0 (B) 0.17 (C) 0.38 (D) 0.55
8. 某甲欲研析新設加油站之顧客平均等待時間,作為安排服務人員人數之依據,請問下列哪一種分配最適合用來描述兩位顧客到達該加油站的時間間隔? (A)常態分配(Normal distribution) (B)卜瓦松分配(Poisson distribution) (C)指數分配(Exponential distribution) (D)二項分配(Binomial distribution)
9. X,Y為二服從標準常態分配之隨機變數且兩者獨立,則下列何者有誤? (A) E(X/Y) = 1 (B) E(X+Y) = 0 (C) E(X2+Y2) = 2 (D) E(X-Y) = 0
10. 樣本統計量的期望值等於所欲估計的母數時,則此樣本統計量具有下列何種特性? (A)最小變方 (B)隨機性 (C)不偏性 (D)一致性
11. 統計學家證實,要提高抽樣的準確度,最好的方式為下列何者? (A)增加樣本數 (B)做到隨機抽樣 (C)使用最精準的分析軟體 (D)使用速度最快的電腦硬體
12. 下列何者不是用於資料的相關性分析(Correlation Analysis)? (A)卡方檢定 (B)相關係數 (C)共變異數 (D)四分位數
13. 分析資料、建構模型來預測顧客的貸款申請是「安全的」或「有風險的」,是下列何者? (A)關聯規則探勘 (B)分類 (C)迴歸 (D)群集分析
14. 下列何者為巨量資料最適當的定義? (A)巨大資料量的資料集 (B)資料量大於1 TB的資料集 (C)資料量超出傳統資料庫的抓取、儲存、管理和分析能力的資料集 (D)資料量超出人類的抓取、儲存、管理和分析能力的資料集
15. 巨量資料會使分析資訊的方式產生三大改變,不包括下列何者? (A)能夠取得、分析的資料量大為增加 (B)不會堅持一切都要做到精準 (C)放下長久以來對於因果關係的堅持 (D)不需找出資料之間的相關性
16. 關於巨量資料分析的概念,下列何者正確? (A)巨量資料分析主要是針對量大的數據分析,因此對於資料來源多樣性和資料產生快慢等因素將不列入考慮 (B)巨量資料分析的資料格式僅限於結構化資料,因此非結構化與半結構化資料不納入其分析的範疇 (C)巨量資料分析的建模是透過由下而上(Bottom-Up)的數學歸納推理方式來解讀資料的規則 ,這和傳統資料庫系統以由上而下(Top-Down)的建模方式有所不同 (D)巨量資料分析方法可以利用現有資料庫管理系統技術來完成
17. 關於分類的訓練資料集與測試資料集的敘述,下列何者有誤? (A)訓練資料是從要分析的資料庫中隨機取樣 (B)訓練資料必須已經知道其類別 (C)測試資料集不應該包含訓練資料集中的資料 (D)測試資料可以不知道其類別
18. 請問機器學習(Machine Learning)上所使用的深化學習(Deep Learning)和下列哪一個演算法有直接相關連? (A)類神經網路 (B)迴歸分析 (C)貝氏網路 (D)決策樹
19. 巨量資料分析是一連串分階段流程的處理步驟(Pipeline),針對此巨量資料分析的流程,下列 何者正確? (A) ETL(Extract Transform Load)的處理是屬於此分析流程中最後階段 (B)現階段我們已經有一套資訊系統可以完整涵蓋所有巨量資料分析的階段流程 (C)統計學習的建模與分析因為需大量人力介入,因此是獨立出來的步驟,所以它不屬於巨量資料分析流程的一環 (D)巨量資料分析流程必須要透過人為的介入與客製化的操作,因此目前整個巨量資料分析流程尚無法完全自動化完成
20. 一般巨量資料處理的單位為PB級;1 PB的資料為1 GB資料的幾倍大? (A) 1,000 (B) 1,000,000 (C) 1,000,000,000 (D) 1,000,000,000,000
21. 下列哪一項資訊技術和巨量資料最不相關? (A)資料探勘 (B)物件導向軟體開發 (C) Hadoop (D) NoSQL
22. 對於決策樹(Decision Tree)機器學習演算法,下列何者有誤? (A)決策樹最末端葉面點(Leaves)是標示資料分類別的結果 (B)決策樹中間的點是提供資料分類時特徵值的判斷 (C)決策樹的分類需要將所有訓練資料集的資料正確分類 (D)隨機樹叢(Random Forest)演算法是整合多個小決策樹來進行資料分類
23. 關於Hadoop的敘述,下列何者有誤? (A) Hadoop的做法,是將資料打散成小塊,分散到不同的電腦中 (B)由於資料量夠大,Hadoop不會儲存資料的備份 (C) Hadoop預設,由於資料量十分龐大,所以不可能在處理之前就清理乾淨、排序整齊 (D)與過去的關聯式資料庫相比,Hadoop輸出的結果比較不準確
24. 如果使用者在MapReduce中打算使用外部執行檔來定義其工作,需要利用下列何者? (A) Virtual Machine (B) Streaming (C) Pipeline (D) Filter
25. 下列何者是知識發現(Knowledge Discovery)的正確程序? (A)資料探勘、資料準備、樣式評估、知識呈現 (B)資料準備、資料探勘、樣式評估、知識呈現 (C)資料準備、樣式評估、資料探勘、知識呈現 (D)資料準備、資料探勘、知識呈現、樣式評估
申論題 (0)