27.國小高年級學生國語科成就測驗,若能嚴格依據九年一貫課程之能力指標及國小高年級課程
綱要編訂試題,則這個測驗具備何種效度?
(A)內容效度
(B)同時效度
(C)預測效度
(D)建構效度
統計: A(2297), B(281), C(175), D(633), E(0) #37809
詳解 (共 7 筆)
內容效度(content validity):是指該衡量工具能足夠涵蓋主題的程度 。
‧從測量工具的內容來檢查,看看是否符合測量目標所預期的內容。
‧強調測量內容的廣度、涵蓋性與豐富性。
‧針對測量工具的目標和內容,以系統的邏輯方法(雙向細目表)來詳細分析,
又稱為邏輯效度。
效度是指一個測量工具是否能真正測量出所欲測量事物的特質或功能的程度;換句話說,效度的判別是把測量結果用來解釋測量主題的程度。
1.表面效度(Face Validity):指測量工具經由受試者或研究者主觀覺得與研究主題相關(也就是一看到測量工具,就知道研究者想測量什麼,所以是最沒有效力的一種)。例如我們設計一份「案主對機構服務的滿意度」問卷,案主或你的同事一看到問卷內容就知道大概是在做滿意度調查。
2. 內容效度(Content Validity):指某測驗之題目內容是否周延、具代表性、適切性、並確實包含所欲測量主題的內涵;通常為了讓問卷具有內容效度,我們會盡量去詢問專家的意見或參考文獻。例如我們在設計憂鬱症量表,我們可以根據DSM-IV將憂鬱症所包含行為及心情等表徵納入問卷設計中;例如在設計「同性戀者對社會適應的程度」的問卷量表,由於現有文獻不是很充足,我們必須去諮詢專家的意見,使量表更周延、適切。
3. 建構效度(Construct Validity):最複雜、也最簡單的一種測量效度的方法。其實就是指某測驗能測量某個理論的概念的程度(考試常考)。如果這個測量工具與某些概念的相關聯性很高,我們稱為Convergent Validity;反之,測量工具與另一些概念沒有相關性則稱為Discriminant Validity。通常實務工作者不太會用到這個方法,只有那種要測量理論概念的學者比較會用的到。例如我們想要設計一份關於「自尊」的問卷以了解這個概念,由於我們知道自尊跟「自信」的概念很相似(正相關;即自尊越高,自信越高),跟「自卑」的概念剛好相反(負相關;即自尊越多,自卑越少),我們透過文獻找出測量兩者的量表,讓同一群受試者填寫,若你設計的自尊量表與自信量表測出的結果有高度正相關,與自卑量表呈現負相關,我們說你的量表具有建構效度中的Convergent Validity。
4. 效標關聯效度(Criterion-related Validity):即測驗分數與效標之間的相關係數(白話文就是在測量某個主題時,拿我們設計的問卷A跟別人設計的問卷B同時或在不同時間給受試者填寫,把兩次的結果A1&B1拿來做相關係數的比較;聽起來跟建構效度很像,不同的是建構效度是在測量理論的概念,效標關聯效度在測量其他具體的東西。效標:測量工具所欲測量之特質的獨立量數;即檢定測量工具效度的標準;也就是用問卷B去測我們要測的主題,產生的結果B1。)
§效標關聯效度可以依照效標取得的時間分成下列幾種:
(1) 同時效度Concurrent Validity: 指效標分數與測驗分數同時取得,因此可以估計測驗分數在效標方面的實際表現。例如社工在執行課輔活動時可以設計一個英文成就測驗A,讓學生在段考前一天施測,之後再將測驗的成績A1與學生在學校的英文段考分數B1(英文段考考卷是B)作比較,如果成就測驗的成績A1與學校段考成績B1呈現高度相關,那我們可以說你的成就測驗具有同時效度(表示學生的英文成就測驗分數越高,其段考成績也會越高;雖然聽起來成就測驗A有預測的效果,但因為兩者的分數幾乎是同時取得,所以稱為同時效度)。
(2) 預測效度Predictive Validity:指測驗分數與將來效標資料之相關程度;若相關係數高,則測驗工具的預測效度越高。例如高中時,輔導室曾讓我們填寫就業性向測驗,此一測驗即可用預測效度來檢驗其效度;在這邊,效標就是我們未來的職業,研究者可以在數年後做電話追蹤,了解受試者在數年後的職業發展,如果結果跟當初的測驗成績有很高的相關,則這份測量工具有很高的預測效度。此外,我們也可以拿第一次段考成績跟第二次段考成績來做預測效度的檢驗(因兩者不是同時取得)。
(3) 區分效度Differential Validity:拿兩種不同的測驗工具當做效標,分別與我們設計的工具的測驗結果求算相關係數,兩者的差即為區分效度。如上例,我們拿兩種不性質的就業性向問卷作為校標,分別計算與我們的測驗分數的相關係數,兩者的差可以表示擇業的成功性。
▲影響效度的因素:
(1) 測驗內容:內容效度不佳,測量工具不具適切性、廣泛性、問句用語太艱澀、試題太多…
(2) 測量情境:是否具有標準化
(3) 受試者 (同Reliability),此外受試者之樣本抽取是否符合研究目的
(4) 效標的使用不客觀、不可靠、不易取得、或無法適切反應測量之目的。
★信度是指測量結果的一致性、穩定性及可靠性,一般多以內部一致性來加以表示該測驗信度的高低。
信度指測驗分數的一致性或穩定性
信度:在不同時間,測量同一群受試者兩次,所得結果的一致性
(用同樣的測驗)
信度意指即使不同評分者、不同情境測試,結果都穩定。
信度底下有:
重測信度─【穩定係數】 ,若希望用測驗分數做長時間的預測,就用重測信度。
複本信度─【等值係數、等值與穩定係數】,若測驗目的只想推論個人在某一學科領域中所具有的知識程度,
就用複本信度。複本信度是兩個複本測驗實施於一群相同的受試者,依據所測得的分數求相關。
內部一致性信度─【折半方法(內部一致性係數)、庫李方法、α係數】
成就測驗必須以教材內容為根據,所以會重視內容效度,一般會使用雙項細目表來檢視「教學目標」、「教材內容」是否有適當的分配,其目的在提高測驗的內容效度
內容效度(這測驗內容合不合適、有沒有代表性)
內容效度→確定測驗內容對於所欲測量的領域有沒有代表性
效標效度→預測或估計某些行為表現
構念效度→測驗能夠說明理論上的構念或特質的程度
構念效度(測驗有沒有符合理論?測驗結果符合理論構念的程度)
效標效度(經驗效度、統計效度)
效標效度裡有:
同時效度:指測驗分數與實施測驗同一個時間所取得的效標之間的相關
預測效度:指測驗分數與實施測驗後一段時間所取得的效標之間的相關
錯的還是一直錯>"<