。
經(jīng)典測量理論(The Classical Test Theory,CTT)借用普通物理測量的類似方法,對考生回答的結(jié)果與其心理特質(zhì)存在的誤差進行分析,形成區(qū)分度、等值、信度、效度等概念,使用相當(dāng)廣泛。它的不足是信度估計不精確、難度量表與能力量表不一致。
項目反應(yīng)理論(The Item Response Theory,IRT)建立在考生潛在能力的基礎(chǔ)上,研究考生對試題的反應(yīng)與其潛在能力之間的關(guān)系。優(yōu)點是通過模型測試考生能力可以精確估計測量誤差,對考生能力的估計不依賴于題目的特殊選擇。缺點是假設(shè)過于理想,技術(shù)復(fù)雜,可操作性差。
3.難度與區(qū)分度
在經(jīng)典測量理論中,難度就是考生答題時感到的困難程度,用考生群體在該題目上的通過率或得分率表示,又稱為統(tǒng)計難度。它用0~1之間的數(shù)值表示。在等級考試中,把題目分為難、中、易三種,每個科目都有明確的難度分布細目表。每次命題后都要估計難度系數(shù),而每次考試后再根據(jù)抽樣數(shù)據(jù)統(tǒng)計難度,一般都比較接近0.5。在NIT中,我們把難度分為A、B、C、D四個層次:A為容易題(0.7~1之間)、B為中等偏易題(0.5~0.7之間)、C為中等偏難題(0.3~0.5之間)、D為難題(0~0.3之間)。在命題實踐中,還采用了內(nèi)容難度的概念,使其與考生樣本無關(guān),而由題目自身的屬性決定。
區(qū)分度是區(qū)分不同水平考生能力程度的指標。不過,預(yù)先對它難作估計。
4.考試誤差、信度與效度
考試作為一種測量,和其他測量一樣總會存在誤差?荚囌`差的來源有三:一是試卷質(zhì)量;二是考生的水平和應(yīng)試狀態(tài);三是考試的實施辦法和監(jiān)考控制。考試的質(zhì)量不在于有無測試誤差,也不可能沒有測試誤差,而在于對考試誤差的控制程度。
考試誤差有兩類:隨機誤差和系統(tǒng)誤差。考試過程中不可預(yù)期的偶然誤差稱為隨機誤差。由始終存在的恒定因素導(dǎo)致的誤差稱為系統(tǒng)誤差,而命題產(chǎn)生的誤差通常是系統(tǒng)誤差。在考試中,對隨機誤差的控制程度稱為考試信度,它是考試結(jié)果可靠性的指標;對系統(tǒng)誤差和隨機誤差的綜合控制程度稱為考試效度,它是考試有效性的指標。如果試卷沒有較好反映考試內(nèi)容,結(jié)構(gòu)不合理,語義不明確,題目太難或太易,題量太少或分布不當(dāng),都會影響考試的效度。
考試的生命在質(zhì)量,質(zhì)量的關(guān)鍵在命題。由于考試中心有制度上的保證,所以NCRE和NIT都對命題工作非常重視。相對穩(wěn)定的命題隊伍,人員素質(zhì)較高,保證了考試的質(zhì)量。相信仔細研究過NCRE考卷的朋友,一定會為它的內(nèi)容準確、表達精練的“試卷美”而賞心悅