|
怎樣進(jìn)行試卷分析
精品源自歷史科 在考試結(jié)束之后,對試卷進(jìn)行分析,不但可以對試卷和考試作出恰當(dāng)?shù)脑u價,為試卷編制積累經(jīng)驗,提高教師編制試卷的水平,為修改試題和給題庫遴選試題提供依據(jù),而且有助于充分地獲得考試提供的教學(xué)反饋信息,為改進(jìn)教學(xué)提供依據(jù),為考試講評準(zhǔn)備材料。全面的試卷分析主要包括下列內(nèi)容。 一、試卷的結(jié)構(gòu)分析 主要包括: 1.內(nèi)容結(jié)構(gòu)分析:基本概念和化學(xué)原理、元素化合物知識、有機(jī)化學(xué)知識、化學(xué)計算、化學(xué)實驗等方面的內(nèi)容比例乃至每一方面的二級結(jié)構(gòu)分析。 2.目標(biāo)水平結(jié)構(gòu)分析:按照考試大綱所列水平(通常分為知道、理解、應(yīng)用、綜合運(yùn)用等)種類,分析它們的組成比例并且作內(nèi)容—水平雙向交*分析。 3.題型結(jié)構(gòu)分析:各類題型的比例分析。 4.分?jǐn)?shù)結(jié)構(gòu)分析:內(nèi)容—分?jǐn)?shù)和水平—分?jǐn)?shù)的雙向交*分析。 5.難度和時限結(jié)構(gòu)分析:對難度測驗作難度分布描述,對速度測驗作時限分布描述。 6.試卷特點(diǎn)及橫向、縱向比較:就試卷是否符合考試(教學(xué))大綱規(guī)定、是否反映化學(xué)學(xué)科特點(diǎn)和內(nèi)在聯(lián)系、符合學(xué)生實際水平、合理性、適宜性以及其他特點(diǎn)作出描述和判斷。橫向比較可以在學(xué)校—學(xué);虻貐^(qū)—地區(qū)間進(jìn)行,縱向比較可以在不同學(xué)年間進(jìn)行。 進(jìn)行結(jié)構(gòu)分析時,分析者要對測驗各項目逐一分析和作出判斷,因而結(jié)構(gòu)分析帶有較強(qiáng)的主觀色彩。分析者對項目的判斷跟編制、設(shè)計者不一致的情況經(jīng)常會發(fā)生,對于比較復(fù)雜的綜合題尤其是這樣。為此可以把試卷結(jié)構(gòu)分析結(jié)果跟編制試卷的結(jié)構(gòu)設(shè)計進(jìn)行比較。 除了難度結(jié)構(gòu)分析跟答卷情況有關(guān),只有在考試實施之后才能進(jìn)行外,其他各項分析跟答卷情況無關(guān),在考試實施之前就可以進(jìn)行,屬于試卷的“靜態(tài)”分析。 二、答卷情況描述 主要包括: 1.成績分布情況描述:列出頻數(shù)分布表或頻數(shù)分布圖。 2.統(tǒng)計量描述:列出平均分、標(biāo)準(zhǔn)差、優(yōu)分率和低分率以及某些因素間的相關(guān)系數(shù)等數(shù)據(jù),還可以進(jìn)一步作各內(nèi)容跟其平均得分率、標(biāo)準(zhǔn)差、優(yōu)分率和低分率的雙向交*分析,各水平層次跟其平均得分率、標(biāo)準(zhǔn)差、優(yōu)分率和低分率的雙向交*分析,以便從中發(fā)現(xiàn)問題。 3.分布形態(tài)判斷:判斷總體分布是正態(tài)還是偏態(tài)或其它形態(tài)。 4.由樣本統(tǒng)計量推測總體參數(shù)(總體平均成績、總體標(biāo)準(zhǔn)差等)。 三、試題及解答情況分析 1.題目的內(nèi)容、水平分析:逐一分析各題的內(nèi)容、水平和考核意圖。 2.題目的難度、區(qū)分度、靈敏度、識別度和題目反應(yīng)分布:具體方法參見文后所附題目分析部分。 四、試卷質(zhì)量分析 1.試卷的信度分析和效度分析。參見文后所附“試卷的信度分析和效度分析。” 2.整卷難度分析。 3.試卷質(zhì)量評價:就考試目的和試卷內(nèi)容、結(jié)構(gòu)、形式的合理性、適宜性、有效性和可行性等對試卷作出全面評價。 五、教學(xué)分析和教學(xué)建議 從得分、失分情況以及某些部分之間的比較、分析,發(fā)現(xiàn)教師、學(xué)生以及命題等方面的成功與不足之處,并針對存在問題提出改進(jìn)意見。 為了使試卷分析全面、可靠和有效地發(fā)揮應(yīng)有作用,試卷分析工作應(yīng)實行教師分析和學(xué)生自我分析結(jié)合、“動態(tài)”分析和“靜態(tài)”分析結(jié)合、定性分析和定量分析結(jié)合,在認(rèn)真分析的基礎(chǔ)上,簡明、扼要、有重點(diǎn)地寫出試卷分析報告。 附:題目和試卷的統(tǒng)計分析方法 一、常模參照性測驗的題目分析 常模參照性測驗題目的分析工作,主要是對測驗結(jié)果進(jìn)行統(tǒng)計分析,估計題目的難度、區(qū)分度,分析答案是否適宜等。 1.難度分析 所謂題目難度是指某一題目的難易程度,通常用答對率P來表示。 一般說來,題目的P值以0.2~0.8為宜。也有人用不通過率Q來表示難度。它們的計算方法如下表所示: *X高為高分組的該題得分總和,X低為低分組的該題得分總和,H、L分別為該題的最高、最低得分。 P值無等距性,無法對試題之間的難度差異作精確的比較,也不能用于計算平均難度。為了對各題難度作比較,通常要把P轉(zhuǎn)換成標(biāo)準(zhǔn)難度△,使之等距化。 △值越大,題目難度越大;△=13時,題目難度為中等。 運(yùn)用下表可以方便地由P值直接查得對應(yīng)的△值: 2.區(qū)分度分析 題目區(qū)分度是指某一題目對被測水平的區(qū)分能力。若某題目能使水平較高的被測得較高分、使水平較低的被測得較低分,該題就有較高的區(qū)分度。 區(qū)分度分析可以采用極端分組法,或者采用相關(guān)法。相關(guān)法比較復(fù)雜,這里從略,不作介紹。在極端分組法中,從總體中分出高分組和低分組(比例均為25%~33%且數(shù)值相同),然后計算區(qū)分指數(shù)D作為區(qū)分度的指標(biāo),如下表所示: 除了計算方法以外,還可以采用弗拉南根查表法:根據(jù)占總?cè)藬?shù)27%的高分組的答對率和占總體人數(shù)27%的低分組的答對率,從專門的表(附表5)中查得題目的區(qū)分度。 一般說來,當(dāng)D<0.20時,題目的區(qū)分度太低,必須淘汰或者加以修改;當(dāng)D≥0.40時,題目的區(qū)分度非常好;通常題目的區(qū)分度指數(shù)D在0.2~0.4之間。題目難度跟題目區(qū)分度之間有著一定的聯(lián)系。難度太大或者太小,都可能使區(qū)分度變小;只有難度適中時,才可能有較高的區(qū)分度。 3.題目反應(yīng)分布分析 對于多重選擇題等可能有多種答題情況(題目反應(yīng))的題型來說,僅僅作難度分析和區(qū)分度分析是不夠的,還需要分析題目反應(yīng)分布情況,檢查它是否跟預(yù)期的反應(yīng)分布模式符合,從而發(fā)現(xiàn)需要修改之處。題目的難度和區(qū)分度也可以從反應(yīng)分布中得到反映。進(jìn)行題目反應(yīng)分布分析,先要制作題目反應(yīng)分布表。下面是該表的示例,表中還列出了有關(guān)的分析和判斷: *為答對人數(shù) 二、目標(biāo)參照性測驗的題目分析 目標(biāo)參照性測驗題目試測后的分析工作主要是作靈敏度分析和識別度分析,有時也要作題目反應(yīng)分布分析。 1.靈敏度分析所謂靈敏度是指題目能靈敏地反映教學(xué)作用的能力,通常用目標(biāo)教學(xué)前后被測總體的通過率之差來估計。 設(shè)目標(biāo)教學(xué)前、后通過試題的被測人數(shù)分別為R1、R2,被測總體人數(shù)為N,則試題對教學(xué)的靈敏度指數(shù)S可按下式計算: 當(dāng)S>0時,試題有效,S越大,試題對教學(xué)作用的感受越靈敏;當(dāng)S≤0時,需要研究是否由教學(xué)不當(dāng)而引起,如非教學(xué)不當(dāng)引起,則可認(rèn)為試題質(zhì)量不佳。 2.識別度分析 題目識別度是指某試題能有效地識別達(dá)標(biāo)者的能力,通常用合格者通過本題的百分比跟不合格者通過本題的百分比之差來估計。 設(shè)P1和P2分別為合格者和不合格者的本題通過率,則 識別度指標(biāo)D=P1-P2 識別度指標(biāo)的最大值為1.0,當(dāng)D≤0時,該題無預(yù)期的識別能力。 題目識別度還可以用被測是否合格跟是否通過本題的φ相關(guān)系數(shù)來表示。設(shè)題目在總?cè)藬?shù)為N 的被測總體中的試測結(jié)果如下表所示: 所得φ相關(guān)系數(shù)需進(jìn)行檢驗,方法是:按下式算出φx2 x2=Nφ2 的,其犯錯誤可能性為0.05。 3.題目反應(yīng)分布分析 目標(biāo)參照性測驗的題目反應(yīng)分布分析方法跟常模參照性測驗的分析方法相似。通過分析不但可以發(fā)現(xiàn)題目中存在的問題,還可以了解被測的錯誤類型及其分布,具有學(xué)習(xí)診斷作用。 三、試卷的信度分析 信度表示測量的一致性、穩(wěn)定性和測量結(jié)果的可靠性。測量時的隨機(jī)誤差越小,測量結(jié)果就越接近真實值,其信度就越高;樣本統(tǒng)計量越是接近總體參數(shù),其信度也越高。 信度常用信度系數(shù)rxx表示,其值在0~1之間。若rxx=0,表明實得分?jǐn)?shù)完全由偶然誤差決定;若rxx=1,表明實得分?jǐn)?shù)完全不受偶然誤差的影響。一般說來,化學(xué)學(xué)業(yè)成績測驗的信度應(yīng)在0.90以上,甚至達(dá)到0.95。 由于Sr和SR難于直接測得,所以rxx通常借助于某些特別方法進(jìn)行計算。 (一)常模參照測驗信度的計算 常模參照測驗的信度系數(shù)可以用再測法、等價測驗法和兩半法等方法求得,所得信度系數(shù)意義略有不同,分別表示測量的再測穩(wěn)定性、等價測量穩(wěn)定性和內(nèi)在一致性,故又分別稱為穩(wěn)定性系數(shù)、等價性系數(shù)和內(nèi)部一致性系數(shù)。在化學(xué)教學(xué)測量中,常用下列方法計算內(nèi)部一致性系數(shù)。 1.兩半法,即在一次施測后,把試題分為對等、可比的兩半,其內(nèi)容、預(yù)測難度、總分和題數(shù)都大致 [1] [2] 下一頁 精品源自歷史科 精品源自歷史科相同;計分時把各被測的兩半實得總分分開統(tǒng)計,計算兩半間的積差相關(guān)系數(shù); 式中,x、y分別為某被測實得的兩半總分,N為被測總數(shù)。 再將rhh代入下式校正,即可得整卷的信度系數(shù)rxx。 采用這一校正公式時,兩半的平均數(shù)、標(biāo)準(zhǔn)差、項目的組間相關(guān)、分布的形態(tài)和內(nèi)容都應(yīng)相近。否則,整個測驗的信度估計rxx將有誤差。此時可改用下式計算rxx: 式中,Sa、Sb分別為兩半分?jǐn)?shù)的標(biāo)準(zhǔn)差,St為整個測驗總分方差,Sd為兩半分?jǐn)?shù)之差的標(biāo)準(zhǔn)差。 2.克龍巴赫法 方差。 影響測驗信度的因素主要有: (1)測驗長度:測驗越長,題量越大,信度越高。 (2)試題難度:當(dāng)各題難度和平均難度為中等(P=0.25~0.75)時,有利于提高測驗的信度。 (3)樣本(或總體)大小:樣本(或總體)越大,分?jǐn)?shù)分布越廣,信度越高。 (4)測驗內(nèi)容的復(fù)雜性:測驗內(nèi)容同質(zhì)性高,信度也高;反之,內(nèi)容越龐雜,信度就越低。 (5)施測條件的標(biāo)準(zhǔn)化,有利于減小隨機(jī)誤差的影響。 (6)評分的客觀性。 (二)目標(biāo)參照測驗信度的計算 復(fù)本法:以等價的兩份測驗對同一被測群體施測,設(shè)測驗結(jié)果的分布情況如下表所示: 四、試卷的效度分析 效度表示測量跟測量目的符合的程度,是測量準(zhǔn)確性和有效性的指標(biāo)。跟測驗?zāi)康臒o關(guān)的因素影響越小,測驗的有效性即效度就越高。 (一)常模參照測驗的效標(biāo)關(guān)聯(lián)效度 在確定常模參照測驗的效度時,通常以另一比較符合測量目的的測量結(jié)果作為檢測效度的參照標(biāo)準(zhǔn)(即效標(biāo))。設(shè)被測總數(shù)為N,x和y分別為被測i的本次測得成績和效標(biāo)成績,則 若已將成績轉(zhuǎn)換成Z標(biāo)準(zhǔn)分,則 rxy>0時,說明兩者相關(guān)(正相關(guān)),rxy值越大相關(guān)程度也越大;rxy=1時表示測量完全反映測量的目的;rxy=0時,表明兩組分?jǐn)?shù)完全不相關(guān)(零相關(guān))測量結(jié)果跟測量目的無關(guān);rxy<0時為負(fù)相關(guān),表明一測量得分高者另一測量得分低,測量結(jié)果跟測量目的完全相反。一般情況下,化學(xué)學(xué)業(yè)成績測驗的效度應(yīng)在0.4~0.7之間 系統(tǒng)誤差和隨機(jī)誤差跟實得分?jǐn)?shù)方差比值的大小影響著效度的高低,要提高效度,就必須: (1)提高測驗的信度,減小隨機(jī)誤差的影響。 (2)施測標(biāo)準(zhǔn)化、評分標(biāo)準(zhǔn)化、采用適宜的分?jǐn)?shù)合成方法,減少與測驗的目的無關(guān)的因素,盡量降低系統(tǒng)誤差的影響。題文難于理解、數(shù)學(xué)計算過于復(fù)雜等,均會降低測驗的效度。 (3)提高命題質(zhì)量。試題太少、偏、怪,覆蓋面小、編排不當(dāng)、過難過易等,都會影響效度。 (4)增大樣本容量、使之具有較好的代表性。 (5)選擇可靠(信度高)、符合測量目的的測驗作效標(biāo)。 效度系數(shù)也可以視具體情況改用二列相關(guān)系數(shù)或者點(diǎn)二列相關(guān)系數(shù)、φ相關(guān)系數(shù)等來表示。 (二)目標(biāo)參照測驗的效度 目標(biāo)參照測驗要求測量結(jié)果的變異最好為零,故不能用變異量來表示其效度。此時,可以通過內(nèi)容適宜性來確定其效度。 五、試卷難度分析 試卷難度跟試題難度相似,可以用得分率表示: 也可以用各題難度加權(quán)平均求得: 當(dāng)P卷為0.5左右時,測驗分?jǐn)?shù)的分布近于正態(tài)上一頁 [1] [2] 精品源自歷史科
|