各位同行:建議大家認(rèn)真閱讀此文,相信能為大家提供有用的參考。
中考試題難度、信度、效度和區(qū)分度的把握和控制 南寧市教科所 鄧雅學(xué) 初中升學(xué)考試是義務(wù)教育終結(jié)后的選拔性考試,是衡量學(xué)生學(xué)習(xí)成效的重要手段,也是高中階段學(xué)校招生的重要依據(jù)。中考具有的高利害特征,對考試的科學(xué)性和合理性提出了很高的要求。為了使考試能夠客觀、準(zhǔn)確地考查、測量學(xué)生的學(xué)習(xí)成效、學(xué)習(xí)能力及其發(fā)展?jié)撃?,下面就試題的難度、信度、效度和區(qū)分度的把握和控制提出幾點(diǎn)要求。 一、試題難度的控制 試題的難度是評價試題質(zhì)量的重要指標(biāo),在考試學(xué)中它被定義為:該題考生所得的平均分與該題總分的比值(通過率)。簡單講,難度就是指題目的難易程度。一道題目,如果大部分考生都答對,它的難度就小,反之難度就大。 試題的難度直接影響考試的及格率和優(yōu)秀率,對考試的信度、效度、區(qū)分度也會產(chǎn)生重大影響。因此,有效控制難度,是考試命題的基本要求之一。 (一)影響試題難度的幾個因素 影響試題難度的因素很多,主要有以下四個方面: 1、學(xué)生對試題的熟悉程度。一是對題型的熟悉程度,二是對題目內(nèi)容的熟悉程度。一般地說,常見常練的題型,直接從教材取材的題目,學(xué)生容易做,難度就??;反之難度就大。 2、題目包含信息量的多少。學(xué)生答題,要先閱讀題目的內(nèi)容,如果題目信息量太多,或者文字不簡潔,條理不清,或者圖表指向不明確,都會影響學(xué)生讀題,使題目的難度增加。 3、題目結(jié)構(gòu)的復(fù)雜程度。包括題目的類型、知識的綜合程度和知識間聯(lián)系的復(fù)雜程度等等,都會對題目的難度產(chǎn)生影響。比如,選擇題中的多選題,如果全部選對才給分,它的難度顯然比單選題大。 4、題目的變化動態(tài)。題目的迷惑性、干擾性,題目設(shè)置的靈活程度,題目隱含的已知條件等等,都會對題目的難度產(chǎn)生影響。 命題者設(shè)定試題難度時,必須考慮以上四個方面的因素。 (二)試題的難度計(jì)算 1、二分法計(jì)分題目的難度。 “二分法計(jì)分題目”即答對給分,答錯不給分的題目,如單項(xiàng)選擇題、是非判斷題等。這類題目的難度指標(biāo)通常用通過率來表示,即以答對該題的人數(shù)來表示。 假設(shè)全體考生人數(shù)為N,答對該題目的考生為R,通過率為P,則:P=R÷N×100% P值越大,題目越容易;反之題目越難。 2、非二分法題目的難度。 “非二分法題目”即用從零分到滿分之間的數(shù)字來計(jì)分的題目,如作文題、計(jì)算題、論述題等。 假設(shè)該題考生的平均得分為R,該題的滿分為N,難度值為P,則:P=R÷N P值越大,題目越容易;反之題目越難。 3、難度系數(shù)的校正。 對于選擇性題目來說,由于猜測的因素,考生的得分可能比真實(shí)得分要高。采用通過率方式來計(jì)算難度,可能產(chǎn)生偏差,即夸大了部分考生的能力,降低了題目的難度。為此,可用以下方法進(jìn)行矯正: 假設(shè)選項(xiàng)的數(shù)目為K,通過率為P,校正后的通過率為CP,則:CP=(KP-1)÷(K-1) 當(dāng)選項(xiàng)的數(shù)目很大,猜測的概率很小時,CP值就會很接近P值。 二、試卷難度水平的確定 試卷難度水平的確定取決于考試的性質(zhì)和目的。就選拔性考試而言,應(yīng)該使試卷的難度系數(shù)接近錄取率。然而,我市城區(qū)已經(jīng)基本普及高中階段教育,中考的目的不僅是選拔,更是為了區(qū)分考生適合于到那類學(xué)校就讀。因此,設(shè)置試卷的難度時要注意: 1、各科的試卷中必須有一定數(shù)量的題目,用于考查初中畢業(yè)生應(yīng)該具備的知識和技能,屬于較易題,這部分題目可以不必過多地考慮難度,它應(yīng)占整個試卷題量的十分之七。 2、試卷中另有一部分題目,是中等水平的考生才會做的,屬于中等題,它的難度系數(shù)應(yīng)為0.5左右,題量應(yīng)占整個試卷的十分之二。 3、試卷中較難的題目,占整卷的十分之一,它的難度系數(shù)可控制在0.2~0.4之間。 各科試題的平均難度為:數(shù)學(xué)、物理0.65±0.03,其他學(xué)科0.7±0.03。 三、試卷的信度 信度是指測量結(jié)果的穩(wěn)定性和可靠性。命、審題人員通過對考試結(jié)果的穩(wěn)定性和可靠性進(jìn)行分析,檢驗(yàn)試卷是否能穩(wěn)定地、一致地反映考生的知識和能力,從而驗(yàn)證試卷編制是否恰當(dāng)。在選拔性考試中,試卷的信度決定著選拔的質(zhì)量,它是考試選拔的“標(biāo)準(zhǔn)尺子”。 (一)決定試卷信度的四個要素 1、試卷結(jié)構(gòu)是否合理。即試卷能否覆蓋考查的內(nèi)容,能否做到重點(diǎn)突出,難易得當(dāng)。 2、題型設(shè)計(jì)和搭配是否恰當(dāng)。即試卷是否具備不同題型,主觀題和客觀題是否合理搭配,能否考查學(xué)生多方面的能力。 3、試題答案的可信程度??陀^題的答案具有唯一性,可信程度高。主觀題由于受到一些不穩(wěn)定因素的影響(如評分者的偏好、評分者對評分標(biāo)準(zhǔn)的理解等等),答案的信度不及客觀題高。 4、評分者的綜合素質(zhì)。包括知識經(jīng)驗(yàn)、職業(yè)道德、法紀(jì)觀念、精力體力等等。評分者的信度反映了評分能夠穩(wěn)定反映考生真實(shí)水平的程度。信度越高,評分誤差越小,考試的質(zhì)量越高。 (二)保證試卷信度的相應(yīng)措施 1、合理安排試卷的結(jié)構(gòu)。根據(jù)考試范圍和要求,將考查內(nèi)容合理劃分,形成梯度結(jié)構(gòu)和科學(xué)、完整的編排系列。例如語文試卷,可分為“積累與運(yùn)用”、“文言文閱讀”、“現(xiàn)代文閱讀”、“寫作”四大塊,合理安排題量和配分。 2、合理采用不同的題型。包括選擇題、問答題、填充題、計(jì)算題、圖文題、論述題等,主觀題和客觀題的比例要恰如其分。是非判斷題由于受猜測因素影響太大,選拔性考試一般不宜采用。 3、科學(xué)設(shè)置答題要點(diǎn)和評分細(xì)則。命題者對主觀題作出具體的答題要點(diǎn),并合理配分,盡可能使主觀題的答案客觀化、標(biāo)準(zhǔn)化,以減少評分者主觀因素及外界不穩(wěn)定因素的影響??梢試L試設(shè)置一些開放性試題,言之成理即可給分。 4、嚴(yán)格挑選、培訓(xùn)評卷人員,多個評分者評分。評卷人員的挑選要依照程序進(jìn)行,評卷前要進(jìn)行集中培訓(xùn)。一些比較復(fù)雜的客觀題(如作文題)要經(jīng)過試評,并且由多個評分者評分;當(dāng)多個評分者之間的評分出現(xiàn)矛盾時,可以通過討論來減少分歧。 四、試卷的效度 效度是指試卷的有效性,即試卷的使用是否達(dá)到了考試的目的。它是衡量一份試卷優(yōu)劣的最重要的指標(biāo),主要包含以下兩個方面的因素。 1、內(nèi)容效度 內(nèi)容效度是指題目對欲測的內(nèi)容范圍取樣的適當(dāng)程度。中考試卷要具備較好的內(nèi)容效度,必須滿足兩個條件: (1)要有確定好的內(nèi)容范圍,并使全部題目都落在這一范圍之內(nèi)。 (2)試卷題目應(yīng)是已界定的內(nèi)容范圍的代表性樣本(即題目能代表所測的內(nèi)容范圍的主要方面),且各部分題目所占比例恰當(dāng)。 為此,命題人員在命制試題之前,必須完成下列工作: A、 定義好內(nèi)容總體,描繪出有關(guān)知識與技能的大體范圍; B、 劃分細(xì)綱目,根據(jù)其重要程度確定加權(quán)比例; C、 確定每道題所考的內(nèi)容。 以上三個步驟體現(xiàn)為各學(xué)科試卷“雙向細(xì)目表”的制定。 2、效標(biāo)關(guān)聯(lián)效度 效標(biāo)是衡量試卷是否有效的參照物,亦即根據(jù)考試對象的狀況確定試卷是否有效。常見的效標(biāo)有:學(xué)生的學(xué)業(yè)成績、等級評定、特殊訓(xùn)練成績、學(xué)習(xí)表現(xiàn)等。 效標(biāo)關(guān)聯(lián)效度就是考察試卷得分與學(xué)生的平時表現(xiàn),從而確定試卷的有效程度。中考試卷效度的測量,主要以學(xué)生在初中階段的成績?yōu)閰⒄铡<偃缙綍r成績好的學(xué)生,考試成績也好;成績差的學(xué)生考試成績也差,這份試卷的效度就高。 試卷效度的預(yù)測,必須在具有信度的前提下進(jìn)行;而它真實(shí)效度,要在評卷結(jié)束后,通過收集學(xué)生的平時表現(xiàn)才能得出。 五、試題的區(qū)分度 試題的區(qū)分度是指題目對考生實(shí)際水平的區(qū)分程度。一般地說,能力高的學(xué)生得分高,能力低的學(xué)生得分低,試題的區(qū)分度就高。題目得分均勻,分不出高低,區(qū)分度就低。區(qū)分度主要用于以選拔為目的的試題,尤其是較難題,一些基礎(chǔ)性的題目不用過多考慮。 題目的區(qū)分度可以用兩個指標(biāo)來表示: 1、相關(guān)系數(shù) 即計(jì)算題目通過率與試卷總分的相關(guān)。計(jì)算的方法有點(diǎn)二列相關(guān)、二列相關(guān)、積差相關(guān)等。相關(guān)系數(shù)高于0.20的題目一般可以保留,如果接近于零或負(fù)數(shù)時,應(yīng)作重大修改或刪除。 2、鑒別力指數(shù) 即通過比較試卷總分高低的兩組考生在題目上的通過率,得到差值,從而鑒別題目測量效標(biāo)的有效性。 由于試題的區(qū)分度是在考試之后才能確定,命題時只能通過命題者的分析去把握,因此只作簡單的介紹。 中考試題的難度、信度、效度和區(qū)分度的把握和控制,是中考命題的關(guān)鍵技術(shù),在此提出來,與大家共同探討。 (本文發(fā)表于《廣西教育》2006年中教版5B) |
|