小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

教育測量的基本方法

 秋蟲 2007-12-06

教育測量的基本方法

 

教育測量與教學(xué)評價是教學(xué)活動的重要組成部分,是在教學(xué)領(lǐng)域中進行科學(xué)管理的重要手段,合理地開展測量評價活動是提高教育質(zhì)量的有效保證.

一、基本概念

1.教育測量

教育測量有廣義和狹義之分.從廣義上說,教育測量泛指運用測量手段對教育活動所進行的量的測定。它涉及的范圍很廣,凡是需要并能夠測量的與教育有關(guān)的活動均在研究之列,如教育投入、教育過程各要素、教育的效果等。從狹義上講,教育測量專指按一定規(guī)則對學(xué)生的知識、智能、個性發(fā)展、思想品德等所進行的量的測定。通常所提及的多是狹義上的教育測量。

2. 教學(xué)評價

教育評價是按照一定標(biāo)準(zhǔn),運用科學(xué)可行的方法,對教育活動所進行的價值判斷的過程。它包括對教學(xué)過程和教學(xué)效果的評價,諸如學(xué)校、教師的教學(xué)工作、課堂教學(xué)、教學(xué)方法、模式和內(nèi)容以及學(xué)生的學(xué)業(yè)成就、一般智能發(fā)展、個性發(fā)展、思想品德狀況等評價。

3.測驗及其種類

測驗是指對通過一定的儀器和試題所引起的受測者的行為樣本進行測量的系統(tǒng)程序。教育測量的對象和內(nèi)容是非常豐富的,測驗作為教育測量的主要工具,種類也很繁多,可按不同標(biāo)準(zhǔn)加以分類。

按測驗的功用分類1)學(xué)績測驗; 2)能力測驗; 3)人格測驗。

按測驗的目的分類1診斷性測驗;(2)形成性測驗;(3)終結(jié)性測驗。

診斷、形成、終結(jié)三種測驗對照表

種類

目的

特點

時間

診斷性測驗

預(yù)測摸底

比較正規(guī)

教學(xué)開始

形成性測驗

矯正改進

靈活

教學(xué)進程中

終結(jié)性測驗

鑒定

正規(guī)

教學(xué)結(jié)束

按測驗的對象分類1)個別測驗;(2)團體測驗。

按解釋分?jǐn)?shù)和方法分類

1)常模參照測驗

指參照被測群體的實際水平解釋分?jǐn)?shù)的測驗叫做模參照測驗。群體的平均分?jǐn)?shù)一般可以反映群體的水平,稱為常模。以常模為參照點,將被測個人的成績與常模比較,并把比較結(jié)果所反映出來的差異數(shù)量化,作為導(dǎo)出分?jǐn)?shù)。參照常模解釋分?jǐn)?shù),便于比較和選拔工作的進行,它屬于相對評價的范疇。例如,在升學(xué)考試中,按標(biāo)準(zhǔn)化的要求進行的分?jǐn)?shù)轉(zhuǎn)換就是參照常模得出的。

2)目標(biāo)參照測驗

參照被測達到目標(biāo)的程度來解釋分?jǐn)?shù)的測驗,叫做目標(biāo)參照測驗,也稱作標(biāo)準(zhǔn)參照測驗。通過與特定的標(biāo)準(zhǔn)進行比較,了解被測的達標(biāo)程度,這是一種絕對評價方法。例如,畢業(yè)考試就是以某一學(xué)段的教育目標(biāo)為標(biāo)準(zhǔn),衡量學(xué)生的達標(biāo)情況而進行的。

常模參照測驗和目標(biāo)參照測驗的對照表

種類

參照系

歸屬

作用

理想分布

常模參照測驗

群體水平

相對評價

比較選拔

全距大,

正態(tài)分布

目標(biāo)參照測驗

教育目標(biāo)

絕對評價

鑒定

負(fù)偏態(tài)

 

4.測量的要素   

測量的三要素:

①參照點  參照點分絕對零點和相對零點.教育測量所應(yīng)用的參照點都是相對零點。

②統(tǒng)一的單位

③量具(測量工具) 教育測量常用的工具是試卷,而試卷由測題構(gòu)成,故我們必須高度重視命題的研究,提高試題的質(zhì)量,這樣才能保證測驗的可靠性和有效性。

二、數(shù)據(jù)整理

在教育測量中,通過各種測驗獲得大量分?jǐn)?shù),這些雜亂無章的分?jǐn)?shù)有三個問題,一是看不清它們的分布形態(tài),二是不了解它們的特征和變化規(guī)律,三是每個分?jǐn)?shù)表達的意義含混模糊。因此,需要對零亂分散的分?jǐn)?shù)進行整理和分析,以便在此基礎(chǔ)上作出解釋和評價。

1分?jǐn)?shù)整理

1)順序排列表

順序排列是簡單的整理分?jǐn)?shù)的方法。它是將所有個體的成績,按高低順序排列,并且列于表中,稱作順序排列表。這種方法簡明清晰,一眼便能看到最高分?jǐn)?shù)和最低分?jǐn)?shù),而且可以大致了解個體成績在總體中的位置。

1  分?jǐn)?shù)整理(用Excel )                                      

2)頻數(shù)分布表

頻數(shù)分布表是一種反映數(shù)據(jù)分布情況的統(tǒng)計表。所謂頻數(shù)是指一群數(shù)據(jù)在各個數(shù)值(或區(qū)間)上所出現(xiàn)的數(shù)據(jù)的個數(shù),也稱為次數(shù)。每一個頻數(shù)除以數(shù)據(jù)的總個數(shù)稱為頻率,或稱相對次數(shù)。

3)頻數(shù)直方圖

由頻數(shù)分布表可以制作頻數(shù)直方圖。方法是:以分?jǐn)?shù)為橫軸,頻數(shù)為縱軸,建立直角坐標(biāo)系,在橫軸上標(biāo)出各組分?jǐn)?shù)的組中值,頻數(shù)值等距標(biāo)在縱軸上;然后以組中值為底邊中點,組距為底邊,組頻數(shù)為高作出各矩形,即得頻數(shù)直方圖。

2(柱形圖)

三、統(tǒng)計數(shù)據(jù)

1算術(shù)平均數(shù)

一組數(shù)值的總和除以數(shù)據(jù)的總頻數(shù)所得的商稱為算術(shù)平均數(shù),簡稱平均數(shù)。計算公式是:  =

3  Excel求一組數(shù)據(jù)的平均數(shù)。

 2.方差

一組數(shù)據(jù)中,各數(shù)離均差的平方和的算術(shù)平均數(shù)稱為這組數(shù)據(jù)的方差。又叫均方差或變異數(shù)。用符號S2或σ2表示。

3.標(biāo)準(zhǔn)差

方差的算術(shù)平方根稱為標(biāo)準(zhǔn)差。用符號S或σ表示。

標(biāo)準(zhǔn)差是反映全體考生分?jǐn)?shù)之間的離散程度和差異情況。它與平均分一起使用,決定了某次考試分?jǐn)?shù)分布情況。σ值越大,表示部分考生離平均分的“差距越大”,也就是分?jǐn)?shù)分布較廣;σ值越小,則分?jǐn)?shù)分布較窄或說“集中在平均分附近”。計算公式是:

σ=

CZ1206科學(xué)計算器或Excel求平均數(shù)和標(biāo)準(zhǔn)差基本操作步驟(略)

4.用Excel標(biāo)準(zhǔn)差。

4.差異系數(shù)

標(biāo)準(zhǔn)差較準(zhǔn)確地反映了一組分?jǐn)?shù)的離散程度,它與原數(shù)據(jù)的單位相同,是一種絕對差異量數(shù)。在進行不同組間離散程度比較時,適用于單位相同、平均數(shù)相近的情況。如果各組數(shù)據(jù)單位不同,或雖然單位同但平均數(shù)相差甚遠時,不能直接用標(biāo)準(zhǔn)差比較,這時應(yīng)使用差異系數(shù)。

差異系數(shù)是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與平均數(shù)的百分比,用CV表示:

CV= ·100%。

5  某校中考成績語文的標(biāo)準(zhǔn)差S1=15,平均分X1=85分(滿分130分),政治標(biāo)準(zhǔn)差S2=10,平均分X2=50(滿分70分),試比較兩科的差異情況。

語文:CV1= =  =17.6%

政治:CV2= =  =20%。

因此,政治科分?jǐn)?shù)離散程度大。

5.標(biāo)準(zhǔn)分?jǐn)?shù)(z分?jǐn)?shù))

標(biāo)準(zhǔn)分?jǐn)?shù)是以平均分為參照點,標(biāo)準(zhǔn)差為度量單位的分?jǐn)?shù)。它具有重要理論價值和應(yīng)用價值。按照轉(zhuǎn)換的方式和對分布形態(tài)的影響效果,可分為兩類:

①不改變分布形態(tài)的標(biāo)準(zhǔn)分?jǐn)?shù)

定義式為:        z =

其中,xi為原始分?jǐn)?shù), 為參照群體的平均分,s為參照群體的標(biāo)準(zhǔn)差,z為標(biāo)準(zhǔn)分?jǐn)?shù)。這種標(biāo)準(zhǔn)分?jǐn)?shù)又稱z分?jǐn)?shù)。

6.某生高考數(shù)學(xué)成績105分,所在省的數(shù)學(xué)平均分68.40分,標(biāo)準(zhǔn)差28.90分,求他的標(biāo)準(zhǔn)分?jǐn)?shù)。

Z= = 1.266。

該學(xué)生處于優(yōu)秀學(xué)生行列,但如果將他置于全國高考最好的省份,平均分92.26分,標(biāo)準(zhǔn)差24.10分,則Z=0.529,僅能算中等偏上。

為了與通常記分的習(xí)慣協(xié)調(diào)一致,對z分?jǐn)?shù)可以再施行線性變換,以消除它的負(fù)值和小數(shù): y=Az+B 當(dāng)A=10,B=50時,便得到了T分?jǐn)?shù):T=10z+50

6.難度

難度是指試卷(題)的難易程度。一般用試卷(題)的得分率或答對率(P)表示,所以難度事實上是容易度。P值在0~1之間,數(shù)值越大,說明試卷(題)越容易。

有關(guān)考試難度水平估計一覽表

 

  

  

 

    

0.95

0.85

0.70

0.50

0.30

0.10

章節(jié)考試

20%

40%

30%

10%

 

 

   

 

30%

30%

20%

20%

 

   

 

 

20%

30%

30%

20%

計算公式:             P=

7Excel求難度。

一般情況下,測驗的平均難度接近0.50時,分?jǐn)?shù)趨于正態(tài)分布,否則分?jǐn)?shù)分布將出現(xiàn)偏態(tài)。就整個測驗而言,當(dāng)平均難度為0.5且題目組間的相關(guān)為零的情況下,分?jǐn)?shù)呈正態(tài)分布,而難度值越小,則題目越難,低分段人數(shù)必然較多。難度值越大,題目越容易,分?jǐn)?shù)將大部分集中在高分區(qū)。這樣,在分?jǐn)?shù)的分布上,就會呈現(xiàn)出兩種不同的偏向,前者為正偏態(tài),后者為負(fù)偏態(tài)。

7.區(qū)分度

是試題對不同考生的知識、能力水平的鑒別程度。如果一個題目的測試結(jié)果使水平高的考生答對(得高分),而水平低的考生答錯(得低分),它的區(qū)分能力就很強。題目的區(qū)分度反映了試題這種區(qū)分能力的高低。一般認(rèn)為,區(qū)分度的數(shù)值達到了0.3,便可以接受;達到了0.3以上為好的題目;在0.4以上為優(yōu)秀題目;低于0.3的題目,區(qū)分能力差。

1994~1995年高考數(shù)學(xué)試題區(qū)分度統(tǒng)計表

年份

 

0.3以下

0.3~0.4

0.4以上

1994

文科

14.7%

20.7%

64.4%

1994

理科

5.3%

20.7%

74%

1995

文科

13.3%

8.7%

78%

1995

理科

16.7%

37.3%

46%

可見,題目區(qū)分度的實質(zhì)是用以鑒定一個題目有效性的指標(biāo),它的高低變化對測驗的質(zhì)量具有深刻的影響。與題目的難度相比,人們更關(guān)注題目的區(qū)分度的高低,并以此作為篩選和修改試題的主要依據(jù)。

試題的區(qū)分度的計算比較方便的方法有以下兩種:

1)得分率求差法

將受測群體按題目得分的高低排列,取高分人數(shù)的27%為一組,他們的得分率記作PH;低分人數(shù)的27%為另一組,他們的得分率記作PL,用D表示區(qū)分度,則該題的區(qū)分度為

D=PHPL。

2)得分求差法

將受測群體按題目得分的高低排列,取高分人數(shù)的27%為一組,低分人數(shù)的27%為另一組,用D表示區(qū)分度,用H表示高分組得分總和,用L表示低分組得分總和, n表示高分組(低分組)人數(shù),XH表示該題的最高得分,XL表示該題的最低得分,則

D=。

8.用Excel求區(qū)分度。

8信度

信度是衡量測驗分?jǐn)?shù)一致性或可靠性的一個指標(biāo),即用一個或一組測驗對同一被試群體施測多次,所得結(jié)果的一致性的程度,以及測驗分?jǐn)?shù)所反映被試真實水平(即真分?jǐn)?shù))的可靠性程度。

1)分半相關(guān)

將全卷中全部試題按題號或分?jǐn)?shù)適當(dāng)分半,得到兩個平行的“子試卷”,計算這兩個子試卷考生得分的相關(guān)系數(shù),這樣求得的是半個試卷的信度,然后再用斯皮爾曼—布郎(SpearmanBrown)公式校正,得到考試的分半信度系數(shù)。一般認(rèn)為分半信度系數(shù)在0.90以上比較合適。這個方法比較適合多數(shù)為選擇題的試卷。

rtt =  

其中,rtt分半信度系數(shù),rab表示AB兩份試卷得分的積差相關(guān)系數(shù)。

9.用Excel求積差相關(guān)系數(shù)。

計算公式rab=

其中,x1ix2i是第i個受測者先后兩次測驗所得分?jǐn)?shù),n是受測人數(shù)。

應(yīng)當(dāng)注意,在應(yīng)用上式時,分半的兩部分測驗須滿足在平均數(shù)、標(biāo)準(zhǔn)差、分布形態(tài)、測題間相關(guān)、內(nèi)容、形式和題數(shù)都相似的假設(shè)條件。

2)內(nèi)部一致性信度

通常采用的是克倫巴赫(Cronbach)的α—系數(shù)公式,它適用于非選擇題(多重記分)較多的試卷。α—系數(shù)為試卷信度的最低限,一般認(rèn)為其值在0.80以上,考試的信度比較好。

克倫巴赫(Cronbach)公式:  rtt =

其中,Sii 2是每個測試題目得分的方差,St2是整份測驗總分的方差。

國家教委考試中心對高考試題分析與評價時,即用分半相關(guān)與α—系數(shù)方法求出試卷信度。

3年高考數(shù)學(xué)(理科)試卷統(tǒng)計數(shù)據(jù)對比

項目

1994

1995

1996

平均分

83.12

88.36

82.79

標(biāo)準(zhǔn)差

25.50

24.00

25.30

難度

0.550

0.590

0.550

分半信度

0.8339

0.8506

0.8500

α—信度

0.7580

0.8867

0.8884

 

9.效度

效度是測驗有效性或準(zhǔn)確性的指標(biāo)。由于效度分析可以針對各種要求和運用各種程序,而在特定的條件下,使用不同的分析方法可以得到不同的效度。因此,一個測驗可以具有不同的效度指標(biāo)。當(dāng)我們討論一個測驗的效度時,只有界定了它的條件,效度才有確切的意義。

對常模參照測驗來說,主要有效標(biāo)關(guān)聯(lián)效度、內(nèi)容效度和結(jié)構(gòu)效度。

1)效標(biāo)關(guān)聯(lián)效度

測驗的效標(biāo)又可稱為準(zhǔn)則,它是衡量測驗效度的參照標(biāo)準(zhǔn)。我們可以用一類標(biāo)準(zhǔn)化測驗作為某次測驗的效標(biāo)(如國家級高考、省級各類會考等),用積差相關(guān)法計算效度。

10 以國家級高考的成績作為效標(biāo),計算某考生進入高校后的第一學(xué)期的數(shù)學(xué)學(xué)習(xí)成績的效度。

由于客觀上的種種原因,難以確定有效的效標(biāo),因此,效度的計算,采用求平均區(qū)分度代替,其公式是:

r=

其中,r表示試卷的效度,k表示試卷中的試題數(shù),Di表示每道試題的區(qū)分度。

2)內(nèi)容效度

測驗的題目對所要測量的內(nèi)容具有代表性的程度稱作內(nèi)容效度。它反映測驗題目在所要測量的內(nèi)容范圍和教學(xué)目標(biāo)內(nèi)取樣是否充分和確切的問題,主要用于學(xué)科成績測驗。內(nèi)容效度一般不用數(shù)量化指標(biāo)來表示,主要依靠在某種依據(jù)的基礎(chǔ)上作出邏輯分析。為了提高測驗的內(nèi)容效度,首先要注意界定測驗的內(nèi)容范圍,其次要注意系統(tǒng)取樣。目前,大多數(shù)學(xué)科成績測驗的編制者根據(jù)教學(xué)目標(biāo)的分類,先擬就測驗的藍圖,將各部分內(nèi)容和教學(xué)目標(biāo)各層次按確定的比重表達出來,然后編制測題,以滿足提高內(nèi)容效度的要求。

3)結(jié)構(gòu)效度(構(gòu)造效度)

結(jié)構(gòu)效度是指考試對理論上構(gòu)造或特質(zhì)的測量程度。

11  測量“推理能力”考試。

確定結(jié)構(gòu)效度需三個步驟:建立理論體系(理論結(jié)構(gòu))并以此出發(fā)提出關(guān)于某一心理特征的假設(shè);設(shè)計和編制測驗,并進行實施;用收集證據(jù)和邏輯分析的方法來驗證與理論假設(shè)的相符程度。

由于建立理論和提出假設(shè)的困難,操作步驟較為復(fù)雜,且沒有單一的量化指標(biāo)來描述有效程度,所以,在一般的考試質(zhì)量分析中很少采用。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多