學(xué)業(yè)測評有兩種類型。
其中一種是評估政府的教育政績、評價教育的進(jìn)程,這樣的測評一定是抽樣的。比如美國的“國家成績報(bào)告單”(NAEP),實(shí)際就是國家教育進(jìn)步評估報(bào)告,這個報(bào)告的數(shù)據(jù)來源是通過全國抽樣的,反映的是整個美國按人口統(tǒng)計(jì)的整體狀況。如了解每天看4小時電視的兒童的成績怎么樣,每天領(lǐng)取免費(fèi)午餐的中學(xué)生的成績怎么樣,在國外駐軍人員子女的成績怎么樣,私立學(xué)校學(xué)生怎么樣,天主教徒家庭學(xué)生怎么樣,等等。每年這個國家成績報(bào)告單公布的時候,國家電視網(wǎng)絡(luò)會在黃金時段加以評論。
另一種類型是對學(xué)生個人的測評,比如每個學(xué)生都要參加的統(tǒng)考。
目前,國內(nèi)的學(xué)業(yè)測評基本上還是紙筆考試,并且結(jié)果以分?jǐn)?shù)的方式表達(dá)。但從測量的角度講,這種方式將會被基于電腦網(wǎng)絡(luò)的考試所取代。紙筆考試的弊端是很多生動的材料無法反映出來,比如醫(yī)生資格考試中需要聽到心臟跳動的聲音,這在紙筆考試中就無法實(shí)現(xiàn),而用電腦就可實(shí)現(xiàn)。紙筆考試雖然也能進(jìn)行學(xué)業(yè)測量,但是太落后了,一方面是手段上落后,無法呈現(xiàn)形象、環(huán)境等真實(shí)情境下的內(nèi)容,另外,考試也是一個很大問題。中國每年都在考試上花很大力氣,如有的考試保密室設(shè)三道鐵門,可還是會出問題。如果進(jìn)行電腦化考試,建設(shè)大容量題庫,考試時試卷自動生成,問題就會解決,因?yàn)楸骋惶自嚲頉]用,要偷整個試題庫并記住也不太可能。
此外,紙筆考試用一張?jiān)嚲砣y試所有學(xué)生,這可能對一些學(xué)生顯得太簡單,而對另外一些學(xué)生又太難,這樣就測不出學(xué)生真實(shí)水平,不知道真實(shí)水平就不能真正的了解學(xué)生,不能為學(xué)生提供幫助,尤其是差生。如果是零分試卷的話,就表明你將對這個學(xué)生一無所知。如果用網(wǎng)絡(luò)自適應(yīng)考試,根據(jù)學(xué)生答對答錯情況不斷調(diào)整試題,遇到學(xué)生不會的題目,系統(tǒng)自動降低標(biāo)準(zhǔn),一直降到會的程度,這樣才會測出學(xué)生真實(shí)水平。現(xiàn)在的托福、GRE等都是這樣的模式。計(jì)算機(jī)介入學(xué)業(yè)測評將是一個趨勢。
現(xiàn)在內(nèi)地的許多學(xué)業(yè)測評只是滿足于把分?jǐn)?shù)測出來并對學(xué)生進(jìn)行排隊(duì),這實(shí)際是做到一半就停住了。應(yīng)該對這個成績進(jìn)行分析,然后用于診斷與改進(jìn)。通過計(jì)算機(jī)自適應(yīng)考試,建立診斷性模型,能的檢測出該學(xué)生的學(xué)習(xí)狀況??荚嚽敖處熀蛯<乙x這些題目要考查學(xué)生的什么能力。比如,測試學(xué)生的計(jì)算能力,一個學(xué)生考了70分,通過專家分析得出該學(xué)生加法和減法還可以,乘法稍差,除法一點(diǎn)都不行,學(xué)生的老師一看到相關(guān)的信息馬上就知道需要在哪些方面幫助這個學(xué)生,做到“對癥下藥”。