PISA利用現(xiàn)代教育測量理論,在時間短、樣本量小、試題量大、覆蓋面廣、成本低、誤差小、減輕學生負擔、減少考試焦慮的同時,確保了評價的科學性,拓寬了評價的內(nèi)容與形式,使教育評價更具實用價值,取得了廣大教育研究者和師生、家長、學校的一致認可。2000年,PISA共收集了近26萬有效的學生樣本,實現(xiàn)了閱讀素養(yǎng)的提取信息、解釋說明、反思并評估,還有數(shù)學素養(yǎng)和科學素養(yǎng)5個維度的測量與評價;2003年,PISA共收集了27萬多個有效學生樣本,實現(xiàn)了數(shù)學素養(yǎng)的變化和關系、數(shù)量、空間,以及形狀、不確定性、問題解決、閱讀素養(yǎng)和科學素養(yǎng)7個維度的測量與評價;2006年,PISA共收集了39萬多個有效學生樣本,實現(xiàn)了對科學素養(yǎng)的識別科學問題、科學地解釋現(xiàn)象和使用科學證據(jù)等三個科學能力,以及科學興趣、支持科學探究等兩個對待科學的態(tài)度和閱讀素養(yǎng)、數(shù)學素養(yǎng)等7個維度的測量與評價。2009年,PISA有68個國家和經(jīng)濟體參加,其內(nèi)容除了在2006年設計的閱讀素養(yǎng)內(nèi)涵基礎上有所發(fā)展之外,還開發(fā)了電子閱讀技能的評估?傊看蜳ISA測試的結果都會引起廣泛的關注,如“芬蘭模式”等。另外,在2009年的測試中,上海作為我國大陸唯一參加的地區(qū)還獲得了三項測試均位居首位的好成績。
在取得成績的同時,這兩種評價法也存在一些問題,其中較為突出的有:各個參與主體(教師、學生、學校及家長)對評價方法的認識不夠充分,使評價方法的施行受到阻礙甚至無法順利實施;以應試教育為主、高考為指向標的教育目標仍對一部分人的教育觀念具有導向作用,導致“偏離正軌”的檔案袋評價法難以施行;時間和精力的投入對已經(jīng)極為忙碌的中小學教師來說是極大的挑戰(zhàn)和困難;檔案袋內(nèi)容不明確且缺少客觀的評價標準;在實施過程中容易流于形式,且會因為缺乏交流和反饋導致同一區(qū)域的評價內(nèi)容和標準不同;PISA實施的不連續(xù)性對學生的測評無法持續(xù);繁重的準備工作消耗大量的人力、物力和財力;整個測評對教師和參與研究者的素質(zhì)要求較高等。
研究者們也發(fā)現(xiàn),要有效開展這兩種評價法就必須強化評價主體的理解與互動。另外,科學選擇評價內(nèi)容與評定標準對提高評價的質(zhì)量和發(fā)揮其教學價值有著極為重要的意義。
四、對我國基礎教育評價的思考
我國的基礎教育在實現(xiàn)了對既定的義務教育任務的完成之后,已進入全面提高教育質(zhì)量的階段。如何進行科學、合理和有效的教育評價,使教育評價成為提高教育質(zhì)量的有效手段、成為實現(xiàn)教育管理和教育決策科學化的重要保障,以及促進學生健康發(fā)展的必要環(huán)節(jié),是擺在教育研究者面前的一項重要任務。上述所提及的檔案袋評價法和PISA評價法則可以為我們提供一些這方面的啟示。
我國新一輪的基礎教育改革更加關注學生的主動性和參與性,倡導學習環(huán)境和內(nèi)容的生活化和情境性。PISA評價法與檔案袋評價法中關注的——學生是否準備好去應對未來的挑戰(zhàn)、注重學習過程等與基礎教育改革所要求的也有相同之處。