亚洲无码午夜福利视频|日韩国产高清一区二区|欧美老熟妇XB水多毛多|狠狠色成人一区二区三区|在线观看国产精品露脸网站|在线观看一区二区三区视频|激情性无码视频在线观看动漫|99国产精品久久久久久久成人

您的位置:中國(guó)博士人才網(wǎng) > 新聞資訊 > 高層動(dòng)態(tài) > 多元化評(píng)價(jià):中美比較的視角

關(guān)注微信

多元化評(píng)價(jià):中美比較的視角

時(shí)間:2019-01-10來1源:中國(guó)科學(xué)報(bào) 作者:佚名

 

在評(píng)價(jià)科學(xué)化方面,我們一方面要注重評(píng)價(jià)人才隊(duì)伍建設(shè),評(píng)價(jià)專家要兼有基礎(chǔ)研究和應(yīng)用研究的經(jīng)驗(yàn),同時(shí)還要專門培養(yǎng)教育政策評(píng)價(jià)方向的研究生;另一個(gè)方面要加強(qiáng)實(shí)證研究及教育數(shù)據(jù)庫(kù)的建設(shè)。美國(guó)教育評(píng)價(jià)研究的發(fā)展離不開健全的、數(shù)據(jù)詳實(shí)且及時(shí)更新的、公開的數(shù)據(jù)庫(kù)資源。

■嚴(yán)文蕃

有人存在的地方就有競(jìng)爭(zhēng),有競(jìng)爭(zhēng)就需要有評(píng)價(jià)。然而,對(duì)人進(jìn)行評(píng)價(jià)并不是一件容易的事,在高等教育領(lǐng)域中也不例外。教師評(píng)職稱、評(píng)頭銜要數(shù)論文,引人才又要看頭銜……論文不夠怎么辦?學(xué)術(shù)“造假注水”便滋生出來。

這樣的惡性循環(huán),引起了黨中央的注意,在2018年的兩院院士大會(huì)上,習(xí)近平總書記就指出,“人才評(píng)價(jià)制度不合理,唯論文、唯職稱、唯學(xué)歷的現(xiàn)象仍然嚴(yán)重”。近年來,為解決這一問題,中共中央、國(guó)務(wù)院和教育部等部門發(fā)布的系列重大政策將“四唯”“五唯”清理作為突破口,推動(dòng)著我國(guó)高校和科研院所科研評(píng)價(jià)制度由一元走向多元的重大轉(zhuǎn)型與改革。

下面,筆者就將通過中美比較的視角,在對(duì)中美高等教育科研評(píng)價(jià)相關(guān)問題的優(yōu)劣特征進(jìn)行分析比較的基礎(chǔ)上,探尋各自特點(diǎn),力求促進(jìn)和實(shí)現(xiàn)中美高等教育相互取長(zhǎng)補(bǔ)短。

理解評(píng)價(jià)的本質(zhì)

要對(duì)中美高等教育科研評(píng)價(jià)相關(guān)問題的優(yōu)劣特征進(jìn)行分析比較,明確評(píng)價(jià)概念在中美語(yǔ)境下的差異是前提。

教育評(píng)價(jià)在西方主要對(duì)應(yīng)三個(gè)英文概念:Testing、Assessment和Evaluation。Testing,即考核、考試。Assessment,即各種能力測(cè)評(píng)。依據(jù)美國(guó)三大權(quán)威教育組織(美國(guó)教育研究會(huì)、美國(guó)心理學(xué)會(huì)、美國(guó)教育測(cè)量全國(guó)理事會(huì))聯(lián)合編制的《教育與心理測(cè)試標(biāo)準(zhǔn)》,Testing即通過一種系統(tǒng)的方法,獲取有關(guān)人或項(xiàng)目的樣本信息,從而推斷出學(xué)生的知識(shí)、特征或傾向。Evaluation則側(cè)重對(duì)教育干預(yù)效果的測(cè)定,包括微觀層面教學(xué)策略效果的測(cè)定,以及宏觀層面國(guó)家教育政策效果的測(cè)定。

這三者間,考試為評(píng)價(jià)提供收集證據(jù)的工具,測(cè)評(píng)是各項(xiàng)考試的綜合,而考試和測(cè)評(píng)等多方面形成的證據(jù)可以支持有效的評(píng)價(jià),三個(gè)概念間相互聯(lián)系,環(huán)環(huán)相扣。因此,一個(gè)完整的教育評(píng)價(jià)過程包括了考試、測(cè)評(píng)和評(píng)價(jià)三個(gè)階段。

那么,被人們廣泛討論、糾結(jié)的評(píng)價(jià)究竟是什么?該如何理解、剖析?

事實(shí)上,評(píng)價(jià)的本質(zhì)是基于材料和證據(jù)的搜集與分析,對(duì)教育各個(gè)環(huán)節(jié)及其特征和結(jié)果進(jìn)行判斷的過程。比如,一所企業(yè)要想招聘一個(gè)人才,它需要該應(yīng)聘者的簡(jiǎn)歷,此外還要進(jìn)行筆試、面試等,這都是根據(jù)材料和證據(jù)進(jìn)行判斷的環(huán)節(jié)。

評(píng)價(jià)有三個(gè)基本要素,分別是判斷、標(biāo)準(zhǔn)、利益相關(guān)者。其中,作出判斷是評(píng)價(jià)過程的終端環(huán)節(jié);評(píng)價(jià)標(biāo)準(zhǔn)則是進(jìn)行判斷的根本依據(jù)。而評(píng)價(jià)標(biāo)準(zhǔn)的制定往往很難統(tǒng)一,它取決于價(jià)值觀。因此,價(jià)值觀的不同是導(dǎo)致評(píng)價(jià)標(biāo)準(zhǔn)產(chǎn)生爭(zhēng)議的根源所在。

另外,任何評(píng)價(jià)過程都關(guān)涉多元的具有相互利益關(guān)系的主體。由于利益相關(guān)群體的多樣化和差異化、資源及時(shí)間的有限性,教育評(píng)價(jià)往往很難同時(shí)滿足各方利益訴求。但教育評(píng)價(jià)必須明確主要利益相關(guān)者,才能確定評(píng)價(jià)的價(jià)值導(dǎo)向、制定出符合利益相關(guān)主體需求的評(píng)價(jià)標(biāo)準(zhǔn),繼而作出合理的服務(wù)利益相關(guān)主體的價(jià)值判斷。

評(píng)價(jià)工具——考試的誕生

在2300多年前的中國(guó),科舉考試制度誕生了。沒有人能夠預(yù)想到,由此誕生的考試制度竟一直延續(xù)至今。而西方在教育測(cè)評(píng)領(lǐng)域的歷史則要比中國(guó)晚得多,以桑代克在1904年出版的教材《教育測(cè)量》和1923年出版的第一個(gè)斯坦福成就測(cè)驗(yàn)(SATest)為其教育測(cè)評(píng)領(lǐng)域最早的里程碑式的標(biāo)志。

除了考試產(chǎn)生先后的差異外,美國(guó)考試發(fā)展的歷程也與中國(guó)很不相同。

美國(guó)自上世紀(jì)30年代開始實(shí)施SAT考試,上世紀(jì)50年代開始實(shí)施區(qū)一級(jí)的標(biāo)準(zhǔn)化考試,上世紀(jì)70年代開始實(shí)施州一級(jí)的標(biāo)準(zhǔn)化考試,上世紀(jì)80年代擴(kuò)大到全國(guó)考試,上世紀(jì)90年代后開始嘗試國(guó)際考核。SAT在發(fā)展至今的八十余年里,其形式和內(nèi)容基本上沒有改變,僅在寫作題目方面有所增添?荚嚢l(fā)展的總體趨勢(shì)是實(shí)施的范圍和規(guī)模越來越大?梢,美國(guó)考試發(fā)展呈現(xiàn)自下而上的特征。

與之相反,中國(guó)考試的發(fā)展路徑則呈現(xiàn)自上而下的特征,往往始于國(guó)家統(tǒng)一考試,繼而逐漸放權(quán)到省和市。

雖然,中美教育和歷史文化背景不同,但是不同的考試發(fā)展路徑?jīng)]有優(yōu)劣之分,它們均服務(wù)于學(xué)生的發(fā)展和考試制度的不斷完善,也是完成評(píng)價(jià)的工具之一。

面向問責(zé)的教育評(píng)價(jià)

教育評(píng)價(jià)的主要功能之一是問責(zé)。以美國(guó)為例,其最重要的教育法案——《不讓一個(gè)孩子落后法案(NCLB)》即規(guī)定以考試結(jié)果作為問責(zé)的依據(jù)。根據(jù)NCLB法律要求,各州開發(fā)了州級(jí)統(tǒng)一考試,要求所有學(xué)生參加,并以測(cè)評(píng)結(jié)果為依據(jù)對(duì)教育管理者進(jìn)行問責(zé)。以麻州為例,這一考試即馬薩儲(chǔ)塞州(以下簡(jiǎn)稱麻州)綜合評(píng)估系統(tǒng)。依據(jù)這一系統(tǒng)的測(cè)評(píng)結(jié)果,麻州學(xué)校被評(píng)定為五個(gè)等級(jí):1級(jí)代表優(yōu)異;2級(jí)代表合格;3級(jí)和4級(jí)代表較差(排名后20%的學(xué)校);5級(jí)代表 “長(zhǎng)期表現(xiàn)不佳”。其中,3~4等級(jí)的學(xué)校會(huì)獲得額外支持與援助,5級(jí)學(xué)校將由麻州基礎(chǔ)教育部接管。同時(shí),各個(gè)學(xué)校的管理者會(huì)接受相應(yīng)的問責(zé)。

事實(shí)上,基于評(píng)價(jià)的問責(zé)制度對(duì)于教育質(zhì)量的提高有較為顯著的效果。通過波士頓公立學(xué)校NCLB問責(zé)結(jié)果統(tǒng)計(jì)(2013~2016),我們或許可以有更加直觀的感受。根據(jù)該統(tǒng)計(jì),2013年,波士頓地區(qū)被統(tǒng)計(jì)的公立學(xué)校中1級(jí)21所、2級(jí)12所、3級(jí)59所、4級(jí)7所、5級(jí)2所;2014年,被統(tǒng)計(jì)的公立學(xué)校中,1級(jí)14所、2級(jí)22所、3級(jí)54所、4級(jí)7所、5級(jí)2所;2015年,被統(tǒng)計(jì)的公立學(xué)校中,1級(jí)14所、2級(jí)23所、3級(jí)53所、4級(jí)8所、5級(jí)2所;2016年,被統(tǒng)計(jì)的公立學(xué)校中,1級(jí)21所、2級(jí)24所、3級(jí)46所、4級(jí)9所、5級(jí)2所。從統(tǒng)計(jì)數(shù)據(jù)中可見,實(shí)行問責(zé)制度后,波士頓地區(qū)1級(jí)和2級(jí)的合格與優(yōu)質(zhì)公立學(xué)校總數(shù)基本呈現(xiàn)逐年增加的趨勢(shì),3級(jí)和4級(jí)需要改進(jìn)的學(xué)?倲(shù)逐漸減少,可見,以測(cè)評(píng)驅(qū)動(dòng)問責(zé)可在一定程度上提高教育質(zhì)量。同時(shí),測(cè)評(píng)也是實(shí)現(xiàn)教育公平的重要手段?己瞬缓细竦膶W(xué)校多是弱勢(shì)群體學(xué)生集中的學(xué)校,通過考核問責(zé),這些學(xué)校被動(dòng)提高了學(xué)生的學(xué)業(yè)成績(jī)和教育質(zhì)量。

學(xué)業(yè)考試是評(píng)價(jià)的重要組成部分和依據(jù),但并不等同于評(píng)價(jià)。中美兩國(guó)的考試在綜合評(píng)價(jià)中占據(jù)的權(quán)重具有顯著的差別,按照學(xué)習(xí)階段(幼兒園、小學(xué)、初中、高中、大學(xué)),根據(jù)相關(guān)數(shù)據(jù),將中美學(xué)生考試在評(píng)價(jià)中的權(quán)重做成函數(shù)分布圖(如圖1所示),差異一目了然。

從圖中不難看出,中國(guó)學(xué)生在接受高等教育前各級(jí)考試、考核隨學(xué)段增長(zhǎng)而逐年加碼,到了高中達(dá)到頂峰,大學(xué)后卻降下來,呈緩慢下降趨勢(shì)。相比之下,美國(guó)一直呈持續(xù)上升趨勢(shì),直到博士研究生階段,其中,雖然在高中及以前一直低于中國(guó),但是到大學(xué)以后高于中國(guó)。

由此可見,考評(píng)應(yīng)符合人的發(fā)展規(guī)律,即隨年齡增長(zhǎng),對(duì)學(xué)生的考試要求、責(zé)任心期望等應(yīng)相對(duì)增加。然而,在中國(guó)高等教育階段,考試沒有嚴(yán)格執(zhí)行或者效果沒有充分發(fā)揮,這可能是造成滿意度偏低的原因之一。

科學(xué)化的教育評(píng)價(jià)設(shè)計(jì)

除了在現(xiàn)行的考評(píng)上存在顯著差異外,在對(duì)于構(gòu)建科學(xué)化的教育評(píng)價(jià)設(shè)計(jì)上,中美兩國(guó)側(cè)重也不盡相同。

筆者基于對(duì)八本中國(guó)權(quán)威教育類綜合期刊篩選出的近三年評(píng)價(jià)主題相關(guān)論文的分析來看,大多數(shù)文獻(xiàn)側(cè)重于評(píng)價(jià)的基本理論探索和理論框架的構(gòu)建、引介及運(yùn)用。這與美國(guó)相關(guān)文獻(xiàn)側(cè)重于以評(píng)價(jià)解決實(shí)際教育問題,及教育政策和干預(yù)效果評(píng)價(jià)的實(shí)證研究有一定的差異。

為了了解美國(guó)當(dāng)前教育評(píng)價(jià)的目的與內(nèi)容、主要功能和科學(xué)方法,筆者對(duì)從美國(guó)教育評(píng)價(jià)領(lǐng)域最權(quán)威的學(xué)術(shù)期刊《教育評(píng)價(jià)與政策分析》中篩選的近三年來的81篇實(shí)證論文進(jìn)行了分析。

從搜集的81篇論文來看,當(dāng)前美國(guó)評(píng)價(jià)的主要內(nèi)容有:NCLB執(zhí)行效果的深入評(píng)價(jià)和持續(xù)問責(zé)、弱勢(shì)群體學(xué)生數(shù)學(xué)成績(jī)的提升、低收入家庭學(xué)生大學(xué)入學(xué)機(jī)會(huì)、校園突發(fā)事件對(duì)學(xué)生學(xué)業(yè)成績(jī)的影響等。這些文章也反映了美國(guó)教育評(píng)價(jià)中存在的兩個(gè)鐘擺現(xiàn)象:一是質(zhì)量和公平之間的平衡,另一個(gè)是知識(shí)和能力之間的均衡。評(píng)價(jià)的直接目的在于衡量學(xué)生的能力水平,而其終極目的是服務(wù)政策和教育公平。因此,美國(guó)教育評(píng)價(jià)更重視對(duì)政策干預(yù)效果的評(píng)價(jià),探尋國(guó)家資助項(xiàng)目對(duì)教育公平起了多大作用,尤其是對(duì)弱勢(shì)學(xué)生群體(移民學(xué)生、西班牙裔學(xué)生、黑人學(xué)生、英語(yǔ)非母語(yǔ)的學(xué)生、特殊教育的對(duì)象、來自低收入家庭的學(xué)生、學(xué)業(yè)成就低的學(xué)生、女學(xué)生等)的干預(yù)效果如何。

若說,美國(guó)教育評(píng)價(jià)的核心內(nèi)容是質(zhì)量與公平,那么其主要功能則是問責(zé)和改進(jìn)。

依據(jù)對(duì)81篇論文的分析,筆者發(fā)現(xiàn)59%的教育評(píng)價(jià)旨在完善政策和干預(yù)措施,32%的評(píng)價(jià)指向問責(zé),其他9%的評(píng)價(jià)則意在引起政府關(guān)注、促進(jìn)管理加強(qiáng)。例如,布萊恩·雅各布等學(xué)者對(duì)密歇根優(yōu)秀課程(MMC)的效果進(jìn)行了評(píng)價(jià)與問責(zé),發(fā)現(xiàn)MMC所包含的較高期望對(duì)學(xué)生的學(xué)習(xí)成績(jī)影響不大。

事實(shí)上,在美國(guó)教育評(píng)價(jià)的問責(zé)和改進(jìn)功能往往是同時(shí)實(shí)現(xiàn)的!睹總(gè)學(xué)生都成功法案(ESSA)》就要求各州通過評(píng)價(jià)問責(zé)找出陷入困境的學(xué)校,繼而通過制定以證據(jù)為基礎(chǔ)的資助政策,扭轉(zhuǎn)其弱勢(shì)局面。

在美國(guó),教育評(píng)價(jià)的科學(xué)化設(shè)計(jì)是學(xué)者們關(guān)注的重點(diǎn)之一。

依據(jù)篩選的文獻(xiàn)可見,美國(guó)教育評(píng)價(jià)科學(xué)化設(shè)計(jì)有兩個(gè)特點(diǎn)。一是由于教育的滯后性特征,美國(guó)所有教育干預(yù)都要做到長(zhǎng)期跟蹤,否則教育效果不能顯現(xiàn)。二是強(qiáng)調(diào)使用實(shí)驗(yàn)方法(隨機(jī)實(shí)驗(yàn)和準(zhǔn)實(shí)驗(yàn)法)。所謂隨機(jī)實(shí)驗(yàn),就是將研究對(duì)象隨機(jī)分組,對(duì)不同組實(shí)施不同的干預(yù),以對(duì)照效果的差異,具有能夠最大程度地避免實(shí)驗(yàn)設(shè)計(jì)、實(shí)施中可能出現(xiàn)的各種偏倚,平衡混雜因素,提高統(tǒng)計(jì)學(xué)檢驗(yàn)的有效性等諸多優(yōu)點(diǎn),被公認(rèn)為是評(píng)價(jià)干預(yù)措施的金標(biāo)準(zhǔn)。例如:凱瑟琳· M·布羅頓等學(xué)者利用一項(xiàng)隨機(jī)實(shí)驗(yàn)發(fā)現(xiàn),威斯康星州的低收入家庭學(xué)生獲得額外助學(xué)金后,可以改善學(xué)生的學(xué)術(shù)成績(jī)和發(fā)展前景,從而得出了經(jīng)濟(jì)資助促進(jìn)大學(xué)成功的方式之一是通過資助來減少學(xué)生兼職工作的時(shí)間從而提升其學(xué)習(xí)效果的結(jié)論。

而常用的準(zhǔn)實(shí)驗(yàn)研究設(shè)計(jì)則有標(biāo)準(zhǔn)或目標(biāo)比較、等組對(duì)照、統(tǒng)計(jì)控制(前測(cè)和后測(cè)或只后測(cè))、統(tǒng)計(jì)控制—后測(cè)控制組設(shè)計(jì)、其他前測(cè)—后測(cè)控制組設(shè)計(jì)、其他后測(cè),僅從單個(gè)受試者設(shè)計(jì)中選取對(duì)照組的設(shè)計(jì)等。由于教育實(shí)驗(yàn)對(duì)象是學(xué)生,要符合倫理原則,很難嚴(yán)格控制所有無(wú)關(guān)變量,因此常常采用準(zhǔn)實(shí)驗(yàn)法,即在實(shí)驗(yàn)中未按隨機(jī)原則來選擇和分配被試,只把已有的研究對(duì)象作為被試,且只對(duì)無(wú)關(guān)變量作盡可能控制的實(shí)驗(yàn)。筆者篩選的文獻(xiàn)中,也是此類研究較多。

事實(shí)上,不論采用何種評(píng)價(jià)方法,評(píng)價(jià)最核心的還是提供證據(jù)。美國(guó)教育研究院按照是否采用對(duì)比的科學(xué)研究方法、是否有真正的控制組和實(shí)驗(yàn)組、是否隨機(jī)、是否能復(fù)制等標(biāo)準(zhǔn)區(qū)分了對(duì)“證據(jù)”“可能是證據(jù)”“沒有證據(jù)”的判定(詳見表1)。

在美國(guó)教育部和國(guó)家自然研究基金的每一個(gè)項(xiàng)目規(guī)劃中,必不可少的就是評(píng)價(jià),且是第三方評(píng)價(jià),重點(diǎn)是通過評(píng)價(jià)搜集數(shù)據(jù)以衡量項(xiàng)目干預(yù)的效果。干預(yù)的效果可以用效應(yīng)量來表達(dá),效應(yīng)量越大說明效果越好。影響效應(yīng)量的因素包括:干預(yù)的時(shí)間、參與者數(shù)量、開始時(shí)間(在學(xué)前班或幼稚園、一年級(jí)或以上)、結(jié)束時(shí)間(從干預(yù)結(jié)束到評(píng)價(jià)之間的時(shí)間間隔)、干預(yù)主題(閱讀、數(shù)學(xué)、語(yǔ)言、拼寫、其他科目)等。這值得中國(guó)學(xué)者借鑒,在評(píng)價(jià)設(shè)計(jì)中要注意控制好上述因素,最大程度地提高效應(yīng)量。

總之,在筆者看來,美國(guó)的經(jīng)驗(yàn)要批判性地借鑒。

首先,美國(guó)在對(duì)教育干預(yù)的及時(shí)性、過程性、客觀性、第三方評(píng)價(jià)方面的經(jīng)驗(yàn)可以為我們提供有益借鑒。尤其對(duì)于一些中美共存的教育問題,如能力分班等,美國(guó)已經(jīng)做了半個(gè)多世紀(jì)的探索和研究,并對(duì)每一種干預(yù)都進(jìn)行了評(píng)價(jià),其成果非常值得我們參考。

其次,在評(píng)價(jià)科學(xué)化方面,我們一方面要注重評(píng)價(jià)人才隊(duì)伍建設(shè),評(píng)價(jià)專家要兼有基礎(chǔ)研究和應(yīng)用研究的經(jīng)驗(yàn),同時(shí)還要專門培養(yǎng)教育政策評(píng)價(jià)方向的研究生;另一個(gè)方面要加強(qiáng)實(shí)證研究及教育數(shù)據(jù)庫(kù)的建設(shè)。美國(guó)教育評(píng)價(jià)研究的發(fā)展離不開健全的、數(shù)據(jù)詳實(shí)且及時(shí)更新的、公開的數(shù)據(jù)庫(kù)資源。

最后,筆者建議我國(guó)不妨也創(chuàng)辦一本權(quán)威的、國(guó)際化的教育評(píng)價(jià)期刊,這將有利于集中中國(guó)教育評(píng)價(jià)的成果,同時(shí)也有利于國(guó)際交流與傳播。

(作者系美國(guó)馬薩諸塞大學(xué)波士頓分校終身教授、教育領(lǐng)導(dǎo)學(xué)系主任)


 

圖1中美學(xué)生考試在評(píng)價(jià)中的權(quán)重對(duì)比示意圖

表1關(guān)于證據(jù)質(zhì)量的分類

中國(guó)-博士人才網(wǎng)發(fā)布

聲明提示:凡本網(wǎng)注明“來源:XXX”的文/圖等稿件,本網(wǎng)轉(zhuǎn)載出于傳遞更多信息及方便產(chǎn)業(yè)探討之目的,并不意味著本站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性,文章內(nèi)容僅供參考。

相關(guān)文章