
龍源期刊網
正確理解英語寫作測試的評分方法
作者:趙妮娜閆丹
來源:《中國校外教育·理論》2010年第05期
[摘要]交流是學習外語的最終目的。語言測試在經歷了幾個發展階段后,已從單純追求考
試信度過渡到注重考試效度。在筆試中提高考試的效度,意味著增加能直接測量考生語言能力
項目的比重。寫作能力的測試就通常通過這種直接測試的方法來衡量考生的寫作水平。本文旨
對英語寫作測試的評分方法進行探討。
[關鍵詞]交流英語寫作測試評分方法
在我國,英語并非我們的母語,英語寫作是交流的主要形式之一,學習者讀寫能力的重要性不
言而喻。由于這個原因,寫作教學歷來都是外語教學中必不可少的一個環節。另外,由于大多數
的考試都是以筆試的方式進行,寫作能力對考生在考試中的表現也有很大的影響。盡管寫作幾
乎自有史以來就一直伴隨著人類社會的發展,但是人們對寫作的大規模研究卻是在20世紀初才
開始。在筆試中提高考試的效度,意味著增加能直接測量考生語言能力項目的比重。所謂直接
測量,即讓考生在考試環境內運用被試能力。寫作能力的測試就通常通過這種直接測試的方法
來衡量考生的寫作水平。大規模考試中包含寫作項目,無論是命題作文還是應用文,無論自由寫
作程度高或低,已成為當前語言測試的一大趨勢。
Heaton(2000)的研究表明,寫作能力不僅是一個復雜的系統,而且是一個不斷發展的系統。通
過一篇文章來正確、客觀、全面地評價學習者的寫作能力絕非易事。對于寫作測試來說,考試
信度主要涉及評分問題。寫作測試的難點在評分。很多大規模測試同時也是高風險測試,其結
果不僅關系到測試本身的質量,同時也關系到考生個人命運和社會公正等問題。因此,正確理解
并把握好寫作測試的評分方法,就顯得尤為重要。
在二語或外語測試中,傳統的寫作評分有三種:整體評分(holisticscoring)、分解評分(analytic
scoring)和客觀評分(objectivescoring)。
一、整體評分(holisticscoring)或印象法(impressionmethod)
在大規模寫作測試中最常用的評分方法是整體評分(holisticscoring)。所謂整體評分,就是指
評分者快速地通讀待評作文,然后依據特定的評分量表(scoringscale)或者評分細則(scoringrubric)
評分。在評分過程中,評分者不打分項分。通常用1至5、1至10或1至15計分制。整體評分
的細則通常說明文本一共可以分為幾個等級,并對每個等級做出解釋。這種解釋的詳細程度在
不同的考試中會有很大的區別,但是一般都會涉及內容、組織、語言這三個方面。
龍源期刊網
整體評分的優點很突出,比如,評分效率很高,這在大規模考試中顯得尤為重要;具有較高的效
度,因為它強調讀者個人對文本的感受,因而更加符合自然的閱讀方法……但是不可否認,整體評
分也有一些內在的缺陷,評分者所提供的單一分數信息量不足,無法幫助人們了解考生寫作能力
的詳細情況;信度較低,由于評分者對評分標準的把握不可能完全相同,對同一文本往往會給出懸
殊很大的分數;另外,在整體評分中很多評分者會受到一些表面因素的干擾,如文章長度和卷面整
潔程度等,這都有可能降低評分的效度(Weigle,2002:114)。
二、分項評分(analyticscoring)或分析法(analyticalmethod)
分項評分或分析法,是按語言的不同組成部分—內容、文章結構、詞匯、語用、標點等五
方面分別打分,并根據考試要求決定各部分不同的權重。尤其在日常教學中,教師不大可能找到
三四個同事幫助改作業,較好的評分方法就是借助分項評分,把一篇作文分成若干項目,按照事先
集體規定的評分標準,對每項分別評分,最后統計總分數。
分項評分的最大好處是分數能提供豐富的信息,有助于提高評分信度。我們可以從不同方
面的分數中得知考生寫作能力的不同側面,并在此基礎上對考生的能力做出更準確的推測。考
生很容易知道自己文章到底哪方面不符合標準。但比起整體評分,分項評分比較費時費力,在大
規模測試中不易實行;分項評分要求評分者把注意力放在對文本不同側面的評價上,違背了一般
的閱讀規律,因而降低了評分的效度(鄒申,2005)……
三、客觀評分(objectivescoring)或計算錯誤法(error-countmethod)
不受任何主觀干擾的評分方法應為客觀評分,即數出文章中的錯誤,按錯誤數目扣分。這種
方法看似公平,其實弊端很多。首先,錯誤性質不同,嚴重程度不同,扣同樣的分數是不合理的;其
次,即使硬性規定語法錯誤比拼法錯誤嚴重,要多扣一倍的分數,也是主觀判斷而已。這種方法的
致命弱點是,它只注意文章的缺點,忽視了最根本的東西—思想表達,是否言之有物,是否達意通暢
(Heaton,2000)。
寫作測試屬于主觀性測試,對于同一篇作文,不同的老師給的分數很可能不一樣。甚至同一
位老師在不同的時間給的分數也不一樣。因此,寫作測試的評分主觀性和片面性是不可避免
的。但是,不管采用哪種評分方法,最好設一兩個巡視檢查人員,隨意抽查某一個評分員,看其是否
評分忽高忽低。一個人的評分始終偏高或偏低,問題倒不嚴重,只要堅持一個標準,最后可以校正
過來。最可怕的是忽高忽低,看不出評分標準,到頭來無法校正。總之,每一種評分方法都各有自
己的優勢和不足。在具體的測試中使用哪種方法,應該根據測試的目的和重要性來決定。要考
慮的因素主要包括對信度的要求、考試成績對考生的影響與可改變性以及人力物力資源等。
參考文獻:
[1]吳一安.題型與聽力測試的有效性[J].外語教學與研究,2001,(02).
[2]劉建達.測試方法對閱讀測試的影響[J].外語教學與研究,1998,(02).
龍源期刊網
本文發布于:2023-03-01 06:34:45,感謝您對本站的認可!
本文鏈接:http://m.newhan.cn/zhishi/a/167762368566077.html
版權聲明:本站內容均來自互聯網,僅供演示用,請勿用于商業和其他非法用途。如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。
本文word下載地址:吳一安.doc
本文 PDF 下載地址:吳一安.pdf
| 留言與評論(共有 0 條評論) |