跳到主要內容

學生評分:神話vs.研究證據

本文最初發表於《中國金融時報》2003年秋季刊,教學論壇。

邁克爾Theall博士。

以下文章經作者和作者授權轉載關注教師(2002年秋季),楊百翰大學教師中心出版,D. Lynn Sorenson編輯。

Michael Theall擁有26年的教學經驗,是教學設計、開發和評估方麵的專業人士。他在三所大學建立了教學、學習和評估中心:伊利諾伊大學、阿拉巴馬大學和揚斯敦州立大學。Theall和他的同事Jennifer Franklin最近獲得了美國教育研究協會(AERA)頒發的職業成就獎。他們是“學生評分辯論”的作者,這是一本專著機構研究新方向(2001),在眾多其他研究出版物中。

在許多大學校園裏,學生對教學的評價都是爭論不休的話題。不幸的是,這些爭論往往不被廣泛的研究這個主題。馬什經常被引用的對學生評分研究的評論表明,學生評分數據是:a)多維的;B)可靠穩定;C)主要是教授課程的講師的功能;D)對有效教學的各種指標相對有效;E)相對不受各種假設為潛在偏差的變量的影響;f)被老師、學生和管理人員認為是有用的。[1]

綜合了所有主要評級研究的研究人員得出了與馬什相同的結論。但是,即使數據在技術上是嚴格的,其中一個主要問題是日常實踐:學生評分經常被誤解,誤用,並且沒有與其他信息一起,讓用戶做出合理的決定。因此,人們對評級產生了極大的懷疑、焦慮,甚至敵意。關於學生評分,人們通常會提出幾個問題。目前的研究為其中許多問題提供了答案。

  • 學生是否有資格評價他們的老師和他們所接受的指導?
  • 收視率僅僅基於受歡迎程度嗎?
  • 評分與學習有關嗎?
  • 評分受情境變量的影響嗎?
  • 學生是否根據期望(或收到)成績來給老師打分?
  • 學生還在上學的時候能做出準確的判斷嗎?
  • 良好評估實踐指南
  • 筆記和參考書目
    學生是否有資格評價他們的老師和他們所接受的指導?

    一般來說,答案是肯定的。學生可以報告教師行為的頻率,所需的工作量,他們覺得自己學到了多少,以及材料的難度。他們可以回答關於授課質量、閱讀材料和作業的價值、教師解釋的清晰程度、教師的可用性和幫助性,以及教與學過程的許多其他方麵的問題。沒有其他人有資格報告這學期發生的事情,隻是因為整個學期沒有其他人在那裏。學生當然有資格表達他們對這一經曆的滿意或不滿意。在任何情況下,他們都有權表達自己的意見,沒有人能報告這種經曆的有用程度、生產效率、信息豐富程度、令人滿意程度或價值。雖然對這些問題的意見不是對教師表現或所學內容的直接衡量,但它們是學生滿意度的合理指標;有一個堅實的研究基礎將這種滿意度與有效的教學和學習聯係起來。

    但學生不一定有資格報道所有問題。例如,初學的學生不能準確地評價老師對該學科的知識。同事的評分更適合這個目的。同樣,同齡人更有資格判斷內容流通、課程匹配、課程設計或評估方法。學生和同齡人都處於獨特的位置,提供具有啟發性的觀點。為了有效的評估,記住使用多種來源的數據,並提出被調查者能夠合理回答的問題。

    回到頂部

    收視率僅僅基於受歡迎程度嗎?

    這一論點沒有根據,也沒有研究來證實它。當這個話題出現時,“流行”一詞從未被定義過。相反,它暗示學習應該是不愉快的,而“受歡迎”的說法通常伴隨著這樣一件軼事:“我曾經遇到的最好的老師是我最討厭的老師。”認為受歡迎某種程度上意味著缺乏實質內容、知識或挑戰的假設是完全沒有道理的。事實上,一些研究表明,如果老師對學生和他們的學習表現出興趣/關心,學生就能學到更多的東西;當然,這些老師也得到了更高的評價。

    回到頂部

    評分與學習有關嗎?

    最好的教學標準是學生的學習。學生對某門課程“學到的東西”的評價與學生對老師和這門課程的總體評價之間一直存在著高度的相關性。更能說明問題的是采用共同期末考試的多部分課程的學習。[2]一般來說,學生評分最高的老師的學生在考試中表現最好。這些研究是證明學生評分有效性的最有力證據,因為它們將評分與學習聯係起來。

    回到頂部

    評分受情境變量的影響嗎?

    研究表明,評級是穩健的,不受情境變量的很大影響。但我們必須記住,一概而論並不是絕對的陳述。總會有一些變化。例如,我們知道,在幾乎所有其他學科中,物理科學專業外的必修課程比選修課、高級專業課程的平均分數更低。這是否意味著教學質量參差不齊?不一定。它確實表明,在某些條件下,有效的教學可能更難實現。這裏嵌入了一個評價實踐的關鍵原則:為了公平,基於評分的教師教學表現比較應該使用來自類似情況的足夠數量的數據。一個有經驗的教授教一個有十名學生的研究生研討班,而一個新老師教一門入門級的必修課,有300名學生參加,把他的評分和他的一次性評分進行比較是非常不公平的。

    回到頂部

    學生是否根據期望(或收到)成績來給老師打分?

    這是目前評級研究中最具爭議的問題。有一致的證據表明等級和評級之間的關係:適度的相關性約為0.20。多部分效度研究(在問題3中提到)提供了最可靠的證據,證明評分反映了學習(相關性約為0.43)。這些發現導致了大多數研究人員得出的結論:評分和成績之間應該存在關係,因為有效的教學導致學習,從而導致學生的成績和滿意度。評級隻是反映了這一順序。

    回到頂部

    學生還在上學的時候能做出準確的判斷嗎?

    一些人認為,學生在離開教室多年之後才能辨別出真正的品質。沒有研究可以證明這一說法:然而,有幾項研究比較了同一群學生在下個學期、下一年、畢業後不久以及幾年後的課堂評分。[3]所有這些研究報告的結果都是一樣的:盡管學生後來可能會意識到某一學科比他們認為的更重要或更不重要,但隨著時間的推移,學生對教師的看法幾乎沒有變化。在課堂上被評價高的老師以後也會被評價高,而那些在課堂上評價低的老師以後也會被評價低。這個問題與評級的整體可靠性這一更大的技術問題有關。研究表明,評級是非常可靠的。無論可靠性是在班級內、班級間、時間上還是以其他方式衡量的,學生評分都是非常一致的。

    回到頂部

    良好評價實踐指南

    除了強調學生評分是評估的重要組成部分外,Theall還提出了一些改進整個教學評估過程的規則。

    • 確定評估的目的和用戶
    • 讓利益相關者參與評估過程和政策的決策
    • 牢記個人需求和機構需求之間的平衡
    • 公開展示關於評估標準、過程和程序的清晰信息
    • 建立一個合法的辯護程序,包括一個申訴係統
    • 確保為教學和教師提供改進和支持的資源beplay体育钱包维护中
    • 建立一個連貫的評估“係統”,而不是一個零敲碎打的過程
    • 為管理係統的人員建立明確的責任/報告線
    • 對上級考核體係進行投入,定期進行考核
    • 使用、調整或開發適合機構/個人需要的工具
    • 使用多種信息源進行評估決策
    • 收集評級數據並驗證所使用的儀器
    • 製作易於理解和準確理解的報告
    • 教育評分結果的使用者,避免誤用和誤解
    • 對形成性評價進行保密,並與最終決策分開
    • 在總結性決策中,根據來自相似教學情況的數據對教師進行比較
    • 考慮將評估數據用於評估和其他目的的適當使用
    • 在必要/適當時尋求專家或外部援助

    底線是:良好的實踐導致良好的決策。

    回到頂部

    筆記和參考書目

    筆記

    1. 《學生對大學教學的評價:研究成果、方法問題和未來研究的方向》。國際教育研究雜誌,1987,11,253-388。
    2. 教學與學生成績的學生評分:多元效度研究的元分析>。教育研究評論,1981,51,281-309。
    3. 確定教員的效能。舊金山:喬西·巴斯,1979;學生教學評分的有效性。時間有關係嗎?”高等教育學報,1976,3,327-336。

    引用和參考書目

      《開發教師綜合評估係統》,第二版,馬波頓:Anker出版公司,2000。
      洛杉磯的布拉斯坎普和j.c. Ory。評估員工的工作。舊金山:喬西·巴斯,1994年。
      教師反思評估。舊金山:喬西·巴斯,1993年。
      C.克蘭頓編輯。《教學評價的新方法》教學新方向88(2001年冬季)。
      Theall, M., P. A. Abrami, L. Mets主編。“學生評分辯論。他們是有效的嗎?我們如何最好地利用它們?”學術研究的新方向109(2001)。
      Theall, M.和J. L. Franklin。複雜評價係統中的學生評分。M. Theall和J. Franklin編。學生評價教學:提高實踐的問題教學與學習新方向43(1990)。
Baidu
map