跳到主要內容

學生評分:神話vs.研究證據

本文最初發表於CFT通訊2003年秋季號,教學論壇。

邁克爾Theall博士。

以下文章經作者和授權轉載關注教師(2002年秋季),由楊百翰大學教員中心出版,D.林恩·索倫森主編。

Michael Theall在教學設計、開發和評估方麵有26年的教學經驗。他在三所大學(伊利諾伊大學、阿拉巴馬大學和揚斯敦州立大學)建立了教學、學習和評估的教師中心。Theall和她的同事Jennifer Franklin最近獲得了美國教育研究協會(AERA)頒發的職業成就獎。他們是《學生評分辯論》一書的作者機構研究的新方向(2001),在眾多其他研究出版物中。

在許多大學校園裏,學生對教學的評分都是備受爭議的話題。不幸的是,這些爭論往往沒有被這一主題的廣泛研究所了解。馬什對學生評級研究的評論經常被引用,他認為學生評級數據是:a)多維度的;B)可靠、穩定;C)主要是教授課程的講師的功能;D)相對有效的各種有效教學指標;E)相對不受假設為潛在偏差的各種變量的影響;f)被教師、學生和管理人員認為是有用的。[1]

研究人員綜合了所有主要的評級研究,得出了與馬什相同的結論。但是,即使這些數據在技術上是嚴謹的,其中一個主要問題是日常實踐:學生評分經常被誤解、誤用,而且沒有伴隨其他信息,讓用戶做出合理的決策。結果,人們對評級產生了大量的懷疑、焦慮,甚至敵意。關於學生評分,通常會提出幾個問題。目前的研究為這些問題提供了答案。

  • 學生有資格評價他們的老師和他們所接受的教學嗎?
  • 收視率僅僅基於受歡迎程度嗎?
  • 評分與學習有關嗎?
  • 收視率受情景變量影響嗎?
  • 學生是根據預期(或收到的)成績來評價老師的嗎?
  • 學生在學習的同時能做出準確的判斷嗎?
  • 良好評估實踐指南
  • 筆記和參考書目
    學生有資格評價他們的老師和他們所接受的教學嗎?

    一般來說,答案是肯定的。學生可以報告老師行為的頻率,需要做的工作量,他們覺得自己學到了多少,以及材料的難度。他們可以回答關於講課質量、閱讀材料和作業的價值、講師講解的清晰度、講師的可用性和幫助性,以及教學過程的許多其他方麵的問題。沒有人有資格報道這學期發生的事情,因為整個學期都沒有其他人在場。學生當然有資格表達他們對這種經曆的滿意或不滿意。在任何情況下,他們都有權表達自己的意見,其他人不能報告這次經曆在多大程度上是有用的、有成效的、有信息的、令人滿意的或有價值的。雖然對這些問題的意見不能直接衡量教師的表現或所學內容,但它們是學生滿意度的合理指標;有大量的研究將這種滿意度與有效的教與學聯係起來。

    但學生不一定有資格報道所有問題。例如,初學的學生不能準確地評價教師對該學科的知識。同事的評分更適合這個目的。同樣,同齡人更有資格判斷內容流通、課程匹配、課程設計或評估方法。學生和同齡人都處於獨特的位置,可以提供啟發性的觀點。為了進行有效的評估,記得使用多種來源的數據,並提出受訪者可以合理回答的問題。

    回到頂部

    收視率僅僅基於受歡迎程度嗎?

    這種論點沒有根據,也沒有研究可以證實它。當這個話題出現時,“流行”這個詞從來沒有定義過。相反,這意味著學習應該是不愉快的,“受歡迎”的陳述通常伴隨著一個趣聞軼事,暗示“我有過的最好的老師是我最討厭的。”認為受歡迎某種程度上意味著缺乏實質內容、知識或挑戰的假設是完全沒有道理的。事實上,一些研究表明,在老師對學生和他們的學習表現出興趣/關心的課程中,學生學得更多;當然,這些老師也會得到更高的評價。

    回到頂部

    評分與學習有關嗎?

    最好的教學標準是學生的學習。學生對某門課程“學習量”的評價與學生對該老師和這門課程的總體評價之間始終存在高度相關性。更能說明問題的是采用統一期末考試的多部分課程的研究。[2]總的來說,學生在考試中表現最好的老師對學生的評價是最高的。這些研究是學生評分有效性的最有力證據,因為它們將評分與學習聯係起來。

    回到頂部

    收視率受情景變量影響嗎?

    研究表明,評級是穩健的,不會受到情境變量的很大影響。但我們必須記住,概括不是絕對的陳述。總會有一些變化。例如,我們知道,物理科學的必修課、大量招生的非專業課程獲得的平均評分低於幾乎所有其他學科的選修、高水平的專業課程。這是否意味著教學質量各不相同?不一定。它確實表明,在某些條件下,有效的教與學可能更難實現。這裏有一個關於評估實踐的關鍵原則:為了公平,基於評分的教師教學表現的比較應該使用來自類似情況的足夠多的數據。如果把一個教10名學生的研究生研討會的有經驗的教授的評分與一個教300名注冊學生的入門級必修課的新教師的一次性評分進行比較,那將是非常不公平的。

    回到頂部

    學生是根據預期(或收到的)成績來評價老師的嗎?

    這是目前評級研究中最具爭議的問題。分數和評分之間的關係有一致的證據:大約0.20的適度相關性。多部分效度研究(在問題3中提到)提供了最可靠的證據,說明評分反映了學習情況(相關性約為0.43)。這些發現引出了大多數研究人員得出的結論:評分和成績之間應該存在關係,因為有效的教學導致學習,而學習又導致學生的成績和滿意度。評級僅僅反映了這一順序。

    回到頂部

    學生在學習的同時能做出準確的判斷嗎?

    一些人認為,學生要在離開教室多年後才能辨別出真正的質量。沒有研究可以證明這一說法:然而,有幾項研究比較了同一學生在下學期、第二年、畢業後立即和幾年後在課堂上的評分。[3]所有這些研究都報告了相同的結果:盡管學生後來可能意識到某門課或多或少比他們認為的重要,但學生對老師的看法卻很少隨著時間的推移而改變。在課堂上得分高的老師,以後的評價也會很高,而那些在課堂上得分低的老師,以後的評價也會一直很差。這個問題與評級總體可靠性這一更大的技術問題有關。研究表明,評級是非常可靠的。無論可靠性是在班級內、跨班級、隨時間推移或以其他方式衡量的,學生的評分都是非常一致的。

    回到頂部

    良好評價實踐指南

    除了強調學生評分是評估的重要組成部分外,Theall還提出了改進整個教學評估過程的幾點規則。

    • 確定評估的目的和用戶將是誰
    • 讓涉眾參與評估過程和政策的決策
    • 記住個人需求和機構需求之間的平衡
    • 公開提供關於評估標準、過程和程序的明確信息
    • 建立合法的程序,包括申訴製度
    • 確保為改進和支持教學和教師提供資源beplay体育钱包维护中
    • 建立一個連貫的評估“係統”,而不是一個零敲碎打的過程
    • 為管理係統的人員建立明確的職責/報告線
    • 投資於上級評估係統,並定期進行評估
    • 使用、調整或開發適合機構/個人需要的工具
    • 對評估決策使用多種信息來源
    • 收集評級數據並驗證所使用的儀器
    • 製作易於理解和準確的報告
    • 教育評級結果的使用者避免誤用和曲解
    • 保持形成性評估的機密性,並與最終決策分開
    • 在總結性決策中,根據類似教學情況的數據對教師進行比較
    • 考慮在評估和其他目的中適當使用評價數據
    • 必要時尋求專家和外界的協助

    底線是:好的實踐導致好的決策。

    回到頂部

    筆記和參考書目

    筆記

    1. 學生對大學教學的評價:研究發現、方法問題和未來研究的方向。《教育研究》,1987,11,253-388。
    2. 學生對教學的評分與學生成績:多部分效度研究的元分析>。教育研究評論,1981,51,281-309。
    3. 確定教師的效能。舊金山:喬西·巴斯,1979年;學生教學評價的效度。時間有關係嗎?”高等教育學報,1976,3,327 -336。

    引用和參考書目

      《發展全麵的教師評價體係》第二版,博爾頓,麻州:安克出版公司,2000年。
      布拉斯坎普,洛杉磯和j·c·奧裏。評估員工的工作。舊金山:喬西·巴斯,1994年。
      反思性教師評估。舊金山:喬西·巴斯,1993年。
      克納珀,C.和克蘭頓,P.編。《教學評價的新方法》教學新方向88(2001年冬季)。
      M., P. A. Abrami, L. Mets,編。“學生評分之爭。他們是有效的嗎?我們怎樣才能最好地利用它們?”製度研究的新方向109(2001)。
      M·l·富蘭克林。複雜評價係統背景下的學生評分。在M. Theall和J. Franklin,編。“學生對教學的評價:改進實踐的問題。”教學新方向43(1990)。
Baidu
map