跳到主要內容

應試強化學習:利用檢索練習幫助學生學習

辛西婭·j·布拉姆著
雷切爾比爾

打印版本

引用本指南:Brame, c.j .和Biel, R.(2015)。考試增強學習:通過考試促進本科科學課程學習的潛力。生命科學教育本指南中的信息已在cbe -生命科學教育(www.lifescied.org/content/14/2/es4.full.pdf+html)上發表。”

什麼是“考試強化學習”?

從本質上說,考試增強學習是指記憶概念或事實的過程——從記憶中檢索它們——增加了對這些概念或事實的長期記憶。這個想法,也被稱為測試效應,建立在無數研究的基礎上,這些研究考察了不同類型的“測試”(提示促進檢索)與學習相比促進學習的能力。這是認知心理學中最一致的發現之一(Roediger和Butler 2011;Roediger和Pyc 2012)。

在某些方麵,“測試增強學習”和“測試效果”這兩個術語是用詞不當的,因為使用“測試”這個詞會讓人聯想到高風險的總結性評估的概念。事實上,大多數或所有闡明測試效果的研究都考察了低風險檢索實踐對延遲彙總評估的影響。真正增強學習的“測試”是伴隨著這些實驗學習的低風險檢索實踐。

考慮到這一點,考試效果可以成為教師和學生學習工具包中的一個強大工具。

在本教學指南中,我們從認知心理學文獻中提供了關於測試效果的六個觀察結果,總結了導致這些結論的一到兩個關鍵研究。我們選擇的研究對象是學習教育相關材料的本科生(例如,文本段落而不是單詞組合)。我們還建議在課堂上實施測試增強學習的方法,以及需要記住的重要注意事項。

關於檢索練習的效果,研究告訴了我們六件事

1.重複檢索增強了實驗室環境中的長期保留

主動從記憶中提取信息可以改善記憶的想法並不新鮮:威廉·詹姆斯(William James)在1890年提出了這一想法,埃德溫娜·阿博特(Edwina Abbott)和亞瑟·蓋茨(Arthur Gates)在20世紀初為這一想法提供了支持th世紀(詹姆斯,1890;阿伯特,1909;蓋茨,1917)。然而,在過去的十年中,關於測試的好處的證據越來越多。

在一項有影響力的研究中,Roediger和Karpicke利用教育相關條件調查了單一測試事件與多次測試事件對長期留存率的影響(Roediger和Karpicke, 2006)。他們的目標是確定學生接受測試的次數和測試效果的大小之間是否存在任何聯係。研究人員在實驗室環境中與本科生一起工作,要求他們閱讀大約250字長的文章。作者比較了三種情況(見圖1):學生學習文章四次,每次五分鍾(SSSS組);那些將文章學習三遍並完成一次回憶測試的學生(SSST組),在該測試中,他們拿到一張白紙,並被要求盡可能多地回憶文章內容;STTT組:先學習一遍,再進行三次回憶練習。然後,研究人員在五分鍾或一周後對學生的記憶力進行測試,使用的是與檢索練習相同的回憶測試。

有趣的是,根據執行最終測試的時間不同,結果有顯著差異。在學習時間(即5分鍾)結束後很快參加期末考試的學生從重複學習中受益,SSSS組表現最好,SSST組表現次之,而STTT組表現最差。這一結果表明,當所學習的信息隻需要很短的時間時,學習是更有效的。然而,當長期用戶留存是目標時,測試便更有效。研究人員發現,當最終測試推遲一周後,結果正好相反,STTT組的表現比SSST組高約5%,比SSSS組高約21%。測試比重複學習對長期記憶的影響更大,重複測試的參與者比隻測試一次的參與者記憶率更高。練習三次(STTT組)。然後,研究人員在五分鍾或一周後對學生的記憶力進行測試,使用的是與檢索練習相同的回憶測試。

這裏描述的研究是眾多關於測試效果的豐富文獻中的一項;最近的幾篇綜述文章對這一領域的工作進行了全麵概述(Roediger和Butler, 2011;羅迪格和卡爾皮克,2006b;Roediger, Putnam和Smith, 2011)。

2.不同的考試形式可以增強學習。

史密斯和卡爾皮克研究了不同類型的問題是否在誘導測試效應方麵同樣有效(2014)。研究人員在實驗室環境中對本科生進行了一係列實驗,考察了簡答(SA)、多項選擇(MC)和混合SA/MC格式對提高學生從文本中記憶信息的能力的效果。在一個實驗中,五組學生被比較(見圖3)。學生閱讀四篇文章,每篇大約500字長。每組結束後,四組學生分別參加不同類型的檢索練習,第五組為無檢索對照組。一周後,學生們回到實驗室,對每一篇閱讀文章進行簡答測試。

與其他研究結果相印證的是,參加了某種檢索練習的學生在最終評估中的表現要好得多,答對的問題大約是沒有任何檢索練習的學生的兩倍。無論是直接從文本中獲取信息的問題,還是需要從文本中推斷的問題,都是如此(見圖4)。有趣的是,不同類型的檢索實踐所帶來的好處沒有顯著差異;閱讀後的多項選擇題、簡答題和混合題對提高學生的學習效果同樣有效。該係列的其他實驗基本上複製了這些結果,盡管一個實驗確實發現,混合檢索練習(簡答+多項選擇)在讓學生準備短閱讀文章中的逐字逐句問題組成的簡答測試中有輕微的優勢。這些結果表明,測試的好處與特定類型的檢索實踐無關,而是與一般的檢索實踐有關。

這項研究和其他研究都表明,多種題型可以帶來與測試相關的好處。上下文似乎可以決定哪一種問題類型提供最大的益處,自由回憶問題、多項選擇問題、混合自由回憶/多項選擇問題和線索回憶問題都比單獨研究提供顯著的益處。該領域最有影響力的研究表明,自由回憶比其他問題類型提供更大的益處(見Pyc等人,在新聞界),但這裏描述的結果揭示了一個未完全回答的問題。

3.反饋增強了測試的好處。

已經做了大量的工作來檢查反饋對測試效果的作用。巴特勒Roediger設計了一個實驗,讓本科生學習12段曆史文章,然後在實驗室環境中進行多項選擇測試(Butler and Roediger, 2008)。學生們要麼沒有得到反饋,要麼立即得到反饋(即,在每個問題之後),要麼得到延遲反饋(即,在完成42個項目的測試之後)。一周後,學生們回來參加了一項全麵的線索回憶測試。雖然在閱讀文章後簡單地完成多項選擇題確實提高了最終測試的表現,與測試效果的其他報告相對應,反饋提供了額外的好處(見圖5)。有趣的是,延遲反饋比立即反饋導致了更好的最終表現,盡管兩種情況都顯示了比沒有反饋的好處。

4.學習不局限於死記硬背。

對於使用測試作為教學和學習策略,教師可能會擔心的一個問題是,它可能會促進死記硬背。雖然大多數教師都認識到記憶在讓學生在他們的學術領域取得好成績方麵起著重要作用,但他們希望學生能夠做的不僅僅是簡單地記住和理解事實,而是獲得更高的認知結果(Bloom, 1956)。一些研究解決了這個問題,報告的結果表明,測試提供的好處不僅僅是提高簡單的回憶。例如,史密斯和卡爾皮克(2014)的研究確定了測試對學生從閱讀文章中回憶特定事實的影響,以及他們回答需要推理的問題的能力。在這些研究中,作者將推論定義為得出結論文章中沒有直接陳述,但可以從文章中的多個事實綜合得出.研究人員觀察到,閱讀後的測試提高了學生在延遲測試中回答這兩類問題的能力,從而提供了證據,證明測試的好處不僅限於那些隻需要死記硬背的答案。

在2011年的一項研究中,卡爾皮克和布朗特試圖直接解決檢索練習是否能促進學生在更高階認知活動中的表現這一問題。他們調查了檢索練習對大學生科學概念學習的影響,比較了檢索練習與精化學習技術、概念映射的效果(Karpicke and Blunt, 2011)。在一項實驗中,學生們學習一篇科學文章,然後被分為四種情況:一種是隻學習一次的情況,在這種情況下,他們不再與文章中的概念進一步互動;一個重複的研究條件,在這個條件下,他們額外學習了四次課文;在精練學習條件下,他們再學習一次文本,接受概念映射的訓練,並繪製文本中概念的概念圖;在檢索練習條件下,他們完成了一個自由回憶測試,然後是一個額外的學習時間和回憶測試(見圖6)。所有學生被要求在一周內完成一個預測他們回憶情況的自我評估;重複學習組的學生比其他任何一組的學生都能更好地回憶。一周後,學生們返回學校參加簡答測試,其中包括可以逐字逐句回答的問題和需要從文本中推理的問題。檢索練習組的學生在逐字題型和推理題型上的成績均顯著優於其他組組。然後,作者詢問,如果最終測試包含概念映射練習,那麼這些結果是否會繼續保持檢索練習的優勢(見圖7)。作者觀察到,在兩種類型的最終測試(簡答和概念映射)中,檢索練習比使用概念映射的精細化研究產生了更好的表現。當他們檢查個體學習者的效果時,他們發現84%(101/120)的學生在期末考試中表現更好,當他們使用檢索練習而不是概念映射作為學習策略時。

5.測試可以促進進一步的研究

Wissman, Rawson和Pyc報告的工作表明,對一組材料的檢索練習可以促進後續材料的學習,這些材料可能相關或不相關(Wissman, Rawson, and Pyc, 2011)。具體來說,他們調查了“中期測試”的使用。本科生被要求閱讀一篇文章的三個部分。在“中期測試”組中,他們在閱讀完前兩部分後接受測試,特別是輸入他們能記住的關於文本的所有內容。完成中期試驗後,他們被推進到下一段材料。“沒有中間測試”組閱讀了所有三個部分,中間沒有測試。兩組人都在閱讀完第三部分後進行了測試。有趣的是,完成了第1部分和第2部分臨時測試的那組學生回憶起的第三部分的“概念單元”是沒有參加臨時測試的學生的兩倍。當第1節、第2節和第3節是關於不同的主題和相關的主題時,我們都觀察到了這個結果。因此,測試的好處可能超出目標材料。

6.考試的好處似乎延伸到了課堂上。

上述所有報告都集中在實驗室環境下進行的實驗。此外,有幾項研究表明,考試的好處也可能延伸到課堂上。

2002年,Leeming使用“一天考試”的方法來教授心理學入門課程(Leeming, 2002)。他發現,那些每天都完成一門考試的學生,而不是那些涵蓋大塊材料的考試的學生,在學期末進行的記憶測試中得分明顯更高。

Larsen、Butler和Roediger詢問,在一次說教會議上,是否觀察到住院醫生對癲癇狀態和重症肌無力這兩種神經疾病的學習有測試效果(Larsen等人,2009年)。具體來說,住院醫生參與了一個關於這兩個主題的互動教學環節,然後被隨機分為兩組。一組學習重症肌無力複習表並進行癲癇持續狀態測試,另一組學習重症肌無力複習表並進行癲癇持續狀態測試。六個月後,這些居民完成了關於這兩個主題的測試。作者觀察到,測試條件產生的最終測試分數平均比研究條件高13%。

Lyle和Crawford研究了檢索練習對本科生統計學課堂學生學習的影響(Lyle和Crawford, 2011)。在課程的一個部分,學生們被要求在每節課的最後5到10分鍾回答2到4個問題,這些問題要求他們從記憶中檢索當天課程的信息。在本學期的課程中,使用這部分課程的學生的考試成績比沒有使用檢索練習方法的學生高出約8%,這在統計上是一個顯著的差異。

其他的課堂研究由麥克丹尼爾、懷爾德曼和安德森(2012)、奧爾和福斯特(2013)和斯坦格-霍爾及其同事(2011)發表。

為什麼它有效?

人們提出了幾種假設來解釋測試的影響。檢索努力假說表明,涉及檢索的努力提供了測試效益(Gardiner, Craik,和Bleasdale, 1973)。這一假設預測,需要產生一個答案而不是承認一個答案的測試將提供更大的好處,這是在一些研究中觀察到的結果(Butler和Roediger, 2007;Pyc和Rawson, 2009),而不是其他人(Little和Bjork, 2012;Smith和Karpicke的一些實驗,2014;一些實驗在Kang, McDermott和Roediger 2007)。

比約克和比約克的廢棄新理論為解釋測試的好處提供了另一種假設(比約克和比約克,1992)。這個理論假設記憶有兩個組成部分:存儲強度和檢索強度。檢索事件提高了記憶強度,增強了整體記憶,而且在遺忘點的效果最為明顯——也就是說,當檢索強度較高時,在遺忘點進行檢索比重複檢索對記憶的影響更大。這一理論與實驗一致,實驗表明,當期末考試前的延遲很短時,學習與考試一樣或更有效(例如,參見Roediger和Karpicke 2006),因為學習和期末考試之間的延遲很短,意味著檢索強度很高——許多學生可以從自己的死記硬背經驗中驗證這一經驗。然而,在更大的延遲中,建立檢索能力的經驗(例如,測試)比學習帶來更大的益處。

教師如何在課堂上實施測試強化學習?

利用測試效果的方法有很多,有些是在課內,有些是在課外。以下是一些建議。

  • 在課堂結構中加入頻繁的小測驗可以促進學生的學習。這些測驗可以由簡答或多項選擇題組成,可以在線進行,也可以麵對麵進行。調查測試效果的研究表明,為學生提供檢索練習的機會——理想情況下,為他們的回答提供反饋——將增加對目標和相關材料的學習。
  • 在課堂上提供“總結要點”,鼓勵學生回憶和表達課程的關鍵內容。萊爾和克勞福德的研究檢查了要求學生在班會的最後幾分鍾寫下當天課程的要點的效果,並觀察到在學期結束時對學生回憶的顯著影響(萊爾和克勞福德,2011)。留出一節課的最後幾分鍾,讓學生回憶、表達和組織他們對當天課程內容的記憶,這可能對他們以後對這些主題的記憶有顯著的好處。
  • 提前測試以突出重要信息和教師的期望。伊麗莎白·利根·比約克和他的同事報告的結果表明,預先測試學生對某一學科的知識可能為他們的學習做好準備(利特爾和比約克,2011)。通過在一個單元甚至一天的教學之前對學生進行預測試,教師可以幫助提醒學生他們需要能夠回答的問題類型,以及他們在學習和教學過程中需要警惕的關鍵概念和事實。
  • 向學生介紹測試效果.教師可以通過分享這些觀察的概要來幫助學生的元認知能力。告訴學生經常做小測驗有助於學習——有效的小測驗可以采取多種形式——可以給他們一個特別有用的工具,添加到他們的學習工具包中(斯坦格-霍爾等人,2011年)。增加預考的潛在好處可能會進一步讓學生掌握自己的學習,比如將示例考試作為他們學習的入門,而不僅僅是作為考前對他們知識的檢查。

這個列表是一個起點。教師應該利用考試強化學習的基本原則——經常給學生提供低風險的機會練習回憶——來開發適合他們的班級和背景的方法。

要記住的重要警告是什麼?

可能發生失事。“測試”一詞引起了我們大多數人的某種反應:被測試的人是根據他或她對某一特定領域的知識或理解來進行評估的,並且會根據所給出的表現來判斷對或錯,適當或不適當。這種隱含的定義並沒有反映出“考試強化學習”的好處已經確立的情況。在認知科學實驗室進行的實驗中,“測試”隻是學生的一種學習活動;在課堂語言中,它可以被認為是一種“無風險”的形成性評估,學生可以評估他們對某一特定學科的記憶。在大多數來自教室的研究中,“測試”要麼是無風險回憶實踐(Larsen et al. 2009;萊爾和克勞福德,2001年;斯坦格-霍爾等人,2011年)或低風險測試(麥克丹尼爾等人,2012年;奧爾和福斯特,2013年)。因此,術語檢索練習可能是對促進學生學習的活動更準確的描述。因此,在課堂上實施測試增強學習的方法應該包括無風險或低風險的場景,即學生參與回憶活動以促進他們的學習,而不是反複遭受高風險的測試情況。

分享你的學習目標,讓學生了解他們的目標。需要注意的是,將測試——或回憶練習——作為課堂上的一種學習工具,應該與其他循證教學實踐相結合,例如與學生分享學習目標,認真地將學習目標與評估和學習活動相結合,並提供練習重要技能的機會。如果你希望學生能夠應用他們的知識,分析複雜的情況,並綜合不同的觀點,一定要讓他們知道檢索練習將幫助他們學習這些技能所需的基本信息,但僅檢索是不夠的。

參考文獻

雅培EE(1909)。學習過程中記憶的影響因素分析。心理學專著,11,159-177。

比約克RA(1975)。作為記憶修飾語的檢索:對負近因和相關現象的解釋。在R.L. Solso (Ed.),信息加工和認知(第123-144頁),紐約,紐約:Wiley。

Bjork RA和Bjork EL(1992)。一個新的廢棄理論和一個舊的刺激波動理論。A. Healy, S. Kosslyn和R. Shiffrin (Eds.),《從學習過程到認知過程:紀念William K. Estes的散文》(第二卷,第35067頁),新澤西州希爾斯代爾:Erlbaum。

布魯姆BS(1956)。教育目標的分類:手冊一:認知領域。紐約:大衛麥凱公司。

巴特勒AC(2010)。與重複學習相比,重複測試產生更好的學習遷移。實驗心理學雜誌:學習、記憶和認知36,1118-1133。

Butler AC, Karpicke JD, Roediger HL III(2008)。糾正元認知錯誤:反饋增加了對低自信的正確回答的保留。實驗心理學雜誌:學習、記憶和認知14,918-928。

Butler AC和Roediger HL III(2007)。在模擬課堂環境中,測試可以提高學生的長期記憶力。歐洲認知心理學雜誌19,514-527。

Butler AC和Roediger HL III(2008)。反饋增強了選擇題測試的積極作用,減少了消極作用。記憶與認知36,604-616。

Cantor AD, Eslick AN, Marsh EJ, Bjork RA, Bjork EL(2014)。多項選擇測試穩定了對邊緣知識的獲取。記憶與認知SOI 10.3758/s13421-014-0462-6。

Cohen GL, Garcia J, Apfel N, Master A(2006)。縮小種族成就差距:一種社會心理幹預。313年科學,1307 - 1310。

Gardiner JM, Craik FIM,和Bleasdale FA(1973)。檢索難度和後續回憶。記憶與認知1,213-216。

Gates AI(1917)背誦是記憶的一個因素。心理學檔案,6(40)。

海斯·MJ,科內爾·N,比約克·RA(2013)。考試失敗的時間和原因會增強後續學習的有效性。實驗心理學雜誌:學習、記憶和認知39,290-296。

詹姆斯·W(1890)。心理學原理。紐約:霍爾特。

Kang SHK, McDermott KB, Roediger HL III。(2007)。測試格式和糾正反饋修改了測試對長期留存率的影響。歐洲認知心理學雜誌19,528-558。

卡爾皮克JD和布朗特JR(2011)。檢索實踐比概念映射的精練學習更能產生學習效果。331年科學,772 - 775。

Klionsky DJ(2008)。測驗的因素。生命科學教育7,265-266。

Larsen DP, Butler AC,和Roediger HL III(2009)。相對於重複研究,重複測試可以提高長期記憶:隨機對照試驗。醫學教育43,1174-1181。

Leeming FC(2002)。當天考試的方法可以提高心理學課的表現。心理學教學29,210-212。

李曉燕,李曉燕。(2012)。在一個大量招生的生物學入門課上,協作測試提高了成績,但不能保留內容。cbe -生命科學教育

小JL和比約克·埃爾(2011)。預考多項選擇題有助於學習。在認知科學學會的演講。從檢索http://www.researchgate.net/publication/265883438_Pretesting_with_Multiple-choice_Questions_Facilitates_Learning2014年11月15日。

小JL和比約克·埃爾(2012)。將選擇題測試作為學習活動的持久好處。在認知科學學會的演講。檢索自http://mindmodeling.org/cogsci2012/papers/0128/paper0128.pdf, 2014年11月11日。

廖凱,郭福德(2011)。在課程結束時檢索基本材料可以提高統計考試的成績。心理學教學38,94-97。

McDaniel MA和Masson MEJ(1985)。通過檢索改變記憶表示。實驗心理學雜誌:學習、記憶和認知11,371-385。

McDaniel MA, Wildman KM, Anderson JL(2012)。利用小測驗提高網絡課堂的綜合評估表現:一項實驗研究。記憶與認知應用研究1,18-26。

Miyake A, Kost-Smith LE, Finkelstein ND, Pollock SJ, Cohen GL, Ito TA(2010)。縮小大學科學性別成績差距:價值肯定的課堂研究。330年科學,1234 - 1237。

Orr和Foster S(2013)。提高學生在生物學入門(專業)中使用在線測試的成功率。生命科學教育12,509-514。

Pulfrey C, Buchs C,和Butera F(2011)。為什麼成績會產生成績規避目標:自主動機的中介作用。教育心理學雜誌103,683-700。

Pyc MA, Agarwal PK,和Roediger H L III(出版中)。Test-enhanced學習。在V. Benassi, C. Overson和C. Hakala(編),在教育中應用學習科學:將心理科學注入到課程中。心理學教學學會。檢索自http://psych.wustl.edu/memory/Roddy%20article%20PDF ' s/Roediger%20&%20Pyc%20(2012)a_MemCog.pdf 2014年11月14日。

Pyc MA和Rawson KA(2009)。檢驗檢索努力假設:正確回憶信息的難度越大,是否導致記憶水平越高?記憶與語言雜誌60,437-447。

Roediger HL III, Putnam AL和Smith MA。(2011)。考試的十個好處及其在教育實踐中的應用。《學習與動機心理學》,第55卷:1-36。

Roediger HL III和Butler AC(2011)。檢索練習在長期記憶中的關鍵作用。認知科學動態15,20-27。

Roediger HL III和Karpicke JD (2006a)。測試增強學習:參加記憶測試可以提高長期記憶力。心理科學17,249-255。

Roediger HL III和Karpicke JD (2006b)。測試記憶的力量:基礎研究及其對教育實踐的啟示。心理科學展望,1,181 -210。

Roediger HL III和Pyc MA(2012)。改進教育的廉價技術:應用認知心理學來加強教育實踐。記憶與認知應用研究雜誌1,242-248。

Schwartz DL和Bransford JD(1998)。一個傾訴的時間。認知與教學16,475-522。

MA Smith和Karpicke JD(2014)。檢索實踐與簡答,多項選擇,和混合測試。內存22,784 - 802。

Smith MK, Wood WB, Krauter K, Knight JK(2011)。將同伴討論與教師講解相結合,可以提高學生從課堂概念問題中學習的能力。生命科學教育10,55-63。

斯坦格-霍爾KF,肖克利FW,和威爾遜RE(2011)。教授學生如何學習:一個關於信息處理和自我測試的研討會幫助學生學習。生命科學教育10,187-198。

斯蒂爾,CM(2010)。吹口哨的維瓦爾第:刻板印象如何影響我們以及我們能做什麼。紐約:W.W.諾頓公司。

坦納,KD(2012)。促進學生元認知。生命科學教育11,113-120。

Wissman KT, Rawson KA,和Pyc MA(2011)。中期測試效果:測試之前的材料可以促進新材料的學習。心理規律通報評論18,1140-1147。


引用本指南:
Brame, C.J.和Biel, R.(2015)。考試強化學習:利用檢索練習促進學習。從//www.cscnaha.com/test-enhanced-learning-using-retrieval-practice-to-promote-learning/檢索[todaysdate]。


Creative Commons許可
這本教學指南是根據美國法律獲得許可的知識共享署名-非商業性4.0國際許可

Baidu
map