使用ChatGPT學習的孩子考試成績更差？＊阿波羅新聞網

AI真的能幫助學生學習嗎？最近在一所高中進行的實驗給出了警示。

賓夕法尼亞大學的研究人員發現，使用ChatGPT做數學練習題的土耳其高中生，在隨後的數學考試中成績不如沒有使用ChatGPT的學生。雖然使用ChatGPT的學生在練習題中正確率提高了48%，但他們的最終考試成績卻低了17%。

另一組學生使用了一個改進版的ChatGPT，它更像是一名導師，提供提示而不直接給出答案。這些使用AI導師的學生在練習題中的表現顯著提高，正確率增加了127%。然而，在隨後的考試中，這些AI輔導的學生並沒有取得更好的成績。那些單純依靠自己做練習題的學生，成績反而與AI輔助的學生相當。

研究人員在論文中明確指出，「生成式AI會損害學習」，提醒家長和教育者，當前的AI聊天機械人可能會「顯著阻礙學習」。即使是經過調試的導師版ChatGPT，也未必能真正幫助學生。

研究人員認為，問題在於學生將ChatGPT作為「拐杖」使用。在分析學生輸入的問題時，研究人員發現，學生常常只是直接詢問答案，而沒有通過解決問題來培養相關技能。

此外，ChatGPT的錯誤也可能是影響因素之一。這個聊天機械人只正確回答了一半的數學問題。其中8%的算術計算錯誤，而更大的問題是它在解釋如何解決問題時有42%的步驟是錯誤的。而導師版ChatGPT則直接接收了正確答案，從而減少了這些錯誤。

這項實驗的初稿於2024年7月發佈在SSRN網站上(原名為社會科學研究網絡)。該論文尚未在同行評議的期刊上發表，可能會有進一步的修訂。

儘管這只是一個在另一個國家的實驗，且還需要更多研究來驗證其發現，但這項實驗規模較大，涵蓋了近千名9到11年級的學生。研究在2023年秋季進行，教師首先在課堂上複習了之前教授的課程，然後將學生隨機分配到三種不同的練習方式：使用ChatGPT、使用由ChatGPT驅動的AI導師，或完全不使用任何高科技輔助工具。每個年級的學生都做了相同的練習題，之後進行測試，以評估他們對概念的掌握情況。研究人員進行了四個循環，每個循環給學生四次90分鐘的練習時間，涵蓋了四個不同的數學主題，旨在了解AI是否幫助、損害或沒有影響。

ChatGPT還似乎增加了學生的過度自信。在實驗的調查中，學生表示他們並不認為ChatGPT讓他們學得更少，儘管實際情況相反。使用AI導師的學生認為他們在考試中表現得更好，然而事實並非如此。(這也提醒我們，很多時候我們對自己學習多少的認知可能是錯誤的。)

作者將使用ChatGPT學習的問題比作自動駕駛。他們提到，正是由於對自動駕駛的過度依賴，美國聯邦航空管理局建議飛行員儘量減少使用這項技術，以確保在自動駕駛失靈時，飛行員仍然具備操縱飛機的能力。