姓名 張覺意(Chueh-I Chang)  查詢紙本館藏   畢業系所 資訊工程學系
論文名稱 應用自然語言處理技術提供學生電子書閱讀理解能力之智慧化評量
摘要(中) 近年來,教育各項資源逐漸數位化,數位教育平台也逐漸普及,學生的學習活動歷程也得以數位化,在傳統教學現場,教師要了解學生的閱讀理解能力,往往透過小考或一些課程互動,而在今日的數位平台中,如何量測學生的閱讀理解能力,是學習分析領域中一項重要的議題。
在本文中,我們透過比對學生於電子書中畫的重點和教師畫的重點的一致性來判斷學生的閱讀理解能力,比較TextRank, RAKE, BERT三種方法的代理度量(Proxy measure)效能,透過語言生成模型GPT-2產生小考問答題,透過語言代表模型BERT自動批改學生答案,最後根據批改結果自動給予學生建議並將結果反饋給教師,以完成高度自動化的閱讀理解能力智慧化評量。
摘要(英) In recent years, various educational resources have been gradually digitized, e-learning platforms have gradually become popular, and students’ learning activities have been digitized. At traditional teaching sites, teachers need to understand students’ reading comprehension, often interacting through quizzes or in-class activities. In today′s e-learning platforms, how to measure students′ reading comprehension is an important topic in the field of learning analytics.
With the rapid development of artificial intelligence, the field of natural language processing has made significant breakthroughs in recent years. This paper hopes to use state-of-the-art natural language processing technology to find the best way to measure students′ reading comprehension. In addition, teachers want to know students′ reading comprehension ability is usually achieved by marking students′ quizzes. However, teachers often spend a lot of time and labor on setting and marking exam papers. This paper uses natural language processing technology to automate these two steps to help teachers understand students′ reading comprehension more quickly.
In this paper, we measure the reading comprehension of students by comparing the consistency of the markers drawn by students in e-books and the markers drawn by teachers, then we compared the proxy measure performance of the three methods of TextRank, RAKE, and BERT. In quiz generation phase, we use GPT-2, a state-of-the-art language generation model, to generate quizzes by parsing materials. In the grading phase, we use BERT, a pre-trained language understanding model, to grade students’ answers automatically, and give them guiding according to grading results to complete a highly automated reading comprehension measurement framework.
關鍵字(中) ★ 自然語言處理
★ 文檔摘要
★ 問題生成
★ 機器評分
關鍵字(英) ★ NLP
★ Document summarization
★ Question generation
★ Machine grading
論文目次 目錄
摘要 i
目錄 iii
圖目錄 iv
表目錄 iv
一、 緒論 1
1.1 了解學生閱讀理解能力的方式 1
1.2 自動化評量帶來的效益 1
1.3 自動化產生的考題與自動化批改 1
二、 文獻探討 2
2.1 文檔摘要的方法 2
2.2 問題生成的方法 2
2.3 自動評分的方法 3
三、 研究方法 4
3.1 參與者與資料集 4
3.2 BookRoll 5
3.3 課程活動 5
3.4 方法與模型 6
3.4.1 TextRank 6
3.4.2 RAKE 7
3.4.3 BERT 8
3.4.4 句法分析 10
3.4.5 GPT-2 11
3.5 系統流程 13
3.5.1 前處理 13
3.5.2 自動標記教材重點 13
3.5.3 從教材自動生成問題 14
3.5.4 簡答題自動評分 15
3.5.5 Memo quality與推薦機制 16
3.5.6 系統資料流 18
四、 結果及討論 19
4.1 評估標準 20
4.2 研究結果 22
4.2.1 為什麼我們要使用marker quality來量測學生的閱讀理解能力? 22
4.2.2 自動化評量的準確度為何? 23
4.3 討論 31
五、 結論與未來研究 33
六、 參考文獻 34

圖 1、本研究中,輔助課程教學使用的線上閱讀平台BookRoll 5
圖 2、Transformers中的Encoder與Decoder 9
圖 3、BERT的兩階段遷移式學習 10
圖 4、BERT的自注意力機制和GPT-2的遮罩式自注意力機制 12
圖 5、完整句子與不完整句子透過句法分析得到的語法樹 15
圖 6、week4_List 列表(1)教材中的第六頁及第九頁內容 18
圖 7、自動重點標記流程 18
圖 8、自動簡答題評分模型訓練流程 19
圖 9、完整系統之資料流 19
圖 10、TA-based measure和Machine-based measure之關係圖 26
圖 11、學生撰寫包含程式碼的答案 33
圖 12、學生撰寫包含虛擬程式碼的答案 33
圖 13、學生使用特殊排版撰寫的答案 33

表 1、結構樹中常用代號 11
表 2、各頁內容與答案的餘弦距離 18
表 3、評分模型預測結果產生之四種情況 21
表 4、高分群與全班學生之Marker quality比較 23
表 5、三種方法產生的重點與助教重點的吻合程度 23
表 6、TA-based measure和Machine-based measure之相關係數與P-value 27
表 7、問題生成之統計結果 27
表 8、自動問題生成結果 30
表 9、自動簡答題評分之結果 30
指導教授 楊鎮華(Steve Yang) 審核日期 2020-7-1
