博碩士論文 85325016 詳細資訊


姓名 施建新(Jing-Xin She)  查詢紙本館藏   畢業系所 資訊工程學系
論文名稱 網路資訊與學習系統之中文全文探勘工具
檔案 [Endnote RIS 格式]    [Bibtex 格式]    [檢視]  [下載]
  1. 本電子論文使用權限為同意立即開放。
  2. 已達開放權限電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。
  3. 請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。

摘要(中) 在學習系統中存在著大量的Web-Log以及文字資訊,目前大部份學習網站都偏重於Web-Log的分析,間接得知學生的學習狀況,但我們發現光是Web-Log分析,卻把學生在學習網站所留下的文字資訊忽略是一件很可惜的事,因為文字裡含有更豐富的資訊礦產等著我們去開採。
因此,針對學習網站的需要,我們設計了一套中文全文探勘系統,裡面包含了「文件意向分析工具」用來分析文章問句類型與焦點;「文件特性萃取工具」用來進行中文文章斷詞及屬性分析;「文件主題類別化工具」可以找出文章的主題;「文件摘要萃取工具」萃取文章的摘要;「文件分類工具」判斷文章屬於那個預設類別;「任務指派工具」分配討論區文章給適當助教;「品質分析工具」經過訓練,可以判斷中文文章品質等,協助文件資訊的探勘、網站資訊管理、支援學習者的學習以及教師的教學。
經實驗證明,除了「文件意向工具」外,其它工具所達到的準確率都超過七成以上,說明了我們工具實際運作的可靠性,同時透過系統設計的模組化,增加了彈性及未來功能的擴充性,中文全文探勘工具能協助學習系統,使得學習系統更聰明。
關鍵字(中) ★ 學習網站
★ 品質
★ 摘要
★ 資訊探勘
★ 全文
★ 中文
★ IR
關鍵字(英)
論文目次 目錄
目錄I
圖片目錄IV
表格目錄VI
第一章 緒論1
1.1研究背景1
1.2 研究動機5
1.3 研究目標7
1.4 問題分析10
1.5論文架構13
第二章 相關研究與技術14
2.1 中文斷詞14
2.2 分類15
2.3 資訊萃取(INFORMATION EXTRACTION)16
2.4 決策樹(DECISION TREE)16
2.5 文字分析工具17
2.6 本章總結18
第三章 系統架構19
3.1 中文全文探勘系統-OVERVIEW19
3.2 詞庫、斷詞與偵測程序(DETECT DAEMON)21
3.3 文件意向分析工具(DOCUMENT PURPOSE ANALYZER)22
3.4 文件特性萃取工具(DOCUMENT CHARACTERISTIC ANALYZER)24
3.5 文件主題類別化工具(TOPIC CATALOGER)26
3.6 文件摘要萃取工具(INFORMATION SUMMARIZER)27
3.7 文件分類工具(DOCUMENT CLASSIFIED TOOLS)29
3.8 文件品質分析工具(QUALITY ESTIMATED TOOL)30
3.9 任務指派工具(WORK DISPATCHER)33
3.10總結摘要35
第四章 我們的方法36
4.1 中文斷詞36
4.2 文意分析39
4.3 特性萃取40
4.4 主題類別化43
4.5 摘要萃取44
4.6 文件品質分析45
4.7 總結摘要46
第五章 實驗結果與討論47
5.1 測試環境介紹47
5.2 文件意向分析工具測試48
5.3文件摘要萃取工具測試49
5.4 中文文件分類工具測試50
5.5 文件品質分析工具測試52
5.6 任務分配工具測試55
5.7 本章總結57
第六章 結論58
參考文獻61
附錄 A 討論區文章屬性分析隨機列表64
附錄 B 文件意向分析工具部份輸出列表65
附錄 C 文件摘要萃取工具部份輸出列表66
附錄 D 文件品質評估工具部份輸出結果68
附錄 E 任務指派工具部份輸出結果70
附錄 F 中文文件探勘工具探勘資訊總結72
附錄 G 利用文件自動群簇工具分析文件分類結果的交叉比對74
參考文獻 參考文獻
[1] 中央大學遠距教學系統. (http://vc2.csie.ncu.edu.tw/)
[2] 區國良,”網路虛擬教室之討論與群體學習管理系統”, 國立中央大學資訊工程所碩士論文, 1996.
[3] C5.0, Data Mining Tool, http://www.rulequest.com/see5-info.html
[4] Chien L.-F., Huang T.-I.“PAT-Tree-Based Keyword Extraction for Chinese Information Retrival” In Proceedings of the 20th annual international ACM SIGIR’97. pp. 50─58.
[5] Craven, M., DiPasquo, D., Freitag, D., McCallum, A., Mitchell, T., Nigam, K. and Slattery, S.. “Learning to Construct Knowledge Bases from the World Wide Web” appear in Artificial Intelligence‘99.
[6] Goldberg, M.W., Salari, S., and Swobada, P., “World Wide Web Course Tools: An Environment for Building Web base Courses”, Computer Network and ISDN Systems, 28, 1996.
[8] Goldberg, M.W., “Student Participation and Progress Tracking for Web-Based Courses Using WebCT”, Proceedings of the Second International N.A. WEB Conference, October 5-8, 1996, Fredericton, NB, Canada.
[8] Henry Lieberman, “Autonomous Interface Agents”, ACM CHI’97.
[9] Hiltz, S.R., “The Virtual Classroom:Learning Without Limits via Computer Networks”, Ablex Publishing Corporation, Norwood, New Jersey, 1994.
[10] IBM Intelligent Miner for Text, http://www-4.ibm.com/software/data/iminer/fortext/
[12] Jobn R. Levine, Tony Mason & Doug Brown, “Lex & Yacc”, O’Reilly 1999.
[12] Kupiec, J., Pedersen. J. and Chen, F., “A Trainable Document Summarizer”, in Proceeding of the 18th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 1995, pages 68-74.
[13] “Modern Information Retrieval”, ACM Press, 1999.
[14] Ou, K. L., Chang, C. K., and Chen, G. D., “Web-Base Asynchronous Discussion System”, International Conference on Computers in Education, 1998.
[16] Robert Armstrong, Dayne Freitag, Thorsten Joachims and Tom Mitchell, “Web Watcher: A learning Apprentice for the World Wide Web”, in AAAI Spring Symposium on Information Gathering, Stanford, CA, March 1995.
[16] Robertson S. E. and K.sparck Jones. Relevance weighting of search terms. Journal of the American Society for Information Sciences, 27(3):129-146, 1976.
[17] Rush, J.. Salvador, R., and A Zamora, “Automatic Abstracting and Indexing II, Production of Indicative Abstracts by Application of Contextual Inference and Syntactic Coherence Criteria”, Journal of the ASIS, Vol. 22, No. 4., 1971, pages 260-274.
[18] Salton, G..E. and M. McGill, “Introduction to Modern Information Retrieval”, McGraw-Hill, 1983.
[19] Salton,G..E. and Lesk, M.E. “Computer evaluation of indexing and text processing”, Journal of the ACM, 15(1):8-36, January 1968.
[20] Team of Chinese Knowledge Information Processing(CKIP) at Academia Sinica, Taiwan. (http://godel.iis.sinica.edu.tw/CKIP)
指導教授 陳國棟(Gwo-Dong Chen) 審核日期 2000-7-4
推文 facebook   plurk   twitter   funp   google   live   udn   HD   myshare   reddit   netvibes   friend   youpush   delicious   baidu   

若有論文相關問題,請聯絡國立中央大學圖書館推廣服務組 TEL:(03)422-7151轉57407,或E-mail聯絡