DC 欄位 |
值 |
語言 |
DC.contributor | 資訊管理學系 | zh_TW |
DC.creator | 魏忠志 | zh_TW |
DC.creator | Chung-Chih Wei | en_US |
dc.date.accessioned | 2005-6-22T07:39:07Z | |
dc.date.available | 2005-6-22T07:39:07Z | |
dc.date.issued | 2005 | |
dc.identifier.uri | http://ir.lib.ncu.edu.tw:444/thesis/view_etd.asp?URN=92423006 | |
dc.contributor.department | 資訊管理學系 | zh_TW |
DC.description | 國立中央大學 | zh_TW |
DC.description | National Central University | en_US |
dc.description.abstract | 文件檢索的技術行之有年,現今已廣泛地運用在各種線上文件檢索系統中。大部份的檢索工具是依據使用者輸入的查詢字串進行全文比對,或者將查詢字串做過部份處理之後再行比對文章。目前,已有為數眾多的研究者致力於發展文章分類、相關文章比對、文件相似度衡量方法及權重計算模型,更有許多改良過的方法實際應用於檢索系統中,逐步改善檢索效果與效率。
於本論文中,我們以現行著名之SCI/SSCI期刊文獻資料庫檢索工具為對象,根據此類文章之特色額外發展文章相似度比對方法。本研究專注於該檢索工具所擁有的標題、摘要、關鍵字及引用文獻,共四項不同特色的重要屬性,並利用著名之向量空間模式和TFIDF公式,計算文章向量的相似度。由於四項屬性之權重大小將影響兩兩文章之整體相似度,我們輔以倒傳遞類神經網路技術,建立屬性權重分配與兩兩文章之間的總相似度值之關係模式。而為了驗證ANN模組之成效,以及本文提出的文章比對方法與傳統比對方法之差異,本論文實際建立真實的期刊文章資料庫,並按照文章比對流程進行研究實作。最後則設計實驗,邀請實驗受測者測試文章比對之效果。
實驗結果顯示,我們所提出的文章比對方法,相較傳統方法而言,確實能大幅改善相似度比對效果。同時,我們也驗證了ANN模組確實帶來更佳的成效。
在SCI/SSCI檢索工具中,本研究期望能在保留標準欄位查詢功能之前提下,額外增加本論文所發展之文章相似度比對方法,藉以提昇檢索工具之彈性及實用性,協助研究學者或一般使用者更有效地查詢資料庫內相關文章。 | zh_TW |
DC.subject | 文章比對 | zh_TW |
DC.subject | 倒傳遞類神經網路 | zh_TW |
DC.subject | 資料挖掘 | zh_TW |
DC.title | SCI/SSCI文章比對方法之研究 | zh_TW |
dc.language.iso | zh-TW | zh-TW |
DC.type | 博碩士論文 | zh_TW |
DC.type | thesis | en_US |
DC.publisher | National Central University | en_US |