English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 78852/78852 (100%)
造訪人次 : 51081      線上人數 : 665
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋


    請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/68833


    題名: 應用相關回饋之語詞資訊於概念建立之方法;The application of the term information residing in relevance feedback for concept construction
    作者: 張明竣;Chang,Ming-Chun
    貢獻者: 資訊管理學系
    關鍵詞: 概念萃取;文件概念化;相關回饋;向量空間模型;文件集離散程度;concept extraction;bag-of-concepts;relevance feedback;vector space model;dispersion of document dataset
    日期: 2015-07-27
    上傳時間: 2015-09-23 14:44:27 (UTC+8)
    出版者: 國立中央大學
    摘要: 過去的概念萃取研究中,對於一篇文件應該萃取多少概念去表達,沒有一個依據。因此,本研究旨在探討概念萃取數量與文件集離散程度間的關聯,並且利用公開資料集TREC-6做實驗,驗證其是否對文件分類效能上有所提升。如果將文件集分群後,文件平均分佈在各個群中,代表文件集的離散程度很高,本研究假設應該萃取更多概念才能夠足以表達文件集中大部份文章。反之如果文件集中在某幾個群中,代表文件集的離散程度很低,表示文件的分佈是很集中的,萃取少量概念就足以表達大部份文章。在本研究中提出動態概念萃取策略,利用文件分群得知其離散程度,並利用此數據動態控制萃取的概念數量,經實驗驗證可以初步證實本研究所提出的動態概念萃取策略,對於文件分類上的效能有進一步提升。;In the past, we did not have a method to determine how many concpts to represent the document. The aim of this study is to discuss the relation between the number of concepts extraction and the dispersion of document dataset. This study uses public document dataset TREC-6 to validate the effectiveness of text classification. This study proposes that a document dataset has high dispersion if the documents distribute evenly in a cluster. In this case, this study assumes that more concepts are needed to represent the document. On the contrary, if the documents has a centralized distribution in a cluster, the document dataset has low dispersion. In this case, this study assumes that less concepts are needed to represent the document. This study proposes a dynamic concept extraction method which applies the degree of dispersion as the basis to dynamically determine the number of concepts. Empirical results show that the proposes method can improve the effectiveness in text classification.
    顯示於類別:[資訊管理研究所] 博碩士論文

    文件中的檔案:

    檔案 描述 大小格式瀏覽次數
    index.html0KbHTML490檢視/開啟


    在NCUIR中所有的資料項目都受到原著作權保護.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明