中大機構典藏-NCU Institutional Repository-提供博碩士論文、考古題、期刊論文、研究計畫等下載:Item 987654321/61089
English  |  正體中文  |  简体中文  |  全文笔数/总笔数 : 80990/80990 (100%)
造访人次 : 41277650      在线人数 : 106
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    jsp.display-item.identifier=請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/61089


    题名: 一個應用字詞連結度協助文件分群之方法;An Approach to Aid Document Clustering based on Word Connectivity
    作者: 張巧欣;Chang,Chiao-Hsin
    贡献者: 資訊管理學系
    关键词: 文件分群;向量空間模型;連結度;字詞群集;Document Clustering;Vector Space Model;Word Connectivity;Keyword Cluster
    日期: 2013-07-16
    上传时间: 2013-08-22 12:11:38 (UTC+8)
    出版者: 國立中央大學
    摘要: 網際網路的發展,資訊量快速成長,資訊過載問題日益嚴重,為了能有效率管理
    龐大的資訊,資料須適當的處理,幫助使用者整理龐大的資訊並加速獲得真正有用的
    資訊。傳統的文件分群主要使用字詞在文件中的權重當向量空間模型的依據,得面臨
    一些挑戰,如:資料量大時,高維度向量稀疏矩陣需要大量計算成本且效能不佳、詞
    彙為獨立構成,無法區分文中詞彙間關聯性、並不是所有詞彙一樣重要。本研究提出
    一套方法,透過分析字詞與字詞間連結度,形成字詞群集,利用字詞群集協助文件分
    群。首先,針對資料集擷取資訊量較多之關鍵字當字詞群集之基礎;接著,依關鍵字
    平均連結度分數加以合併形成字詞群集,用以表達文件進行分群。由實驗結果顯示本
    研究提出之方法能提升分群之效能,更能夠表達詞彙在資料集與詞彙之關係。
    The World Wide Web continues to grow at an amazing speed to bring a quickly growing number of documents. Since information overload is more serious than ever, the development of new methods for managing these information is an important issue. In most document clustering algorithms, documents usually are represented in the vector space model, which consider all dimensions (terms) in similarity measurement. In this vector space model, there are some weaknesses. First, cost much in calculation in high dimension situation. Second, it treats terms as independent and of equal importance. In this paper, we propose a method to aid document clustering. To start with, we analyze degree of word connectivity
    and then, group keywords in to keyword clusters
    finally, all documents were clustered according to the score among the keyword clusters and then choose the highest score keyword cluster for each document. Our experimental results show that the performance of the proposed approach has been improved effectively.
    显示于类别:[資訊管理研究所] 博碩士論文

    文件中的档案:

    档案 描述 大小格式浏览次数
    index.html0KbHTML497检视/开启


    在NCUIR中所有的数据项都受到原著作权保护.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明