DC 欄位 |
值 |
語言 |
DC.contributor | 資訊工程學系 | zh_TW |
DC.creator | 林志龍 | zh_TW |
DC.creator | Chih-Lung Lin | en_US |
dc.date.accessioned | 2003-7-18T07:39:07Z | |
dc.date.available | 2003-7-18T07:39:07Z | |
dc.date.issued | 2003 | |
dc.identifier.uri | http://ir.lib.ncu.edu.tw:444/thesis/view_etd.asp?URN=90522029 | |
dc.contributor.department | 資訊工程學系 | zh_TW |
DC.description | 國立中央大學 | zh_TW |
DC.description | National Central University | en_US |
dc.description.abstract | 文件摘要是文件處理中重要的技術,可視為一種文件壓縮,主要目的在挑選合適字句當成摘要內容,大致上可分為兩類:針對單一文件或多份文件,單一文件的摘要方法大都使用分析文件意義與結構的方式,至於多份文件的摘要則大都使用叢聚的技術找出重要的共同部分,本研究採用最大頻繁序列的概念對大量文件找出其重要的部分,接著再利用它做文件摘要,此外文件摘要中一直存在的問題在於如何評量摘要結果,由於個人的主觀要素,很難有客觀的評量方法,針對此點,本篇論文採用文件分類的方式來評估摘要結果,提供了一個較客觀且快速的做法。
本研究的文件摘要方法其架構可分為幾個步驟,首先利用分群的技術將整個文件集合分成幾個較小的集合,如此可避免直接由一大群集合中尋找最大頻繁字組時所遇到最小門檻值過低的問題,接著分別對這些集合擷取關聯性字組,當成文件中重要的部分,然後搭配這些關聯性字組和一些計分的方法決定將哪些句子當成摘要結果,實驗結果顯示摘要的內容確實保留了文件中重要的部分。 | zh_TW |
DC.subject | 關聯性字組 | zh_TW |
DC.subject | 文件摘要 | zh_TW |
DC.subject | document summarization | en_US |
DC.subject | text summarization | en_US |
DC.title | 關聯性字組在文件摘要上的探討 | zh_TW |
dc.language.iso | zh-TW | zh-TW |
DC.title | Mining Association Words for Document Summarization | en_US |
DC.type | 博碩士論文 | zh_TW |
DC.type | thesis | en_US |
DC.publisher | National Central University | en_US |