關聯性字組在文件摘要上的探討

DC 欄位	值	語言
DC.contributor	資訊工程學系	zh_TW
DC.creator	林志龍	zh_TW
DC.creator	Chih-Lung Lin	en_US
dc.date.accessioned	2003-7-18T07:39:07Z
dc.date.available	2003-7-18T07:39:07Z
dc.date.issued	2003
dc.identifier.uri	http://ir.lib.ncu.edu.tw:444/thesis/view_etd.asp?URN=90522029
dc.contributor.department	資訊工程學系	zh_TW
DC.description	國立中央大學	zh_TW
DC.description	National Central University	en_US
dc.description.abstract	文件摘要是文件處理中重要的技術，可視為一種文件壓縮，主要目的在挑選合適字句當成摘要內容，大致上可分為兩類：針對單一文件或多份文件，單一文件的摘要方法大都使用分析文件意義與結構的方式，至於多份文件的摘要則大都使用叢聚的技術找出重要的共同部分，本研究採用最大頻繁序列的概念對大量文件找出其重要的部分，接著再利用它做文件摘要，此外文件摘要中一直存在的問題在於如何評量摘要結果，由於個人的主觀要素，很難有客觀的評量方法，針對此點，本篇論文採用文件分類的方式來評估摘要結果，提供了一個較客觀且快速的做法。本研究的文件摘要方法其架構可分為幾個步驟，首先利用分群的技術將整個文件集合分成幾個較小的集合，如此可避免直接由一大群集合中尋找最大頻繁字組時所遇到最小門檻值過低的問題，接著分別對這些集合擷取關聯性字組，當成文件中重要的部分，然後搭配這些關聯性字組和一些計分的方法決定將哪些句子當成摘要結果，實驗結果顯示摘要的內容確實保留了文件中重要的部分。	zh_TW
DC.subject	關聯性字組	zh_TW
DC.subject	文件摘要	zh_TW
DC.subject	document summarization	en_US
DC.subject	text summarization	en_US
DC.title	關聯性字組在文件摘要上的探討	zh_TW
dc.language.iso	zh-TW	zh-TW
DC.title	Mining Association Words for Document Summarization	en_US
DC.type	博碩士論文	zh_TW
DC.type	thesis	en_US
DC.publisher	National Central University	en_US

博碩士論文 90522029 完整後設資料紀錄