English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 80990/80990 (100%)
造訪人次 : 42118915      線上人數 : 1212
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋


    請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/74805


    題名: 以文本相似度為基礎的段落相似度分析:聖經四福音書之案例研究;Segment Similarity Based on Text Similarity: A Case Study of Four Gospels
    作者: 紀涵文;Chi, Han-Wen
    貢獻者: 資訊管理學系
    關鍵詞: 文本相似度;段落相似度;聖經經文;Text Similarity;Segment Similarity;Bible;Latent semantic analysis(LSA)
    日期: 2017-07-25
    上傳時間: 2017-10-27 14:40:04 (UTC+8)
    出版者: 國立中央大學
    摘要: 文字探勘(Text Mining)是以資料探勘的方式進行文件的文字資料分析,並透過這些分析取得文字間的相關性,進行分類、比較、判別。近十年來,搜尋引擎崛起,文字探勘的技術被更有效應用,創造新的商業價值。隨著網際網路的日新月異,網路資料量的累積使得搜尋引擎的發展愈發快速,改寫了資料檢索不變的定律。
    文本相似度(Text Similarity)透過將文字型態之間予以權重(或做:距離),計算文字型態間的相似程度,並加總比較以取得資訊、分類或二元判斷。透過此方法將大量的文章段落進行分析,並取得富含價值的有用資訊。
    本研究將提出一個新的相似度比對方法。我們將文件中任意一個連續的文字視為一個段落(Segment),將此段落與其他句子之間比對獲得評分,並從評分分數的高低與分佈,找出在同一文件中相似的目標段落。本研究以聖經四福因書作為案例,演示演算法運作方式與預期結果,並針對不同的參數之欲其結果進行比較。;Text Mining is known as data analysis to documents based on data mining. Main purpose of text mining is to obtain the relevance between text, through these analyzes conclude classification, comparison and discrimination. Over the past decade, search engines have emerged, and text search techniques have been more effectively applied
    to create new business value. With the ever-changing Internet, the accumulation of information on the network makes the development of search engines more quickly, also makes a huge on change data retrieval.
    Text Similarity, the degree of similarity between the text types is calculated by weighting (distance). Calculate the degree of similarity between text types and obtain information, classify or binary judgments, observe the valuable information through analysis a big quantity of articles.
    In this research, we raised a new method of similarity calculation. We treat any part of continuous sentences in the document as a Segment. Compare this segment with other sentences to get scores, and find the similar target segment in the same document from the rank and distribution of the scores. In this research, we use the four gospels in holy bible as cases study. The cases study demonstrate the operation of the algorithm and the expected results.
    顯示於類別:[資訊管理研究所] 博碩士論文

    文件中的檔案:

    檔案 描述 大小格式瀏覽次數
    index.html0KbHTML369檢視/開啟


    在NCUIR中所有的資料項目都受到原著作權保護.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明