English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 81570/81570 (100%)
造訪人次 : 47277861      線上人數 : 425
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋


    請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/13433


    題名: 發展少量特徵擷取方法之問題分類技術;A Method to Extract Fewer Features for Question Classification
    作者: 曾增仁;Tseng-Jen Tseng
    貢獻者: 資訊管理研究所
    關鍵詞: 文件分類;問題分類;問答系統;特徵擷取;機器學習;text classification;question classification;question answering system;machine learning;feature extraction
    日期: 2008-06-26
    上傳時間: 2009-09-22 15:31:46 (UTC+8)
    出版者: 國立中央大學圖書館
    摘要: 現今使用者利用問題回答系統 (question answering system) 進行資訊檢索時,通常期望在其查詢問題的當中得到一個確切的答案;而非傳統的檢索系統一般,回應一連串相關的文件列表。在問題回答系統的架構之中,系統在回答問題之前必須先進行問題的分類,以便了解問題的義涵。而問題分類也是問題回答系統裡處理程序之中最易出現錯誤的模組。以機器學習導向來說,問題分類與文件分類是兩個相似的程序。因此,特徵擷取在問題分類的處理之中是相當重要的任務。傳統特徵擷取的方法是依賴成百上千甚至更多的特徵,研究者在處理大量的特徵面臨了許多的問題。因此,本篇研究發展一個新的特徵擷取方法,試圖以少量的特徵擷取用於機器學習的分類器。在實驗當中,我們使用統計顯著性檢定來判別每一種不同特徵對於分類器效能的影響。實驗發現我們所擷取的特徵與一般常使用的bag-of-words 特徵表現一樣好。而在小型訓練資料集當中,我們所擷取的特徵也跟bag-of-ngrams 特徵的表現一樣好。 Today, some users usually prefer to receive answers in response to their questions by a question answering (QA) system, as opposed to the document lists returned by information retrieval (IR) system. In the architecture of a QA system, question classification is needed to extract the meaning of a question for answering the question. It causes most errors in the procedure of QA system. And question classification is very similar to text classification in machine learning approach. Therefore, the one of its important issues is to extract effective features. Traditional feature extraction depends on thousands or more features. Researches have problems in handling a large-dimension feature vectors. In view of this, this study is aimed to define a small number of features for machine learning classifiers. In our experiment, we test the efficacy of each feature with statistical significant test. We discover that our features are as good as bag-of-words feature. In small training dataset, our features are as good as bag-of-ngrams feature.
    顯示於類別:[資訊管理研究所] 博碩士論文

    文件中的檔案:

    檔案 大小格式瀏覽次數


    在NCUIR中所有的資料項目都受到原著作權保護.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明