中大機構典藏-NCU Institutional Repository-提供博碩士論文、考古題、期刊論文、研究計畫等下載:Item 987654321/13588
English  |  正體中文  |  简体中文  |  全文笔数/总笔数 : 78937/78937 (100%)
造访人次 : 39100067      在线人数 : 896
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    jsp.display-item.identifier=請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/13588


    题名: 利用feature-opinion;pair建立向量空間模型以進行使用者評論分類之研究 Using Feature-Opinion Pair to Create Vector Space Model for User Review Classification
    作者: 周嘉宏;Chia-Hung Chou
    贡献者: 資訊管理研究所
    关键词: 意見探勘;評論分類;機器學習;opinion mining;review classification;machine learning
    日期: 2009-06-17
    上传时间: 2009-09-22 15:35:37 (UTC+8)
    出版者: 國立中央大學圖書館
    摘要:   隨著網路的蓬勃發展,電子商務興起,以及web2.0技術的廣泛應用,愈來愈多人在網路上表達個人對於產品與服務之使用意見。許多的討論區、專業評論網站 (例如epinon.com,Amazon) 以及個人網誌,亦提供使用者抒發己見的空間。由此可知,線上評論是為買賣雙方獲取參考資訊的重要來源。然而網路的評論通常會混合著正面與負面意見,若以人工處理方式去從中取得具參考價值之訊息,勢必要耗費甚多精力與時間。因此,如何彙整與分析大量的網路文字資料,尤其是針對具有豐富語意資訊的使用者評論,自動化意見探勘,實為重要之研究議題。   回顧過去意見探勘之研究得知,特徵表示法是用來反映網路評論文章之特性,透過特徵選取的方法以提供分類訓練模型進行學習,本研究發現評論分類的領域中,最常採用之特徵表示法,大多是單一字詞的頻率。此類型之特徵表示法對於分類器而言,容易產生維度太大或增加雜訊,進而影響分類效果,有鑑於此,本研究針對特徵表示法的部分進行改良,利用feature-opinion pair來代表向量空間模型之特徵,使特徵表示法能包含更多的語意訊息。   本研究所提出之改良特徵表示法,係以監督式學習演算法為基礎,針對文章之特性進行分類。透過所截取之產品與服務的特徵(feature)與使用者意見 (opinion)來形成feature-opinion pair,以建立向量空間模型。並採用支援向量機(support vector machine)來做為本研究之分類器,來測試我們所收集之資料集。實驗結果顯示,本研究提出之方法能夠有效的降低建立向量空間模型之維度,並提升分類之準確率。 The emergence of Internet has constructed a space (e.g. epinions.com, amazon.com) for users to freely express opinions and exchange experiences regarding products, services, and any public issues. Nowadays a great amount of referral information can be obtained from a variety of information source, including products profile, recommendations, expert opinion and so forth. However, identification of the semantic orientation from referral information requires a lot of human efforts. Therefore, the study of opinion mining has been extended to this field. In prior studies of opinion mining, feature representation has been the key method. Bag-of-word is one of the most popular feature representation that describes reviewing contents as single-word sets. However, applying bag-of-word model to online reviews usually are lack of semantic information and will significantly increase vector dimension to reduce the performance of machine learning classifier. This study proposed a modified feature presentation method for building vector space model. Feature-opinion pair will be extracted from product features and user comments at sentence level. We use support vector machine as our classification method to test our dataset. These experiments indicate that the proposed method can not only increase the accuracy of classification but also reduce time cost with fewer dimensions. Finally, we expect that our system could be used to solve the high dimension problem in review classification.
    显示于类别:[資訊管理研究所] 博碩士論文

    文件中的档案:

    档案 大小格式浏览次数


    在NCUIR中所有的数据项都受到原著作权保护.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明