博碩士論文 103423016 詳細資訊




以作者查詢圖書館館藏 以作者查詢臺灣博碩士 以作者查詢全國書目 勘誤回報 、線上人數:15 、訪客IP:54.162.10.211
姓名 徐子喬(Hsu Tzu-Chiao)  查詢紙本館藏   畢業系所 資訊管理學系
論文名稱 總統語藝之文字探勘研究
(Text Mining on Rhetoric of the President)
檔案 [Endnote RIS 格式]    [Bibtex 格式]    [檢視]  [下載]
  1. 本電子論文使用權限為同意立即開放。
  2. 已達開放權限電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。
  3. 請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。

摘要(中) 文字探勘技術的進步,使應用於非結構化資料的文字探勘研究在近年迅速增加。隨著文字探勘結合人文社會科學、政治學領域的研究逐漸興盛,專門探討領袖語藝的文獻,卻還停留在以傳統人工閱讀方式進行文字探勘。國內目前應用文字探勘在政治領域的相關研究,受限於作者背景知識,大多無法自行編寫客製化的文字探勘工具。本研究以資料科學的角度與知識背景出發,希望能更為彈性依照研究需求調整文字探勘工具,分析馬英九在中華民國總統任期內的領袖語藝,推論總統語藝、政策走向、重要幕僚任免、處理重大歷史事件態度之間的關聯。
  本研究建立一新的研究方法,混合N-gram相連詞出現機率與Word2Vec詞向量的計算,以及用t分布隨機近鄰嵌入 (t-distributed stochastic neighbor embedding, t-SNE) 演算法將200維的Word2Vec詞向量降到2維,並繪製於2維平面等三種技術,輔助研究人員分析總統語藝,尋找隱藏在總統語藝背後的論述、思想及決策脈絡。
  研究結果指出,將每篇文本分開做文字探勘,觀察文字探勘數據分析結果的變異並紀錄變異的時間點,再從發生變異的時間點著手研究變異原因,可以找出馬英九總統語藝和政策走向、重要幕僚任免、面對重大歷史事件態度間的關聯。根據分析結果並調查相關證據,政策走向、重要幕僚任免部分有兩大發現,一是2013年10月開始馬英九政府的區域整合政策由兩岸走向全球,由劉大年擔任政策幕後推手,劉大年也在2014年5月走馬上任擔綱國安會副秘書長一職,從幕後走向幕前。二是從2013年10月習近平提出兩岸領導人會面構想開始,馬英九在接下來的三次國慶演說講稿中詞向量最接近「兩岸」的詞之中都有「和平」一詞存在,直到兩岸領導人會面當天馬英九的開場談話也以兩岸和平為主軸,顯示馬英九想要留下「兩岸和平」的歷史定位。面對重大歷史事件態度部分,分析結果則指出,馬英九政府在最後兩年任期,對二二八事件的態度轉為應卯。
  最後探討資料集一致性問題影響文字探勘數據訓練的可能性,從研究過程推斷總統語藝的文字探勘比較適用分篇文字探勘的研究方式。建議未來的研究者在探勘總統語藝時,採用單篇文本分析,而非全部文本綜合在一起分析的策略。
摘要(英) Recent trends have been influenced by the progression of text mining so researches on unstructured data mining increase rapidly. There are many literatures on using text-mining techniques for politics but studies of rhetoric of leaders are still analyzed textual materials via reading by human. This paper attempts to apply text-mining techniques to research of rhetoric of the former president Ma Ying-jeou and find the relationships between rhetoric and policy, staffing assignments or attitude toward important historical events.
  In this paper, a new research method to analyze and reveal hidden ideology and decision-making process behind rhetoric of the president is developed. We present here an original work that employs Word2Vec, N-gram and t-distributed stochastic neighbor embedding (t-SNE) to assist rhetoric analysis.
  The results show that mining each document sorted by date on rhetoric of the president, observing variations in data calculated by text mining techniques, and then investigating the reasons why data alter on the time can find out the association between rhetoric and policy, staffing assignments or attitude toward important historical events.
  Furthermore, we disclosure the mastermind behind the scenes of regional economic integration policy was Daniel Liu(劉大年)in the period from October 2013 to May 2016, Ma Ying-jeou tried hard to make his historical role as a man bringing Cross-strait peace and the attitude of the Ma administration was perfunctory toward February 28 Incident after February 2015.
關鍵字(中) ★ 領袖語藝
★ 文字探勘
★ 馬英九
★ Word2Vec
★ N-gram
★ t-SNE
關鍵字(英) ★ Word2Vec
★ N-gram
★ t-SNE
★ rhetoric of the leader
★ text mining
★ Ma Ying-jeou
論文目次 摘要 i
Abstract ii
致謝 iii
目錄 iv
圖目錄 vi
表目錄 vii
第一章、緒論 1
1-1研究背景 1
1-2研究動機 1
1-3研究目的 2
1-4研究流程 2
第二章、文獻回顧 3
2-1 文字探勘於政治學 3
2-2 政治語藝分析 3
2-3文字探勘 4
2-4 Word2Vec詞向量 4
2-5 延伸現有研究 4
第三章、研究方法與資料集建立 5
3-1研究範圍與限制 5
3-2建置資料集 5
3-2-1斷詞處理 6
3-2-2元旦系列文 7
3-2-3世界和平日系列文 8
3-2-4農曆新春系列文 10
3-2-5二二八系列文 12
3-2-6雙十國慶系列文 14
3-2-7五院茶敘系列文 15
3-2-8人權議題系列文 16
3-3文字探勘數據計算流程 17
3-3-1建立N-gram相連詞數據 17
3-3-2建立Word2Vec詞向量數據 18
第四章、研究結果分析與推論 19
4-1語藝走向推論政策與重要幕僚之關聯 19
4-2語藝走向推論兩岸領導人會面之時程 25
4-3語藝走向推論馬英九政府對重大歷史事件之態度 34
4-4小結 35
第五章、結論與建議 36
5-1研究結論 36
5-2研究貢獻 37
5-3未來方向建議 37
參考文獻 38
參考文獻 中文文獻

公眾外交協調會,2014年2月17日。馬總統蒞臨「我國加入TPP/RCEP策略規劃研習會」。取自http://www.mofa.gov.tw/News_Content.aspx?n=11C2D1C192EB605F&sms=CA4CF59DDADDE879&s=40E046E42D96D518
王鴻志,2011。從馬英九三次元旦講話看台當局兩岸政策。兩岸關係,2011年第1期,頁29-30。
林靜伶譯,1996。當代語藝觀點,Sonja K. Foss原著。臺北市:五南書局。
林顯明,2015。再解構民主進步黨ECFA政策論述:文字探勘之初探。展望與探索,第13卷,第7期,頁89-102。
江孟穎,2003。首長形象建構之研究-以台北市與高雄市政府新聞稿為例。銘傳大學傳播管理研究所碩士論文。
孫冬雪,2015。手握“九”了心更“近”了——見證“習馬會”。兩岸關係,2015年第12期,頁6-9。
孫君意,2015年12月16日。“結巴”中文分詞:做最好的 Python 中文分詞組件。取自https://github.com/fxsjy/jieba
馬英九,2015年11月7日。馬總統開場談話全文。取自http://www.mac.gov.tw/ct.asp?xItem=113314&ctNode=5650&mp=1
殷德惠,2003。語言與權力:李登輝與民粹主義之研究。國立政治大學新聞研究所碩士論文。
商西,2013年10月7日。習近平:政治問題不能一代一代傳下去。京華時報。取自http://www.chinanews.com/gn/2013/10-07/5346801.shtml
許禎元,2003。內容分析法的研究步驟與在政治學領域的應用。師大政治論叢。第1卷,第1期,頁1-29。
張道宜,2015。脈絡下的保護責任:文本探勘的再詮釋。國立政治大學外交研究所碩士論文。
曾元顯、林瑜一,2011。內容探勘技術在教育評鑑研究發展趨勢分析之應用。教育科學研究期刊,第56卷,第1期,頁129-166。
黃巧雯,2016年5月16日。如經濟部保姆 劉大年獲頒經濟專業獎章。中央通訊社。取自http://www.cna.com.tw/news/afe/201605160194-1.aspx
喻欣凱(2008)。運用支援向量機與文字探勘於股價漲跌趨勢之預測。輔仁大學資訊管理學系研究所碩士論文。
溫品竹、蔡易霖、蔡宗翰,2015。基於Word2Vec 詞向量的網路情緒文和流行音樂媒合方法之研究。The 2015 Conference on Computational Linguistics and Speech Processing,頁167-179。
劉大年,2014年2月15日。加速形成共識 區域經濟整合 兩岸非零和賽局。聯合報,A18版。
劉大年、盧鈺雯、許茵爾,2014。全球區域經濟整合與臺灣。載於陳添枝、劉大年(主編),由ECFA到TPP:臺灣區域經濟整合之路,頁5-32。臺北市:財團法人兩岸交流遠景基金會。
謝妙玲,2002。2002年台北市長選舉候選人報紙競選廣告之研究—中國時報、自由時報、聯合報的內容分析。世新大學傳播研究所碩士論文。

英文文獻

Ari-Veikko Anttiroiko, 2003. Building strong e-democracy: the role of technology in developing democracy for the information age. Communications of the ACM. Vol. 46, Issue 9, p 121-128.
Alexa Internet, 2016. Github.com Alexa Ranking. Retrieved from http://www.alexa.com/siteinfo/github.com
Gerard Salton & Michael J. McGill, 1983. Introduction to Modern Information Retrieval. McGraw-Hill Inc., New York, NY, USA.
Harold D. Lasswell, 1941. The World Attention Survey. The Public Opinion Quarterly. Vol. 5, No. 3, p 456-462.
Julie Weeds & David Weir, 2005. Co-occurrence Retrieval: A Flexible Framework for Lexical Distributional Similarity. Computational Linguistics. Vol. 31, No. 4, p 439-475.
Lada A. Adamic & Natalie Glance, 2005. The political blogosphere and the 2004 U.S. election: divided they blog. In Proceedings of the 3rd international workshop on Link discovery (LinkKDD ’05). New York, NY, USA, p 36-43.
Muneeb T. H., Sunil Kumar Sahu, & Ashish Anand, 2015. Evaluating distributed word representations for capturing semantics of biomedical concepts. ACL-IJCNLP 2015, p 158-163.
Nicholas Evangelopoulos & Lucian Visinescu, 2012. Text-mining the voice of the people. Communications of the ACM. Vol. 55, Issue 2, p 62-69.
Object Management Group®, 2015, March 1. OMG Unified Modeling Language™ Version 2.5. Retrieved from http://www.omg.org/spec/UML/2.5
Omer Levy, Yoav Goldberg, & Ido Dagan, 2015. Improving distributional similarity with lessons learned from word embeddings. Transactions of the Association for Computational Linguistics, Vol. 3, p 211-225.
Tae Yano, William W. Cohen, & Noah A. Smith, 2009. Predicting response to political blog posts with topic models. In Proceedings of Human Language Technologies: The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL ’09), Stroudsburg, PA, USA, p 477-485.
Peter Teo, 2000. Racism in the news: a Critical Discourse Analysis of news reporting in two Australian newspapers. Discourse & Society. Vol. 11 (1), p 7-49.
Tomas Mikolov, Kai Chen, Greg Corrado, & Jeffrey Dean, 2013. Efficient Estimation of Word Representations in Vector Space. International Conference on Learning Representations 2013.
Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg S. Corrado, & Jeff Dean, 2013. Distributed Representations of Words and Phrases and their Compositionality. Advances in Neural Information Processing Systems 26 (NIPS 2013).
Zhiyuan Fang, 2002. E-Government in Digital Era: Concept, Practice, and Development. International Journal of The Computer, The Internet and Management. Vol. 10, No.2, p 1-22.
指導教授 薛義誠(Yih-Chearng Shiue) 審核日期 2016-8-5
推文 facebook   plurk   twitter   funp   google   live   udn   HD   myshare   reddit   netvibes   friend   youpush   delicious   baidu   
網路書籤 Google bookmarks   del.icio.us   hemidemi   myshare   

若有論文相關問題,請聯絡國立中央大學圖書館推廣服務組 TEL:(03)422-7151轉57407,或E-mail聯絡  - 隱私權政策聲明