姓名 |
柯志賢(Chih-Hsien Ko)
查詢紙本館藏 |
畢業系所 |
資訊管理學系在職專班 |
論文名稱 |
應用機器學習技術協助警察偵辦詐騙案件之研究 (The Research of a Machine Learning Based Frued Investigation Police Assistant System)
|
相關論文 | |
檔案 |
[Endnote RIS 格式]
[Bibtex 格式]
[相關文章] [文章引用] [完整記錄] [館藏目錄] 至系統瀏覽論文 ( 永不開放)
|
摘要(中) |
由於國內詐騙案件發生數居高不下,政府要求警察機關將「打詐」列為治安重點項目,以維護民眾財產安全,提升民眾滿意度。2005年底,警察機關建置165反詐騙諮詢專線資訊系統(以下簡稱「165反詐騙系統」)作為受理民眾報案、諮詢跨機關單一窗口,並協調金融、電信、網路遊戲等民間資源整合,成為全國詐欺犯罪資料庫。無論受理報案之第一線員警或是偵辦詐欺案之司法警察,經常使用「165反詐騙系統」內之資訊。惟此系統在使用上仍有些不足之處:(1)勤務執行機構第一線員警受理詐欺案件除需制作調查筆錄,仍需在「165反詐騙系統」、「受理報案e化平臺」等不同警政系統平台輸入報案資料,曠日費時;(2)因「165反詐騙系統」內需點選輸入之資料欄位繁雜,以致經常發生第一線員警主觀上判斷錯誤、誤勾選項,間接使後續偵辦詐欺案之司法警察耗費許多時間在整理匯出之資料內容。本研究首先透過自然語言處理技術、推薦系統技術等機器學習技術解決以上之問題。在確認機器學習技術可應用在制作調查筆錄問句推薦、協助案件分類後,本研究更提出一項提高偵辦效率之偵查應用,並依據受理與偵辦模式設計一個基於自然語言處理與推薦系統協助警察偵辦詐騙案件之系統架構,作為未來警察機關改善建置之參考。 |
摘要(英) |
Due to the high number of domestic fraud cases, the government requires the police to list "Combating Fraud" as a key public security project to safeguard the safety of people′s property and improve public satisfaction. At the end of 2005, the police established 165 Anti-fraud consultation information system (hereinafter referred to as "165 Anti-fraud system") as a single window for accepting people′s reports, consulting across agencies, and coordinating the integration of private resources such as finance, telecommunications, and online games.This system became the national fraud database. The information in the "165 Anti-fraud System" is often used regardless of the first-line police officers who handle the report or the judicial police who investigate the fraud. However, there are still some shortcomings in the use of this system: (1) In addition to the need to produce survey transcripts, the first-line officers of the police service still need to make "165 Anti-fraud system" and "receive the report e-platform". The input of the report data of different policing system platforms will be time-comsumming; (2) Due to the complexity of the data fields for the "165 Anti-fraud System", the first-line police officers often make mistakes. These indirectly cause the judicial police who follow the fraud investigation to spend a lot of time sorting out the contents of the remitted information. This research first solves the above problems through machine learning techniques such as natural language processing technology and recommendation system technology. After confirming that machine learning technology can be applied in the production of survey transcripts to recommend and assist in the classification of cases, this study proposes an investigation application to improve the efficiency of investigation, and design a natural language processing and recommendation system to assist the police according to the acceptance and investigation mode. The system structure for investigating fraud cases serves as a reference for future police agencies to improve their construction. |
關鍵字(中) |
★ 詐騙 ★ 165反詐騙諮詢專線資訊系統 ★ 調查筆錄 ★ 自然語言處理技術 ★ 推薦系統技術 |
關鍵字(英) |
★ Fraud ★ 165 anti-fraud consultation line information system ★ survey transcript ★ natural language processing technology ★ recommendation system technology |
論文目次 |
摘要 Ⅰ
Abstract Ⅱ
誌謝 Ⅳ
目錄 Ⅴ
圖目錄 Ⅶ
表目錄 Ⅸ
第一章 緒論 1
1.1 研究動機 1
1.2 研究目的 4
1.3 研究方法與貢獻 6
1.3.1 研究方法 6
1.3.2 研究貢獻 6
1.4 研究範圍與限制 8
1.4.1 研究範圍 8
1.4.2 研究限制 8
1.5 論文架構 8
第二章 背景知識與文獻探討 9
2.1 詐欺犯罪 9
2.1.1 詐欺犯罪現況 9
2.1.2 詐欺犯罪類別與區分實益 10
2.2 受理報案之筆錄 16
2.2.1 筆錄之重要性 16
2.2.2 筆錄制作流程發展 17
2.2.3 筆錄制作研究文獻探討 17
2.3 「165反詐騙系統」資料庫 20
2.3.1 「165反詐騙系統」介紹與系統架構 20
2.3.2 「165反詐騙系統」資料庫維度 21
2.4 機器學習 22
2.4.1 機器學習與發展 22
2.4.2 LDA文件主題模型 23
2.4.3 機器學習應用於偵查犯罪現況 26
2.5 自然語言處理技術 28
2.5.1 自然語言處理發展 28
2.5.2 自然語言處理技術 30
2.5.3 自然語言處理在偵辦案件之應用 33
2.6 推薦系統技術 36
2.6.1 推薦系統的發展 36
2.6.2 推薦系統技術與應用 39
2.6.3 推薦系統在偵辦案件之應用 42
2.7 詐欺嫌犯資料庫 44
第三章 系統架構與情境模擬 45
3.1 詐欺案件受理流程與問題 45
3.1.1 受理流程 45
3.1.2 受理案件遭遇問題 49
3.1.3 改善筆錄制作過程 50
3.2 詐欺案件調查流程與問題 51
3.2.1 調查流程 51
3.2.2 偵辦案件遭遇問題 52
3.2.3 改善偵辦時效 53
3.3 系統架構設計 54
3.3.1 數據來源 56
3.3.2 自然語言處理模組 56
3.3.3 分析數據引擎 59
3.3.4 筆錄推薦模組 63
3.3.5 相似案件推薦模組 66
3.4 FIPAM運作流程 68
3.4.1 筆錄制作問句推薦流程 68
3.4.2 自動分類流程 69
3.4.3 偵辦推薦流程 69
第四章 情境模擬 70
4.1 FIPAM應用情境1-受理詐欺案件 70
4.2 FIPAM應用情境2-偵辦詐欺案件 75
第五章 結論與未來研究 79
5.1 結論 79
5.2 未來研究 80
參考文獻 81
附錄 85
一、被害人調查筆錄格式 85
二、移送書格式 89 |
參考文獻 |
一、 書籍
[1] 鄭捷(2018)。自然語言處理—用人工智慧看懂中文。佳魁數位。
[2] 鄭捷(2017)。NLP漢語自然語言處理原理與實踐。電子工業出版社。
[3] 賴屹民譯(2017)。初探機器學習演算法。碁峰資訊股份有限公司。
[4] 約阿夫·戈爾德貝格(Yoav Goldberg)。車萬翔等譯(2018)。基於深度學習的自然語言處理。機械工業出版社。
[5] 何招凡(2018)。偵訊筆錄、筆錄製作與移送實務。五南圖書出版股份有限公司。
二、 期刊論文
[6] David M. Blei, Andrew Y. Ng, and Michael I. Jordan (2003)。Latent Dirichlet Allocation。Journal of Machine Learning Research 3。
[7] Kaisheng Yao, Baolin Peng, Yu Zhang, Dong Yu, Geoffrey Zweig, and Yangyang Shi(2014)。Spoken Language Understanding Using Long Short-Term Memory Neural Networks。IEEE on SLT conference。
[8] Zhiheng Huang, Wei Xu, Kai Yu。2015年。"Bidirectional LSTM-CRF Models for Sequence Tagging"。Computer Science。https://arxiv.org/abs/1508.01991
[9] 林宜隆、賀宙才、張翔舜、林子豪(2007年)。我國網路現況分析與對策--以刑事警察局網路犯罪偵查案例作分析。資訊、科技與社會學報。
[10] 吳有龍、張啟瑞、林寶安(2011年)。警察機關「受理報案e化資訊系統」員警使用滿意度之研究。經營管理論叢。
[11] 裘雅恬(2017)。APP線上報案/預置筆錄先驅 下載165安全靠我顧。刑事雙月刊76期。
[12] 研之有物(2018)。斷開中文的鎖鍊!自然語言處理 (NLP)。中央研究院雙週刊第1670期。
[13] 黃立威、江碧濤、呂守業、劉艷博、李德毅(2018)。基於深度學習的推薦系統研究綜述。計算機學報。
[14] 梁敬东, 崔丙剑, 姜海燕,。2018年。基于word2vec和LSTM的句子相似度计算及其在水稻FAQ问答系统中的应用。南京农业大学学报。http://html.rhhz.net/njnydxxb/201805025.htm
三、學位論文
[15] 林哲維。2017年。協同過濾深度學習之推薦系統。國立中正大學資訊工程研究所碩士論文。
[16] 郭欣逸。2017年。一個基於語意分析的自然語言查詢系統。國立中興大學資訊管理學系碩士學位論文。
[17] 黃登銘。2013年。網路犯罪模式分析與偵查機制之研究-以網路詐欺為例。國立宜蘭大學多媒體網路通訊數位學習碩士在職專班碩士論文。
[18] 陳世崢。2001年。偵訊筆錄撰寫輔助系統之研究。中央警察大學資訊管理研究所碩士論文。
[19] 張啟淵。2013年。民眾對警察機關服務品質之研究—以彰化縣警察局溪湖分局為例。大葉大學管理學院碩士班碩士論文。
[20] 顏弘晏。2017年。巨量資料分析於警政應用-以行動通訊核心網路使用者註冊資料為例。中央警察大學資訊管理研究所碩士論文。
[21] 陳等揚。2016年。應用資料探勘及空間分析方法於預測犯罪之研究。中央警察大學資訊管理研究所碩士論文。
[22] 黃柏諺。2013年。層級分析法在犯罪偵查上之應用 - 以六合彩為例。中央警察大學刑事警察研究所。
[23] 張鴻昌。2010年。以機器學習分析自設非法電信平台詐欺電話之通聯紀錄。中央警察大學刑事警察研究所。
[24] 陳志遠。2018年。機器學習在ATM詐欺車手人臉辨識之應用。中央警察大學資訊管理研究所碩士論文。
[25] 陳紀汎。2018年。大數據犯罪偵查規劃與執行應用之研究。中央警察大學刑事研究所碩士論文。
[26] 吳季嫻。2018年。文字探勘:應用於閱讀者分群與文章主動推薦系統。靜宜大學財務與計算數學系碩士論文。
[27] 吳世權。2018年。建構長短期記憶模型與崁入向量之推薦系統。東吳大學數學系碩士論文。
[28] 陳登裕。2015年。以主題模型進行多樣且相關的線上課程推薦。國立屏東大學資訊管理學系碩士論文。
[29] 陳銘憲。2017年。刑案知識庫查詢推薦技術之研究。中央警察大學資訊管理研究所碩士論文。
[30] 洪憲能。2014年。智慧型手機詐欺防制之研究。中央警察大學資訊管理研究所碩士論文。
[31] 林厚誼。1999年。犯罪手法及失贓證物相似之竊盜犯罪案件資訊檢索。東海大學資訊科學研究所碩士論文。
[32] 連秀慈。2018。以LSTM為基礎之連續對答研究-以腹痛問診為例。國立臺北大學資訊工程學系碩士論文。
四、網路與報刊資料
[33] David’s Perspective(2019)。生成模型與文字探勘:利用 LDA 建立文件主題模型。https://taweihuang.hpd.io/2019/01/10/topic-modeling-lda/。
[34] Gimi Kao(2018)。速記AI課程-機器學習與演算法概論。取自2018年2月24日https://medium.com/@baubibi/%E9%80%9F%E8%A8%98ai%E8%AA%B2%E7%A8%8B-%E6%A9%9F%E5%99%A8%E5%AD%B8%E7%BF%92%E8%88%87%E6%BC%94%E7%AE%97%E6%B3%95%E6%A6%82%E8%AB%96-%E4%B8%80-41f9e18aedae。
[35] ITREAD(2019)。LDA主題模型學習筆記。https://www.itread01.com/content/1549881204.html。
[36] ITREAD(2019)。推薦系統中基於深度學習的混合協同過濾模型。https://www.itread01.com/content/1548045925.html。
[37] Lynn(2017)。【硬塞科技字典】-監督式學習?增強學習? https://www.inside.com.tw/article/9945-machine-learning。
[38] Lynn(2017)耗時三十年。深度學習之父Hinton是怎麼讓一度衰頹的類神經網路重迎曙光的呢?https://kopu.chat/2017/11/03/dl-hinton/。
[39] Medium(2019)。Discovering and Classifying In-app Message Intent at Airbnb。https://medium.com/airbnb-engineering/discovering-and-classifying-in-app-message-intent-at-airbnb-6a55f5400a0c。
[40] Tomas Mikolov, Kai Chen, Gerg Corrado, Jeffrey Dean(2013)。Efficient Estimation of Word Representations in Vector Space。https://arxiv.org/pdf/1301.3781.pdf 。
[41] Zhiyong will(2016)。簡單易學的機器學習算法-Latent Dirichlet Allocation(理論篇)。https://blog.csdn.net/google19890102/article/details/50504870。
[42] 京東的推薦系統(2018)。推薦系統綜述:初識推薦系統。https://codertw.com/%E7%A8%8B%E5%BC%8F%E8%AA%9E%E8%A8%80/511298/。
[43] 張相於(2019)。自然語言處理技術(NLP)在推薦系統中的應用。https://www.itread01.com/content/1546520419.html。
[44] 每日頭條(2016)。LDA模型在網絡視頻推薦中的應用。https://kknews.cc/zh-tw/tech/p5j55p.html。
|
指導教授 |
陳奕明(Yi-Ming Chen)
|
審核日期 |
2019-8-1 |
推文 |
facebook plurk twitter funp google live udn HD myshare reddit netvibes friend youpush delicious baidu
|
網路書籤 |
Google bookmarks del.icio.us hemidemi myshare
|