博碩士論文 104453001 詳細資訊




以作者查詢圖書館館藏 以作者查詢臺灣博碩士 以作者查詢全國書目 勘誤回報 、線上人數:46 、訪客IP:3.147.54.100
姓名 魏宏達(Hong-Da Wei)  查詢紙本館藏   畢業系所 資訊管理學系在職專班
論文名稱 使用資料探勘分類技術優化YouBike運補作業
相關論文
★ 利用資料探勘技術建立商用複合機銷售預測模型★ 應用資料探勘技術於資源配置預測之研究-以某電腦代工支援單位為例
★ 資料探勘技術應用於航空業航班延誤分析-以C公司為例★ 全球供應鏈下新產品的安全控管-以C公司為例
★ 資料探勘應用於半導體雷射產業-以A公司為例★ 應用資料探勘技術於空運出口貨物存倉時間預測-以A公司為例
★ 特徵屬性篩選對於不同資料類型之影響★ 資料探勘應用於B2B網路型態之企業官網研究-以T公司為例
★ 衍生性金融商品之客戶投資分析與建議-整合分群與關聯法則技術★ 應用卷積式神經網路建立肝臟超音波影像輔助判別模型
★ 基於卷積神經網路之身分識別系統★ 能源管理系統電能補值方法誤差率比較分析
★ 企業員工情感分析與管理系統之研發★ 資料淨化於類別不平衡問題: 機器學習觀點
★ 資料探勘技術應用於旅客自助報到之分析—以C航空公司為例★ 應用機器學習建立單位健保欠費催繳後繳納預測模型
檔案 [Endnote RIS 格式]    [Bibtex 格式]    [相關文章]   [文章引用]   [完整記錄]   [館藏目錄]   至系統瀏覽論文 ( 永不開放)
摘要(中) 現今全球氣候變化極端,為維護生態及環境可永續發展,各國開始提倡節能減碳,無不希望以綠運輸的載具,作為城市交通運輸中的一環,藉此降低汽機車的使用,故公共自行車的概念應運而生。臺灣在城市在捷運和公車路網逐漸成型後,市民從捷運站及公車站到達目的地仍有一段距離,此距離走路太遠,坐車又太近。為了滿足市民最後一哩的需求,台北市政府於2009年3月推動公共自行車租賃系統YouBike,期以24小時便捷綠色運具服務取代私人運具,改善停車空間不足及尖峰時間交通壅塞情形,達到延伸大眾運輸服務範圍,突破公共運輸服務時間限制,但若站點無車可騎,將影響民眾使用意願,導致使用率降低。
本研究著重在YouBike缺車站點分析,依現有可蒐集到的開放資料(Open Data),如YouBike可借車數(每5分鐘一筆資料)、氣象局觀測資料、人事行政局國定假日行事曆,利用資料探勘監督式學習技術所分析出來的資訊,搭配BI視覺化工具,提供決策調度或執行人員運補時有所依據。
實驗方法採用Apache Spark搭配Hadoop,將資料放入HDFS後執行資料前處理,並依Spark MLlib提供的機器學習演算法,進行不同分類技術的實驗。分類技術採用Naïve Bayes、支援向量機(SVM)、隨機森林(Random Forest)等演算法,分析其結果,以試圖獲得最佳YouBike補車調度預測模型,並以視覺化方式呈現模型預測之結果以及台北市各YouBike站點當下及過去之情況。
經過實驗結果得知,針對2015/06~2016/01年的訓練集資料,隨機森林演算法的表現最佳,在其資料集來源之屬性足夠之情況下,其AUC值普遍值達到0.87左右,具有較佳參考意義。因此,本研究建議未來在進行YouBike 缺車調度預測時,可以優先採用隨機森林演算法,以此優化YouBike 調度服務作業。
摘要(英)
Now weather changes dramatically all around the world. For natural ecology retention and our environment sustainable development , all countries suppose to use energy saving and carbon reduction vehicle as green transportation to become a part of city transportation. According to this concept , Public Sharing Bike was invented. After bus and MRT transportation system become mature and complete in Taiwan , there is still a certain distance between public transportation station and destination. For this last mile demand , Taipei City Government had started to implement Public Share Bike System called “YouBike” in March 2009 , hoped it can replace private vehicles , improve insufficient parking space situation and traffic congestion circumstances. On the other hand , the government also expect YouBike can extend service scope and operation time of public transportation. But the most important thing that will impact citizens intention to use public bikes is bikes shortage situations in each bike station.
The dissertation focuses on shortage situation of YouBike. Using supervised machine learning algorithm with related open data , eg:YouBike availability information, weather statics ,holiday and vacation information from government schedule builds a model to predict public bike insufficient situation. The dissertation also uses a BI tool called Tableau to visualize analysis result that staffs can make bike adjustment decision according to comprehensive dashboard information.
The experiment puts the source data into HDFS and uses Apache Spark to do pre-process. It also compares analysis results by three classification algorithms including Naïve Bayes , SVM and Random Forest provided by Apache Spark MLlib to try to get the best adjustment predictive model of YouBike. For being easy to acquire information , the study use Tableau to create a dashboard for presenting predictive result , past and current YouBike available situation.
According to the experiment result with data of 2015/11~2016/01 YouBike availability , Random Forest is the best algorithm with average 0.87 AUC when training data set has sufficient data attributes. Therefore , the dissertation suggests that operators can use Random Forest to predict bike shortage situation for improving YouBike dispatch operation.
關鍵字(中) ★ 資料探勘
★ 監督式學習技術
★ 微笑單車
關鍵字(英) ★ Tableau
★ Open Data
★ Spark
★ Hadoop
★ YouBike
論文目次
摘要 iii
Abstract iv
誌謝 vi
目錄 vii
圖目錄 ix
表目錄 x
第一章 緒論 1
1.1 研究背景 1
1.2 研究動機 2
1.3 研究目的 4
1.4 論文架構 5
第二章 文獻探討 6
2.1 公共自行車的定義 6
2.2 影響公共自行車使用行為因素 7
2.3 公共自行車運補相關文獻 10
2.4 Open Data 12
2.5 資料視覺化 14
2.6 資料探勘 16
第三章 研究方法 18
3.1 研究架構 18
3.2 資料來源 19
3.2.1 資料範圍限制 20
3.3 資料前處理 22
3.4 實驗環境 24
3.4.1 Apache Spark 24
3.4.2 Apache Hadoop 25
3.4.3 Tableau 26
3.5 分類技術及特徵選取 27
3.6 ROC & AUC 30
第四章 研究結果與分析 33
4.1 實驗結果分析 33
4.2 特徵屬性選取分析 35
4.3 分析結果視覺化 42
第五章 結論 45
5.1 研究結論 45
5.2 研究貢獻 46
5.3 研究限制 47
5.4 未來研究方向 47
參考文獻 49
捷運忠孝復興站2號出口 52
捷運台北101世貿站 53
捷運大安站 54
捷運大安森林公園站 55
捷運芝山站 56
捷運南京三民站1號出口 57
參考文獻 【中文文獻】
1. 王建智(2011),「公共自行車科技接受與擴散歷程」,真理大學企業管理學系碩士論文。
2. 白詩滎(2012),「台北公共自行車使用行為特性分析與友善環境建構之研究」,政治大學地政學系碩士論文。
3. 李致德(2015),「利用Spark分散式運算架構實現基於ASIFT的影像檢索」,國立台灣科技大學資訊工程系碩士論文。
4. 周佰賢(2015),「考慮需求變化狀況及增設臨停區之公共自行車共享系統租借站分群與車輛調度策略研究」,成功大學工業與資訊管理學系。
5. 洪菁蓬(2011),「公共自行車租借系統之最佳租借站位址設置及車輛運補策略之研究」,國立成功大學工業與資訊管理學系博士論文。
6. 原著:Randy Krum,胡為君譯(2014),資訊視覺圖表:讓資料變好看的大數據時代資料表達術,初版,台北:碁峰資訊股份有限公司。
7. 張善政(2015),「建立數位政府服務新思維,強化開放資料、大數據應用深度」,國土及公共治理季刋,第3卷,第4期,3-6。
8. 陳琇盈(2015),「城市地圖資訊可視化再現」,臺北藝術大學新媒體藝術學系碩士論文。
9. 黃仁皇(2010),「公共自行車騎乘特性、服務便利性、騎乘滿意度之相關研究-以台北市微笑單車為例」,朝陽科技大學休閒事業管理系碩士論文。
10. 黃晏珊、鍾智林(2015),「公共自行車系統營運特性大數據分析-台北YouBike 為例」,第二十三屆海峽兩岸都市交通學術研討會論文集,189-201。
11. 黃湘芸(2015),「都市公共自行車系統使用行為特性與環境認知之研究-以臺北市大安區為例」,臺北科技大學建築與都市設計研究所碩士論文。
12. 楊敦翔(2003),「以類神經網路與特徵選取技巧處理空氣能見度預測問題之研究」,國立中山大學機械與機電工程學系碩士論文。
13. 楊瑞宇(2012),「穩健公共自行車租用系統車輛配置模式」,國立台北科技大學資訊與運籌管理研究所碩士論文。
14. 解鴻年、張馨文(2011),「新竹科學城民眾使用公共自行車意願分析」,建築與規劃學報,第12卷,第3期,248。
15. 廖敏婷(2012),「考慮需求比例及暫時人力配置之公共自行車租借系統管理策略研究」,成功大學工業與資訊管理學系碩士論文。
16. 趙文(2014),「公共自行車租賃站區位配置-以高雄市為例」,國立高雄第一科技大學運籌管理研究所碩士論文。
17. 劉宜青(2012),「以模擬最佳化求解公共自行車共享系統之初始車輛配置策略」,成功大學工業與資訊管理學系碩士論文。
18. 蔡承庭(2014),「導入Big Data 科技解決我國Open Data的挑戰」,國立清華大學科技管理研究所碩士論文。
19. 蔡爾逸(2011),「應用支撐向量機(SVM)於都市不動產價格預測之研究」,國立中央大學營建管理研究所碩士論文。
20. 蔡瀧德(2013),「影響民眾使用公共腳踏車意願之研究-以高雄地區民眾為例」,國立高雄應用科技大學,企業管理系碩士論文。
21. 賴淑芳(2012),「公共自行車接受度與滿意度研究-以微笑單車為例」,運輸學刊,第24卷,第3期,1-24。
22. 鍾智林、簡佑勳(2014),「公共自行車時空分析法之構建與營運策略改善-以臺北微笑自行車為例」,都市交通半年刋,第29卷,第1期,1-10。
23. 顏遵漢(2014),「影響公共自行車使用行為意願調查:以台北市微笑單車為例」,長庚大學管理學院碩士學位學程在職專班經營管理組碩士論文。
24. 顔尹臻(2014),「雲端城市交通狀態評估系統應用巨量資料的架構」,東海大學資訊工程學系碩士論文。
25. 龔迪嘉、朱忠東(2008),「城市公共自行車交通系統實施機制」,城市交通 Urban Transport of China,第6卷,第6期,27-32。
【英文文獻】
1. Curran, A. (2008), “Translink public bike system feasibility study,” Quay Communications Inc., Vancouver.
2. Haas, D., Krishnan, S., Wang, J., Franklin, M. J., & Wu, E. (2015), “Wisteria: Nurturing scalable data cleaning infrastructure,” Proceedings of the VLDB Endowment, 8(12), 2004-2007.
3. Kamber, M., Han, J., & Pei, J. (2012), “Data mining: Concepts and techniques,” Elsevier.
4. Krum, R. (2013), “Cool infographics: Effective communication with data visualization and design,” John Wiley & Sons.
5. Langley, P., Iba, W., & Thompson, K. (1992), “An analysis of Bayesian classifiers,” In Aaai (Vol. 90, pp. 223-228).
6. Louppe, G. (2014), “Understanding random forests: From theory to practice,” arXiv preprint arXiv:1407.7502.
【網站資料】
1. 國家發展委員會 (accessed 2016/11/01, available at: http://www.moi.gov.tw/files/moi_note_file/tcc_file_355.pdf)。
2. 開放知識基金會 (accessed 2016/11/01, available at: https://okfn.org/opendata/)。
3. 維基百科-公共自行車 (accessed 2016/10/30, available at: https://zh.wikipedia.org/wiki/公共自行車)。
4. 維基百科-開放資料 (accessed 2016/10/30, available at: https://zh.wikipedia.org/wiki/開放資料)。
5. Apache Hadoop (accessed 2016/11/27, available at: http://hadoop.apache.org/).
6. Apache Spark (accessed 2016/11/27, available at: http://spark.apache.org/).
7. GLOBAL OPEN DATA INDEX (accessed 2016/11/27, available at: http://index.okfn.org/place/).
8. Open data: Unlocking innovation and performance with liquid information (accessed 2016/11/01, available at: http://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/open-data-unlocking-innovation-and-performance-with-liquid-information).
9. The ROC space and plots of the four prediction examples, available at: https://en.wikipedia.org/wiki/Receiver_operating_characteristic
指導教授 蔡志豐 審核日期 2017-7-12
推文 facebook   plurk   twitter   funp   google   live   udn   HD   myshare   reddit   netvibes   friend   youpush   delicious   baidu   
網路書籤 Google bookmarks   del.icio.us   hemidemi   myshare   

若有論文相關問題,請聯絡國立中央大學圖書館推廣服務組 TEL:(03)422-7151轉57407,或E-mail聯絡  - 隱私權政策聲明