摘要(英) |
Now weather changes dramatically all around the world. For natural ecology retention and our environment sustainable development , all countries suppose to use energy saving and carbon reduction vehicle as green transportation to become a part of city transportation. According to this concept , Public Sharing Bike was invented. After bus and MRT transportation system become mature and complete in Taiwan , there is still a certain distance between public transportation station and destination. For this last mile demand , Taipei City Government had started to implement Public Share Bike System called “YouBike” in March 2009 , hoped it can replace private vehicles , improve insufficient parking space situation and traffic congestion circumstances. On the other hand , the government also expect YouBike can extend service scope and operation time of public transportation. But the most important thing that will impact citizens intention to use public bikes is bikes shortage situations in each bike station.
The dissertation focuses on shortage situation of YouBike. Using supervised machine learning algorithm with related open data , eg:YouBike availability information, weather statics ,holiday and vacation information from government schedule builds a model to predict public bike insufficient situation. The dissertation also uses a BI tool called Tableau to visualize analysis result that staffs can make bike adjustment decision according to comprehensive dashboard information.
The experiment puts the source data into HDFS and uses Apache Spark to do pre-process. It also compares analysis results by three classification algorithms including Naïve Bayes , SVM and Random Forest provided by Apache Spark MLlib to try to get the best adjustment predictive model of YouBike. For being easy to acquire information , the study use Tableau to create a dashboard for presenting predictive result , past and current YouBike available situation.
According to the experiment result with data of 2015/11~2016/01 YouBike availability , Random Forest is the best algorithm with average 0.87 AUC when training data set has sufficient data attributes. Therefore , the dissertation suggests that operators can use Random Forest to predict bike shortage situation for improving YouBike dispatch operation. |
參考文獻 |
【中文文獻】
1. 王建智(2011),「公共自行車科技接受與擴散歷程」,真理大學企業管理學系碩士論文。
2. 白詩滎(2012),「台北公共自行車使用行為特性分析與友善環境建構之研究」,政治大學地政學系碩士論文。
3. 李致德(2015),「利用Spark分散式運算架構實現基於ASIFT的影像檢索」,國立台灣科技大學資訊工程系碩士論文。
4. 周佰賢(2015),「考慮需求變化狀況及增設臨停區之公共自行車共享系統租借站分群與車輛調度策略研究」,成功大學工業與資訊管理學系。
5. 洪菁蓬(2011),「公共自行車租借系統之最佳租借站位址設置及車輛運補策略之研究」,國立成功大學工業與資訊管理學系博士論文。
6. 原著:Randy Krum,胡為君譯(2014),資訊視覺圖表:讓資料變好看的大數據時代資料表達術,初版,台北:碁峰資訊股份有限公司。
7. 張善政(2015),「建立數位政府服務新思維,強化開放資料、大數據應用深度」,國土及公共治理季刋,第3卷,第4期,3-6。
8. 陳琇盈(2015),「城市地圖資訊可視化再現」,臺北藝術大學新媒體藝術學系碩士論文。
9. 黃仁皇(2010),「公共自行車騎乘特性、服務便利性、騎乘滿意度之相關研究-以台北市微笑單車為例」,朝陽科技大學休閒事業管理系碩士論文。
10. 黃晏珊、鍾智林(2015),「公共自行車系統營運特性大數據分析-台北YouBike 為例」,第二十三屆海峽兩岸都市交通學術研討會論文集,189-201。
11. 黃湘芸(2015),「都市公共自行車系統使用行為特性與環境認知之研究-以臺北市大安區為例」,臺北科技大學建築與都市設計研究所碩士論文。
12. 楊敦翔(2003),「以類神經網路與特徵選取技巧處理空氣能見度預測問題之研究」,國立中山大學機械與機電工程學系碩士論文。
13. 楊瑞宇(2012),「穩健公共自行車租用系統車輛配置模式」,國立台北科技大學資訊與運籌管理研究所碩士論文。
14. 解鴻年、張馨文(2011),「新竹科學城民眾使用公共自行車意願分析」,建築與規劃學報,第12卷,第3期,248。
15. 廖敏婷(2012),「考慮需求比例及暫時人力配置之公共自行車租借系統管理策略研究」,成功大學工業與資訊管理學系碩士論文。
16. 趙文(2014),「公共自行車租賃站區位配置-以高雄市為例」,國立高雄第一科技大學運籌管理研究所碩士論文。
17. 劉宜青(2012),「以模擬最佳化求解公共自行車共享系統之初始車輛配置策略」,成功大學工業與資訊管理學系碩士論文。
18. 蔡承庭(2014),「導入Big Data 科技解決我國Open Data的挑戰」,國立清華大學科技管理研究所碩士論文。
19. 蔡爾逸(2011),「應用支撐向量機(SVM)於都市不動產價格預測之研究」,國立中央大學營建管理研究所碩士論文。
20. 蔡瀧德(2013),「影響民眾使用公共腳踏車意願之研究-以高雄地區民眾為例」,國立高雄應用科技大學,企業管理系碩士論文。
21. 賴淑芳(2012),「公共自行車接受度與滿意度研究-以微笑單車為例」,運輸學刊,第24卷,第3期,1-24。
22. 鍾智林、簡佑勳(2014),「公共自行車時空分析法之構建與營運策略改善-以臺北微笑自行車為例」,都市交通半年刋,第29卷,第1期,1-10。
23. 顏遵漢(2014),「影響公共自行車使用行為意願調查:以台北市微笑單車為例」,長庚大學管理學院碩士學位學程在職專班經營管理組碩士論文。
24. 顔尹臻(2014),「雲端城市交通狀態評估系統應用巨量資料的架構」,東海大學資訊工程學系碩士論文。
25. 龔迪嘉、朱忠東(2008),「城市公共自行車交通系統實施機制」,城市交通 Urban Transport of China,第6卷,第6期,27-32。
【英文文獻】
1. Curran, A. (2008), “Translink public bike system feasibility study,” Quay Communications Inc., Vancouver.
2. Haas, D., Krishnan, S., Wang, J., Franklin, M. J., & Wu, E. (2015), “Wisteria: Nurturing scalable data cleaning infrastructure,” Proceedings of the VLDB Endowment, 8(12), 2004-2007.
3. Kamber, M., Han, J., & Pei, J. (2012), “Data mining: Concepts and techniques,” Elsevier.
4. Krum, R. (2013), “Cool infographics: Effective communication with data visualization and design,” John Wiley & Sons.
5. Langley, P., Iba, W., & Thompson, K. (1992), “An analysis of Bayesian classifiers,” In Aaai (Vol. 90, pp. 223-228).
6. Louppe, G. (2014), “Understanding random forests: From theory to practice,” arXiv preprint arXiv:1407.7502.
【網站資料】
1. 國家發展委員會 (accessed 2016/11/01, available at: http://www.moi.gov.tw/files/moi_note_file/tcc_file_355.pdf)。
2. 開放知識基金會 (accessed 2016/11/01, available at: https://okfn.org/opendata/)。
3. 維基百科-公共自行車 (accessed 2016/10/30, available at: https://zh.wikipedia.org/wiki/公共自行車)。
4. 維基百科-開放資料 (accessed 2016/10/30, available at: https://zh.wikipedia.org/wiki/開放資料)。
5. Apache Hadoop (accessed 2016/11/27, available at: http://hadoop.apache.org/).
6. Apache Spark (accessed 2016/11/27, available at: http://spark.apache.org/).
7. GLOBAL OPEN DATA INDEX (accessed 2016/11/27, available at: http://index.okfn.org/place/).
8. Open data: Unlocking innovation and performance with liquid information (accessed 2016/11/01, available at: http://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/open-data-unlocking-innovation-and-performance-with-liquid-information).
9. The ROC space and plots of the four prediction examples, available at: https://en.wikipedia.org/wiki/Receiver_operating_characteristic |