博碩士論文 955202029 詳細資訊




以作者查詢圖書館館藏 以作者查詢臺灣博碩士 以作者查詢全國書目 勘誤回報 、線上人數:13 、訪客IP:3.138.60.73
姓名 丁昭廷(Chao-Ting Ting)  查詢紙本館藏   畢業系所 資訊工程學系
論文名稱 以使用者為導向的Web資料整合系統之設計
(User-centric Web Data Integration: Design and Implementation of Gadget on Demand System)
相關論文
★ 行程邀約郵件的辨識與不規則時間擷取之研究★ NCUFree校園無線網路平台設計及應用服務開發
★ 網際網路半結構性資料擷取系統之設計與實作★ 非簡單瀏覽路徑之探勘與應用
★ 遞增資料關聯式規則探勘之改進★ 應用卡方獨立性檢定於關連式分類問題
★ 中文資料擷取系統之設計與研究★ 非數值型資料視覺化與兼具主客觀的分群
★ 關聯性字組在文件摘要上的探討★ 淨化網頁:網頁區塊化以及資料區域擷取
★ 問題答覆系統使用語句分類排序方式之設計與研究★ 時序資料庫中緊密頻繁連續事件型樣之有效探勘
★ 星狀座標之軸排列於群聚視覺化之應用★ 由瀏覽歷程自動產生網頁抓取程式之研究
★ 動態網頁之樣版與資料分析研究★ 同性質網頁資料整合之自動化研究
檔案 [Endnote RIS 格式]    [Bibtex 格式]    [相關文章]   [文章引用]   [完整記錄]   [館藏目錄]   [檢視]  [下載]
  1. 本電子論文使用權限為同意立即開放。
  2. 已達開放權限電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。
  3. 請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。

摘要(中) 隨著網際網路越來越普及,網路上的資訊量也越來越龐大、豐富,並且以驚人的速度成長著。在資訊量倍數增長的情況下,使用者能夠從網路中獲取許多資訊。不過,使用者為了得到自己所需的資訊,時常必須花費許多時間於瀏覽、過濾網頁內容以及整合相關資訊。對於如何減少使用者負擔以及讓使用者能夠快速且簡單的達到網頁內容整合,一直是資訊整合相關領域所精益求精的目標。Gadget on Demand系統透過網頁抓取和資訊整合技術,幫助使用者快速且簡單的達到網頁內容整合,並提供了多種Gadget呈現模組,讓使用者可以針對自己的資料類型,選擇適合的呈現模組。雖然該系統的基本架構已完整,但功能與技術仍有許多待改進的部分。在本篇論文中,我們加強Gadget on Demand系統三個部分,讓系統的功能更加完善。第一、我們加入跨網站整合功能,讓使用者能夠透過系統,完成不同網站間的資訊整合。第二、我們定義了一個格式,用來記錄使用者的操作流程,目的是為了方便日後使用者修改Gadget以及Gadget內容的自動更新。第三、我們改進系統的頁面抓取技術,讓系統能夠抓取直譯客戶端語言後的資料,以利於系統的資訊擷取與整合。我們也於論文中列舉了數個真實世界的應用情境,像是書籍資訊的整合以及產品規格的比較…等等,使用者透過Gadget on Demand系統的幫助,確實能夠減少許多資訊整合上的負擔。
摘要(英) The target of information integration on the Web (IIWeb) is to decrease users’’ loads from repetitive work and let users mash Web data in accordance with their desire. Gadget on Demand (GOD) system, which equipped with automatic Web page fetching and unsupervised Web data extraction function, has been designed for Web information integration from single entry point with multiple runs and present result in various forms including table, list, map and calendar. In this paper we improve GOD system by filling in a new query form with extracted data from other Web sources, thus allowing cross-site information integration with multiple entry points. Furthermore, we add the gadget editing function such that gadget could be modified for different representation method. We also deal with the AJAX problem where Web contents are changed by client-side language like Javascript in a dynamic fashion and solve this problem via external calls to Web browser. We enumerate several real-world applications based on the revised GOD system, including integration of online book store and city library for storage checking and conference CFP calendar from DBWorld. The system demonstrates a potential utilization in Web2.0 generation where users are enabled with tools to create their own gadgets on demand.
關鍵字(中) ★ 網路 2.0
★ 資訊整合
★ 網頁抓取
★ 資訊擷取
關鍵字(英) ★ Web 2.0
★ Information Integration
★ Information Extraction
★ Web Grabbing
論文目次 目錄 I
圖目錄 III
表目錄 IV
1. 序論 1
2. 相關研究 4
2.1 資訊整合服務 4
2.1.1 一般使用者的資訊整合服務 4
2.1.2 程式設計者的資訊整合服務 8
2.2資訊整合相關技術 8
2.2.1 網頁抓取 8
2.2.2 Wrapper Induction 9
3. 系統實作 11
3.1 系統流程與架構 11
3.2 跨網站資訊整合 14
3.3 操作流程記錄方式 16
3.4 客戶端語言的處理 19
3.5 呈現模組實作 21
3.5.1 地圖 21
3.5.2 月曆 23
4. 實例研究 25
4.1 餐廳資訊的整合 25
4.2 演唱會資訊的整合 27
4.3 書籍簡介的整合 29
4.4 產品的比較 32
4.5 圖書狀況的整合 34
5. 結論與未來展望 38
參考文獻 39
參考文獻 [1] M. Alvarez, A. Pan, J. Raposo and J. Hidalgo, Crawling Web Pages with Support for Client-Side Dynamism. WAIM 2006.
[2] R. Baumgartner, S. Flesca and G. Gottlob, Visual Web Information Extraction with Lixto. VLDB 2001.
[3] C.H. Chang, M. Kayed, M. R. Girgis and K. Shaalan, A Survey of Web Information Extraction Systems. TKDE 2006.
[4] K. C.C. Chang, B. He, C. Li, M. Patel and Z. Zhang, Structured Databases on the Web: Observations and Implications. SIGMOD 2004.
[5] M. Dontcheva, S. M. Drucker, D. Salesin and M. F. Cohen, Relations, Cards, and Search Templates: User-Guided Web Data Integration and Layout. UIST 2007.
[6] P. B. Golgher, A. H.F. Laender, A. S. da Silva and B. Ribeiro-Neto, An Example-Based Environment for Wrapper Generation. ER Workshop 2000.
[7] J. Han, D. Han, C. Lin, H.J. Zeng, Z. Chen and Y. Yu, Homepage Live: Automatic Block Tracing for Web Personalization. WWW 2007.
[8] M. Kayed, C.C. Chang, K. Shaalan and M. R. Girgis, FiVaTech: Page-Level Web Data Extraction from Template Pages. ICDMW 2007.
[9] J. P. Lage, A. S. da Silva, P. B. Golgher and A. H.F. Laender, Automatic generation of agents for collecting hidden Web pages for data extraction. Data & Knowledge Engineering 2004.
[10] Steve Lawrence and C. Lee Giles, Accessibility of information on the web. Intelligence 2000.
[11] S. Lingam and S. Elbaum, Supporting End-Users in the Creation of Dependable Web Clips. WWW 2007.
[12] Y.H. Lu, Y. Hong, J. Varia and D. Lee, Pollock: Automatic Generation of Virtual Web Services from Web Sites. SAC 2005.
[13] A. Thor, D. Aumueller and E. Rahm, Data Integration Support for Mashups. IIWeb 2007.
[14] R. Tuchinda, P. Szekely and C. A. Knoblock, Building Mashups By Example. IUI 2008.
[15] G. Vossen and S. Hagemann, Unleashing Web 2.0 From Concepts to Creativity. Oxford:Elesvier 2007.
[16] Shih-Feng Yang, Multiple Source Data Management for Gadget Creation on Web Portals. 2008.
[17] J. Yu, B. Benatallah, F. Casati and F. Daniel, A Framework for Rapid Integration of Presentation Components. WWW 2007.
[18] BrightPlanet.com. The deep web: Surfacing hidden value. Accessible at http://brightplanet.com, July 2000.
[19] Dapper, http://www.dapper.net.
[20] Google Maps, http://maps.google.com.
[21] Google Maps API, http://code.google.com/apis/maps/.
[22] Google, http://www.google.com.
[23] Openkapow, http://openkapow.com.
[24] Yahoo Pipes, http://pipes.yahoo.com.
指導教授 張嘉惠(Chia-Hui Chang) 審核日期 2009-2-2
推文 facebook   plurk   twitter   funp   google   live   udn   HD   myshare   reddit   netvibes   friend   youpush   delicious   baidu   
網路書籤 Google bookmarks   del.icio.us   hemidemi   myshare   

若有論文相關問題,請聯絡國立中央大學圖書館推廣服務組 TEL:(03)422-7151轉57407,或E-mail聯絡  - 隱私權政策聲明