博碩士論文 105522013 詳細資訊




以作者查詢圖書館館藏 以作者查詢臺灣博碩士 以作者查詢全國書目 勘誤回報 、線上人數:71 、訪客IP:3.138.175.180
姓名 連丞宥(Cheng-You Lien)  查詢紙本館藏   畢業系所 資訊工程學系
論文名稱 透過網頁瀏覽紀錄預測使用者之個人資訊與性格特質
(Predicting Users′ Demographic Information and Personality Through Browsing History)
相關論文
★ 透過矩陣分解之多目標預測方法預測使用者於特殊節日前之瀏覽行為變化★ 動態多模型融合分析研究
★ 擴展點擊流:分析點擊流中缺少的使用者行為★ 關聯式學習:利用自動編碼器與目標傳遞法分解端到端倒傳遞演算法
★ 融合多模型排序之點擊預測模型★ 分析網路日誌中有意圖、無意圖及缺失之使用者行為
★ 基於自注意力機制產生的無方向性序列編碼器使用同義詞與反義詞資訊調整詞向量★ 探索深度學習或簡易學習模型在點擊率預測任務中的使用時機
★ 空氣品質感測器之故障偵測--基於深度時空圖模型的異常偵測框架★ 以同反義詞典調整的詞向量對下游自然語言任務影響之實證研究
★ 結合時空資料的半監督模型並應用於PM2.5空污感測器的異常偵測★ 藉由權重之梯度大小調整DropConnect的捨棄機率來訓練神經網路
★ 使用圖神經網路偵測 PTT 的低活躍異常帳號★ 針對個別使用者從其少量趨勢線樣本生成個人化趨勢線
★ 基於雙變量及多變量貝他分布的兩個新型機率分群模型★ 一種可同時更新神經網路各層網路參數的新技術— 採用關聯式學習及管路化機制
檔案 [Endnote RIS 格式]    [Bibtex 格式]    [相關文章]   [文章引用]   [完整記錄]   [館藏目錄]   [檢視]  [下載]
  1. 本電子論文使用權限為同意立即開放。
  2. 已達開放權限電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。
  3. 請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。

摘要(中) 瀏覽網頁所留下的歷史紀錄能夠描述出使用者瀏覽偏好,因此網頁瀏覽紀錄已經成為了解使用者相關資訊的最佳方式之一。近年來藉由分析使用者瀏覽紀錄並進行個人化商品、廣告推薦的應用逐漸增加,其中影響推薦結果準確度之關鍵在於對使用者相關資訊之掌握度,如果能夠藉由分析網頁瀏覽紀錄來獲得使用者的個人資訊與人格特質將能夠提升推薦系統之效能。

本篇論文將 600 位使用者之網頁瀏覽紀錄進行分析並找出較具有代表性的使用者特徵,藉由此使用者特徵搭配分群結合監督式學習方法預測出使用者之性別、年齡、感情狀態與大六性格特質分數,並在準確度上皆有良好的表現。同時也拓展了使用者行為分析的視野,當藉由網頁瀏覽紀錄預測使用者相關資訊時,將不再侷限於個人資訊的預測,而是能夠更加深入了解使用者的個性
摘要(英) Analyzing an individual’s Internet browsing history is one method of revealing the information about that person; for example, it reveals his/her preference for browsing websites. Analyzing browsing histories has become an increasingly common method for recommending advertisements that may serve individuals’ needs. The accuracy of advertisement recommendations depends on the understanding of a user’s information; thus, a recommender system will be more effective if it can analyze browsing histories to identify users’ demographic information and personalities.

This study examined the website browsing histories of 600 users to identify representative user features, which were subsequently analyzed through supervised learning with clustering to make predictions about the users in terms of gender, age, relationship statuses, and big six personality scores. The proposed method enhances the accuracy of the supervised prediction model and broadens the scope of user behavior analyses; particularly, in predicting users’ demographic information, this proposed method clarifies users’ personalities in further depths.
關鍵字(中) ★ 監督式學習
★ 分群
★ 大六性格特質分數
關鍵字(英) ★ Supervised learning
★ Clustering
★ Big-six personality
論文目次 中文摘要p.i
ABSTRACT p.ii
目錄p.iii
圖目錄p.v
表目錄p.vi
一、緒論p.1
1.1 研究動機p.1
1.2 研究目標p.1
1.3 研究貢獻p.2
1.4 論文架構p.3
二、相關研究p.4
2.1 網頁瀏覽紀錄之分析應用p.4
2.2 根據使用者之性格特質給予特定廣告之策略p.5
2.3 預測使用者在特殊節日之網頁瀏覽行為變化p.6
三、資料集介紹與特徵設計p.7
3.1 資料集中各類資訊介紹p.7
3.1.1 資料集中網頁瀏覽歷史紀錄之介紹p.7
3.1.2 資料集中使用者個人資訊之介紹p.8
3.1.3 資料集中使用者大六性格特質之介紹p.8
3.2 資料前處理之過程與想法p.9
3.3 特徵選擇之原因以及分析p.10
3.3.1 使用者於各類型網頁之瀏覽比例p.11
3.4 使用者於一天中各時段之瀏覽頻率p.12
四、預測使用者個人資訊與大六性格特質分數之方法p.13
4.1 預測個人資訊之分類模型選擇p.13
4.2 預測大六性格特質分數之回歸模型選擇p.14
4.3 結合分群方法之監督式學習p.15
五、實驗結果與分析p.16
5.1 實驗資料集介紹p.16
5.2 評估模型優劣之方法p.16
5.2.1 個人資訊預測結果之評估標準p.16
5.2.2 大六性格特質分數預測結果之評估標準p.18
5.2.3 使用者分群效果之評估標準p.18
5.3 預測個人資訊之結果比較p.18
5.4 預測大六性格特質分數之結果比較p.26
5.5 實驗結果分析p.28
5.5.1 預測個人資訊結果分析p.28
5.5.2 預測大六性格特質分數結果分析p.29
六、結論與未來展望p.30
6.1 結論p.30
6.2 未來展望p.31
參考文獻p.32
參考文獻 [1] L. M. Greaves, L. J. Cowie, G. Fraser, E. Muriwai, Y. Huang, P. Milojev, D. Osborne, C. G. Sibley, M. Zdrenka, J. Bulbulia et al., “Regional differences and similarities in the personality of new zealanders.” New Zealand Journal of Psychology, vol. 44, no. 1, 2015.
[2] P. Luo, S. Yan, Z. Liu, Z. Shen, S. Yang, and Q. He, “From online behaviors to offline retailing,” in Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2016, pp. 175–184.
[3] D. A. Merriman and K. J. O’connor, “Method of delivery, targeting, and measuring advertising over networks,” Sep. 7 1999, uS Patent 5,948,061.
[4] A. Freno, M. Saveski, R. Jenatton, and C. Archambeau, “One-pass ranking models for low-latency product recommendations,” in Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2015, pp. 1789–1798.
[5] M. Kosinski, D. Stillwell, and T. Graepel, “Private traits and attributes are predictable from digital records of human behavior,” Proceedings of the National Academy of Sciences, vol. 110, no. 15, pp. 5802–5805, 2013.
[6] S. Matz, M. Kosinski, G. Nave, and D. Stillwell, “Psychological targeting as an effective approach to digital mass persuasion,” Proceedings of the National Academy of Sciences, p. 201710966, 2017.
[7] C. Cadwalladr and E. Graham-Harrison, “Revealed: 50 million facebook profiles harvested for cambridge analytica in major data breach,” The Guardian, vol. 17, 2018.
[8] C. Y. Lien, G. J. Bai, T. R. Chen, and H. H. Chen, “Predicting user’s online shopping tendency during shopping holidays,” in Technologies and Applications of Artificial Intelligence, 2017.
[9] B. P. O’Connor, “A quantitative review of the comprehensiveness of the five-factor model in relation to popular personality inventories,” Assessment, vol. 9, no. 2, pp. 188–203, 2002.
[10] N. S. Altman, “An introduction to kernel and nearest-neighbor nonparametric regression,” The American Statistician, vol. 46, no. 3, pp. 175–185, 1992.
[11] T. K. Ho, “Random decision forests,” in Document analysis and recognition, 1995., proceedings of the third international conference on. IEEE, 1995, pp. 278–282.
[12] R. Tibshirani, “Regression shrinkage and selection via the lasso,” Journal of the Royal Statistical Society. Series B (Methodological), pp. 267–288, 1996.
[13] A. E. Hoerl and R.W. Kennard, “Ridge regression: Biased estimation for nonorthogonal problems,” Technometrics, vol. 12, no. 1, pp. 55–67, 1970.
[14] R. C. de Amorim and C. Hennig, “Recovering the number of clusters in data sets with noise features using feature rescaling factors,” Information Sciences, vol. 324, pp. 126–145, 2015.
[15] S. Hochreiter and J. Schmidhuber, “Long short-term memory,” Neural computation, vol. 9, no. 8, pp. 1735–1780, 1997.
指導教授 陳弘軒(Hung-Hsuan Chen) 審核日期 2018-6-27
推文 facebook   plurk   twitter   funp   google   live   udn   HD   myshare   reddit   netvibes   friend   youpush   delicious   baidu   
網路書籤 Google bookmarks   del.icio.us   hemidemi   myshare   

若有論文相關問題,請聯絡國立中央大學圖書館推廣服務組 TEL:(03)422-7151轉57407,或E-mail聯絡  - 隱私權政策聲明