- 移動互聯網信息推薦技術研究
- 曹洪江等
- 3303字
- 2024-03-22 20:11:37
1.1.2 移動互聯網推薦技術
當今時代是一個信息爆炸的時代,信息內容日益增長,“信息過載”問題早在傳統(tǒng)互聯網時代就已經出現,推薦系統(tǒng)被認為是可以緩解該問題的有效手段之一[6-8]。一直以來,推薦系統(tǒng)在學術界和工業(yè)界都得到廣泛的關注并已經取得了許多研究成果,在實際生活中也有大量的應用。例如,電子商務(如Amazon、eBay、Netflix、阿里巴巴、當當網等)、網站信息檢索(如iGoogle、My Yahoo、GroupLens、百度等)、旅游、互聯網廣告等眾多應用領域[9]。在移動互聯網已經成為人們獲取信息的主要方式的今天,移動互聯網推薦技術在已有推薦技術的基礎上得到了快速發(fā)展。
1.傳統(tǒng)互聯網推薦技術
推薦系統(tǒng)的非形式化概念是Resnick和Varian在1997年提出的[10],其作用主要是在電子商務網站上向訪問者提供商品的信息和購買建議。推薦系統(tǒng)通常有三個構成要素:推薦對象、用戶、推薦的方法。推薦系統(tǒng)通用模型如圖1.2所示。

圖1.2 推薦系統(tǒng)通用模型
在推薦結果形成的過程中,用戶相關信息的獲取分為主動和被動兩種方式,通過用戶主動提供偏好信息和推薦請求獲取用戶相關信息的方式為被動方式,而通過推薦系統(tǒng)的用戶信息采集系統(tǒng)獲取用戶信息的方式為主動方式。用戶信息是形成個性化推薦的信息基礎,推薦系統(tǒng)在獲取用戶信息的基礎上根據相關推薦算法或根據已有的知識數據庫形成推薦結果返回給用戶使用。文獻[6]給出了推薦系統(tǒng)的形式化定義,即

式中,C為用戶(User)的集合;S是推薦對象集合;u()為效用函數,用于計算s對c的推薦度。因此,推薦系統(tǒng)本質上是計算出不同對象對用戶的推薦度,找出那些使推薦度R最大的對象s*。
用戶和對象的度量與采樣可以使用不同的屬性和特征,這根據實際面對的問題不同而不同,推薦算法研究的中心問題是效用度的計算。u()為效用函數,即u:c×s→R,R為一定范圍內的全序非負實數。在推薦系統(tǒng)中,起核心作用的就是推薦算法,推薦算法的優(yōu)劣直接影響推薦系統(tǒng)的性能和效果。主流的推薦算法包括以下幾種。
1)協(xié)同過濾推薦
協(xié)同過濾推薦(Collaborative Filtering Recommendation)是推薦系統(tǒng)中最成功的方法之一,在推薦系統(tǒng)的相關研究中占有非常重要的地位,該方法的核心思想是利用與目標用戶具有相似度的其他用戶的偏好來預測目標用戶的偏好。基于協(xié)同過濾的推薦系統(tǒng)從用戶的角度進行推薦,具有高度自動化的特點,不需要用戶主動去查找相關的推薦信息,對推薦對象也沒有特殊的要求,能夠處理非結構化的復雜對象。該類方法又分為啟發(fā)式方法(Memory-Based)和基于模型(Model-Based)的方法。在啟發(fā)式方法的研究中,主要包括兩點:①用戶相似度的計算;②相似用戶的評分對目標用戶的效用的統(tǒng)計預測方法。其中,在用戶相似度sim(c,c′)的研究方面,采取的主要研究思路是根據用戶的評分數據來判斷用戶興趣的相似度,基本的計算方法是基于余弦距離(Cosine-Based)和基于關聯(Correlation-Based)的方法。
2)基于模型的方法
基于模型的方法的基本思路是根據用戶c的評分數據來學習并建立一個用戶模型,每個用戶都會對應一個模型,然后根據概率的方法對新對象s的推薦效用進行預測,文獻[6]對其形式化的描述為

3)基于內容的推薦
基于內容的推薦(Content-Based Recommendation)方法的基本思想是根據用戶已經做出了選擇的對象,推薦具有類似屬性的對象,屬于項目關聯(Item-to-Item Correlation)的方法。這種推薦方法不依賴用戶評分數據,而使用特征提取方法得到對象的內容特征。推薦系統(tǒng)通過隱式或顯式的方式事先獲取用戶對推薦對象的偏好,然后計算用戶偏好和待推薦對象的屬性之間的匹配度,根據計算結果決定是否向用戶進行推薦。該方法也分為啟發(fā)式和基于模型兩類方法。
4)混合推薦
混合推薦(Hybrid Recommendation)方法的主要思路就是將不同推薦技術組合起來使用,從而避免單項推薦技術自身存在的弱點。從理論上來說,根據推薦所處的不同階段和不同推薦技術,存在多種組合方式(如加權、切換、混合呈現、特征組合、串聯、元層次混合等)[9],具體采用何種組合方式和推薦場景具有高度關聯性。目前在移動推薦系統(tǒng)方面研究較多的是基于內容的推薦和協(xié)同過濾推薦組合的方法[10,12]。
5)基于知識的推薦
基于知識的推薦(Knowledge-Based Recommendation)方法和前面幾種方法有著較大的不同,它并非建立在用戶的需求和偏好基礎上,而是利用特定領域內已經制定好的規(guī)則(Rule)來進行基于規(guī)則和案例的推薦[13]。基于知識的推薦的前提是知識必須以機器可讀的形式存在,這種推薦方法常伴隨本體(Ontology)知識庫和規(guī)則推理一起出現。
6)基于深度學習的推薦系統(tǒng)
將深度學習應用于推薦系統(tǒng)也是當前推薦系統(tǒng)研究的熱點方向之一,深度學習的基本能力是通過組合低層的特征,形成更加抽象的高層表示屬性或特征,以發(fā)現數據的分布式特征表示。深度學習目前在語音識別、圖像處理、自然語言處理等方面都得到了廣泛應用。一方面,深度學習可通過學習一種深層次非線性網絡結構,表征用戶和項目相關的海量數據,具有強大的從樣本中學習數據集合本質特征的能力,能夠獲取用戶和項目的深層次特征表示;另一方面,深度學習通過從多源異構數據中進行自動特征學習,從而將不同數據映射到一個相同的隱空間,獲得數據的統(tǒng)一表征[14],在此基礎上融合傳統(tǒng)推薦方法進行推薦,能夠有效利用多源異構數據,緩解傳統(tǒng)推薦系統(tǒng)中的數據稀疏和冷啟動問題。與傳統(tǒng)的推薦模式相比,深度學習可以更好地理解用戶的需求、項目的特點及它們之間的歷史交互。深度學習作為一種先進的非線性模型技術,在特征組合挖掘方面具有很大的優(yōu)勢。基于深度學習的推薦系統(tǒng)框架如圖1.3所示。

圖1.3 基于深度學習的推薦系統(tǒng)框架
2.移動推薦系統(tǒng)與傳統(tǒng)互聯網推薦系統(tǒng)的異同
相比于傳統(tǒng)互聯網,移動互聯網在用戶習慣、接入設備、接入網絡方面都有著較大的不同,主要表現為用戶具有移動性、情境信息豐富、網絡接入設備ID化這幾個特點。移動用戶通過移動通信網絡接入互聯網,使得移動用戶可以在任何時間、任何地點訪問互聯網,從而使情境感知計算在移動互聯網應用中顯得尤為重要,且移動用戶具有更為明確和真實的用戶標識。例如,移動用戶的人口統(tǒng)計學數據通常由移動用戶注冊入網時填寫,也可以根據一些機器學習或數據挖掘技術推理獲取(如在移動用戶授權許可范圍內,可以根據移動用戶身份證信息獲取其籍貫信息,通過移動用戶購買行為預測其收入信息,通過移動社交化網絡挖掘移動用戶的工作、教育背景等)。此外,還可以通過某些方式獲取移動用戶的其他信息。例如,通過全球定位系統(tǒng)(Global Positioning System,GPS)獲取移動用戶地理位置信息或移動用戶軌跡,利用機器學習和數據挖掘技術分析移動用戶行為,以提取移動用戶屬性特征。在終端方面,受移動終端設備的性能制約,移動互聯網中的各種應用呈現出個性化、小型化的趨勢。但隨著技術的不斷進步,移動終端設備也將越來越智能,其信息處理能力也會越來越強,近年來興起的云計算將存儲與計算功能集中于服務器端來緩解終端能力的不足,有利于智能移動終端設備在各個領域的普及應用。
移動推薦系統(tǒng)可以說是傳統(tǒng)互聯網推薦系統(tǒng)在新環(huán)境下的一種延伸。因此,移動推薦系統(tǒng)的基本思想與傳統(tǒng)互聯網推薦系統(tǒng)的基本思想是相似的。但在移動互聯網中的移動用戶所處環(huán)境更加復雜,需要融合、協(xié)作的因素更多,只有準確、充分地提取了移動用戶在不同環(huán)境下對各種類型的信息內容的偏好,才有可能做出有效的推薦。因此,在移動推薦中,需要著重考慮移動網絡環(huán)境給移動推薦系統(tǒng)帶來的影響,移動推薦系統(tǒng)中的用戶處于移動網絡環(huán)境,其移動性強,移動信息需求和對推薦的需要受情境信息的影響更大,移動設備自身對數據的處理能力也無法跟個人計算機相比,同時,移動用戶對推薦結果的實時性和精確度要求更高,這些都使得傳統(tǒng)互聯網的一些推薦方法不能直接“移植”到移動推薦系統(tǒng)中[15,16]。另外,由于網絡環(huán)境和要求上的差異,移動推薦系統(tǒng)與傳統(tǒng)互聯網推薦系統(tǒng)所依賴的數據源也不盡相同。移動推薦系統(tǒng)與傳統(tǒng)互聯網推薦系統(tǒng)的主要差異如表1.1所示。
表1.1 移動推薦系統(tǒng)與傳統(tǒng)互聯網推薦系統(tǒng)的主要差異

3.移動推薦系統(tǒng)技術研究體系
移動推薦系統(tǒng)將傳統(tǒng)互聯網推薦系統(tǒng)延伸到移動網絡環(huán)境。在移動網絡中,用戶隨時隨地獲取符合其個性化需求的信息內容成為一種趨勢。在新的要求和環(huán)境下,對推薦系統(tǒng)技術的要求也發(fā)生了變化,目前,對移動推薦系統(tǒng)的研究尚處在起步階段,許多新的方法、新的思路、新的方向仍處于探索階段,本書結合當前的一些研究成果,對移動推薦系統(tǒng)的研究體系進行一些分析和總結。