日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

干货 | 当你在携程搜索时,背后的推荐系统是如何工作的

發布時間:2025/3/21 windows 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 干货 | 当你在携程搜索时,背后的推荐系统是如何工作的 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

作者簡介

葛榮亮,攜程搜索部門高級研發工程師。2015年加入攜程,目前主要負責搜索平臺的前端+數據挖據工作。

一、前言

隨著旅游業的發展,人們對搜索的要求越來越高。智能化大趨勢下,個性化的推薦系統的應用及用戶需求也越來越廣泛。

旅游推薦系統主要面臨的問題及挑戰包括:

  • 用戶維度,用戶的需求多種多樣,如本地異地的差異,年齡、家庭結構的差異等;

  • 時間、地理維度,每個時間點的需求都是不同的,如季節(冬季的溫泉,夏季避暑...)、早中晚的需求差異,不同城市用戶對同一目的地的旅游產品類別需求可能不同;

  • 產品維度,如何輸出多樣性的產品也是推薦系統考慮的重點,如相似的酒店、景點等。

針對以上面臨的問題和挑戰,本文將分享攜程推薦系統的更新迭代過程。

二、推薦系統架構

攜程搜索推薦系統架構如下:

拋開業務和數據部分,這里只簡單介紹推薦服務的結構,其簡要構造如下:

2.1 用戶行為

用戶行為數據展示了用戶的操作習慣和偏好。對這部分數據進行離線分析,可以更好地理解用戶,以此來做線上產品的推薦源。

對線上需要的行為數據,可以取一個月或者近7天的歷史數據,以保證數據的時效性。

2.2 可用產品

這部分指的是可供用戶使用的產品及可以提供幫助的文章等。主旨在于告訴系統,我們有什么產品,哪些產品是可以提供給用戶的,及哪些是優質的產品。產品的定義比較廣泛,可以不限定具體的售賣產品,也可指定用戶偏好,比如用戶對酒店、景點的偏向等。

2.3.召回

這部分是整個系統的重點,也是規劃場景最多的地方。這部分可以細分成幾大召回策略(以推薦實際酒店、文章、景點的系統為例):

2.3.1 補充策略

這部分主要輸出當前熱門的產品信息,比如當季熱門的酒店、景點等。

在具體實現的時候可以考慮季節性的變化,比如以兩周為周期,統計產品的點擊情況,當用戶對于溫泉搜索量增加時,可以輸出一些熱門的溫泉景點。

這部分補充策略,只是為了解決冷啟動問題,即當用戶沒有行為,或者沒有地理位置信息時,做最基本的補充。

2.3.2 基于位置召回

當得到具體位置信息之后,可以做更具體的補充召回:

1)根據當前用戶所在地,推薦當地的熱門產品;

2)判斷用戶是否在常住地。如常駐上海的用戶,在上海搜索產品時,更喜歡周邊游,而常駐北京的用戶,在上海搜產品時,更喜歡東方明珠和迪士尼。

具體分類為:

本地需求(定位城市=常駐城市),輸出當地人熱搜/點擊的產品;

外地需求(定位城市!=常駐城市),輸出外地人熱搜/點擊的產品;

3)根據地理位置信息,輸出用戶周邊的幾公里內的產品。

2.3.3 基于歷史關聯策略

這部分內容是基于用戶歷史行為,推出相關的產品。需要對數據和行為進行總結,并提供相應的產品展示邏輯,豐富推薦召回的內容。比如用戶預定迪士尼樂園的門票,可以推迪士尼附近的酒店等。

2.3.4 協同過濾

協同過濾是推薦系統經典的算法。其對用戶行為、產品的相關性做了抽象和泛化。協同過濾算法主要分為USER CF和ITEM CF,即基于用戶的協同過濾和基于物品的協同過濾。

在這里我們主要用到基于物品的協調過濾,相比用戶的協同過濾,物品的內容屬性和數量更便于統計和計算。具體算法可以參看《推薦系統實踐》這本書。

大體可以理解為,定了某一酒店的用戶,又定了哪些酒店,及通常訂了又訂的邏輯。比如,以用戶一個月的點擊或訂單數據為基礎,計算出物品的相似度,當用戶搜了某條產品時,推薦與其相似的其他產品。具體示例為:假設東方明珠、外灘、迪士尼產品相似,當用戶搜索東方明珠的時,推薦外灘和迪士尼。

2.4 排序

上述召回策略,會召回大量的產品,如何對這些產品進行合理排序,是推薦系統的核心部分,同時也是反映系統優劣的指標。

這部分,經歷幾次迭代。

在1.0時代,在排序策略上進行了幾次變動:

1)對召回產品按照類別,對相同類型產品,進行銷量排序;

2)考慮到操作時間問題,加入操作時間權重。對歷史行為的時間進行歸一化得出權重,最大為1。操作時間越近,權重越大;

3)考慮規則的重要性,加入規則分;

上述排序策略取得一定效果,但很難完善排序問題。

最終,選取了機器學習的排序算法。其基本實現為:對每個輸出產品,規劃特征,輸出特征集。比如季節特征,當地人/外地人特征,一天內的早、中、晚特征等。接下來根據訂單和點擊數據,輸出訓練樣本,為每個召回產品做一個打分,最高5分,最低1分。最后使用XGBoost工具,對樣本進行訓練,這樣就能得出基本模型。

通過模型,對線上每個召回產品進行打分并排序,得出最終結果。同時在系統上線后,定期的進行更新,并通過ABTest系統不斷對模型進行迭代。

大致流程如下:

2.5 過濾輸出

這部分內容,主要做格式化輸出,并過濾一些無效,黑名單產品。

每個場景的輸出,都不太一樣,就需要對其數據進行篩選。比如進入搜索默認頁時,提前給出推薦產品,減少用戶操作。還可以在用戶搜某個具體城市時,輸出相應的結果。

這里需要注意的是馬太效應。由于推出的內容有限,對于一些產品,會導致點擊多的會越來越多,而點擊少的,則慢慢退出推薦序列。這里需要對那些不常用產品做展示規劃。比如隨機出一兩條,給一定曝光,消除一部分馬太效應。

三、展望

目前推薦系統已經運用在多個場景,但對場景及產品的引入畢竟有限,同時對query 分析還不夠完善,后續將豐富產品,并引入更多機器學習的內容,讓系統更智能化和自動化。同時會加入更多深度學習內容,在搜索意圖和NLP相關方面做更進一步的分析。

總結

以上是生活随笔為你收集整理的干货 | 当你在携程搜索时,背后的推荐系统是如何工作的的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 农夫色综合 | 亚洲精品乱码久久久久 | 国产日韩精品一区二区三区 | 色漫在线观看 | 97超碰国产精品无码蜜芽 | 天天综合网天天综合 | 久久综合激的五月天 | 四虎在线影视 | 男生c女生 | 欧美顶级少妇做爰 | 日本少妇激三级做爰在线 | 青青草视频污 | 色性网站 | 97中文在线 | 国产精品国产av | 欧美福利一区 | 内射无码专区久久亚洲 | 日韩精品1区 | av色欲无码人妻中文字幕 | 久久精品中文闷骚内射 | 一个人在线免费观看www | 九色精品| 久久91精品国产 | 国产精品国产精品国产专区 | 日本女人一区二区三区 | 欧美精品色 | 久久久91精品 | 一级在线视频 | japan粗暴video蹂躏 | 青青视频免费观看 | 视频一区 国产 | 久久视频热 | 成人3d动漫一区二区三区91 | 在线视频一二区 | 国产极品美女高潮无套在线观看 | 免费在线中文字幕 | 色www| 日韩r级电影在线观看 | 黑人巨大精品一区二区在线 | 国产欧美一区二区三区另类精品 | 精品少妇无码av无码专区 | 天天爽夜夜爽 | 蜜臀久久精品久久久久 | 美女扒开尿口给男人看 | 国产精品无码专区av在线播放 | 日本在线观看www | 成年人在线网站 | 麻豆传媒网 | 国产一二三四在线 | 99在线精品视频免费观看20 | 一级色网站 | 日日躁夜夜躁白天躁晚上躁91 | 91高跟黑色丝袜呻吟在线观看 | 日本国产在线 | 韩国久久久| 成人www视频 | 强公把我次次高潮hd | 深夜福利视频导航 | 热99 | 久操久 | 久久77| 动漫av一区二区 | 国产suv精品一区二区68 | 欧美日韩高清在线播放 | 91麻豆一区二区三区 | 华丽的外出在线观看 | 福利毛片| 欧美激情在线观看 | xvideos成人免费视频 | 一卡二卡三卡在线观看 | 欧美日韩一区二区三区电影 | 国产精品无码一区二区三区三 | 一区二区日韩国产 | 激情开心站| 一区二区影院 | 精品国产一区二区三区在线 | 少妇人妻丰满做爰xxx | 美女爆乳18禁www久久久久久 | 久久澡 | 国产精品无码久久久久久 | 国产妻精品一区二区在线 | 超碰97在线看 | 精品欧美一区二区三区 | 欧美性生交大片免费看app麻豆 | 成人涩涩网站 | 高清视频在线免费观看 | 久久蜜桃视频 | 91在线视频导航 | 二级黄色录像 | 国产av剧情一区二区三区 | 久久久久久久人妻无码中文字幕爆 | 521a人成v香蕉网站 | 五月天久久综合 | 亚洲一区二区视频在线 | 国产国产精品 | 91精品国产电影 | 九九热视频免费 | 亚洲玖玖爱 | 久久精品国产亚洲av嫖农村妇女 |