日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

用户id生成规则_阿里/网易/美团/58用户画像中的ID体系建设

發布時間:2024/1/23 编程问答 43 豆豆
生活随笔 收集整理的這篇文章主要介紹了 用户id生成规则_阿里/网易/美团/58用户画像中的ID体系建设 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

前言

在《標簽構建過程中,如何快速盤點業務及數據需求?》梳理完標簽畫像體系的業務需求后,索隆開始了對畫像體系的整體設計,其中首要遇到的就是用戶ID體系的打通相關的問題。

公司各業務線ID繁多,數據割裂,如何才能盡可能關聯更多的數據,以準確的描繪出一個用戶的畫像呢?

接下來我們來看看索隆通過對界內科技巨頭:阿里、網易、美團、58的調研分析,來一步步建立自己公司的ID-Mapping體系的過程。

1、阿里OneID

阿里巴巴作為一家包含多條業務線的公司,如電商、金融、廣告、文化、教育、娛樂、設備和社交等領域,數據區域包含國內、國外;數據場景包含線上的人貨場錢、線下的人貨場錢位置等數據,以及物流、用餐、咨詢、影視、出行、閱讀、音樂和健康等相關數據。

ID類型包含phone、PC cookie、IMEI與IDFA、淘寶賬戶、支付寶賬戶、郵箱等。

而對于每個BU來說,他們知道的只是這個客戶的片面屬性,在開展營銷活動時,只是針對一個手機號或一個郵箱做營銷,但背后不能識別出來一個自然人、一個公司。

為打破數據孤島,創造更大的數據價值,阿里使用OneData作為核心方法論。

OneData體系包含:

1.OneModel:數據資產構建與管理

2.OneID:實體打通和畫像

3.OneService:邏輯化服務

OneID基于超強ID識別技術鏈接數據,高效生產標簽;業務驅動技術價值化,消除數據孤島,提升數據質量,提升數據價值。

而ID的打通,必須有ID-ID之間的兩兩映射打通關系,通過ID映射關系表,才能將多種ID之間的關聯打通,完全孤立的兩種ID是無法打通的。

打通整個ID體系,看似簡單,實則計算復雜,計算量非常大。假如某種對象有數億個個體,每個個體又有數十種不同的ID標識,任意兩種ID之間都有可能打通關系,想要完成這類對象的所有個體ID打通需要數億次計算,一般的機器甚至大數據集群都無法完成。

大數據領域中的ID-Mapping技術就是用機器學習算法類來取代野蠻計算,解決對象數據打通的問題?;谳斎氲腎D關系對,利用機器學習算法做穩定性和收斂性計算,輸出關系穩定的ID關系對,并生成一個UID作為唯一識別該對象的標識碼。

2、網易ID-Mapping

網易產品線有網易云音樂、網易郵箱、網易新聞、網易嚴選等,不同應用上有不同的ID,如yanxuanid、oaid、musicid、phone、email、idfa、imei等。

要想標識唯一ID,網易采用的思路及方案為:

結合各種賬戶、各種設備型號之間的關系對,以及設備使用規律等用戶數據,采用規則規律、數據挖掘算法(連通圖劃分+社區發現)的方法,判別賬戶是否屬于同一個人。

ID-Mapping過程中,常遇到的問題及對應方案如下:

問題一:用戶有多個設備信息。

解決方案:定義相關的閾值進行關聯。社區發現當前應用于營銷場景,暫未用于風控或用戶運營場景,因為這種方式會把一些異常的賬號關聯在一起,且會存在僅登錄使用過一次的設備信息。

問題二:設備過期,一般是2年半左右時間。

解決方案:設定衰減系數,對單用戶多設備加大衰減力度。

備注:通常一人多設備對應的場景有,借用朋友設備、設備臟數據、刷號等。

3、58 ID-Mapping

58業務場景豐富,其產品線包含58同城、趕集、安居客、中華英才網、轉轉、58到家等。

在這種多用戶、多業務線、多子公司的情況下,用戶數據種類繁雜,構建畫像的數據來自于日志、簡歷庫、帖子庫、用戶信息庫、商家庫、認證信息庫等數據源,其中僅日志就涉及到58、趕集、安居客等各個子產品的PC/M/APP日志。

如何將眾多數據源串聯起來是構建用戶畫像面臨的第一個問題,如下是58構建的ID-Mapping模型圖。

從圖中可以看出,不同業務線所擁有的ID標識不一:

58同城:wuser、wbdid、wimei

58趕集:guser、gbdid、gapud、gimei

安居客:kimei

其中可以通過telep、bidua、appua、imei、idfa關聯起來,由此建立不同ID之間的關聯映射關系,就是ID-Mapping的過程。

4、美團ID-Mapping

美團與大眾點評進行了合并,那同一個用戶在兩個APP上有不同的身份標識,美團要怎樣進行唯一標識呢?

我們來看看美團和大眾點評的賬號體系。美團采用手機號、微信、微博、美團賬號的登錄方式;大眾點評采用的手機號、微信、QQ、微博的登錄方式;其交集為手機號、微信、微博。最終,對于注冊用戶賬戶體系,美團采用了手機號作為用戶的唯一標識。

5、總結

從上述案例可看出,ID-Mapping有三種常見方法:

1.基于賬號體系

企業中最常用的是基于賬號體系來做ID的打通,用戶注冊時,給到用戶一個uid,以uid來強關聯所有注冊用戶的信息。

2.基于設備

那對于未注冊用戶可以通過終端設備ID精準識別,包含Android/iOS兩類主流終端的識別。通過SDK將各種ID采集上報,后臺利用的ID關系庫和校準算法,實時生成/找回終端唯一ID并下發。

3.基于賬號&設備

結合各種賬戶、各種設備型號之間的關系對,以及設備使用規律等用戶數據,采用規則規律、數據挖掘算法的方法,輸出關系穩定的ID關系對,并生成一個UID作為唯一識別該對象的標識碼。

6、實踐

1.梳理業務及數據現狀

由于公司包含租住、生活服務等多條業務線,不同業務的用戶標識不一;數據來源各不相同,數據散落在各業務表中,ID標識包含phone、郵箱、神策ID、cuid、IMEI、idfa等。

2.明確建設目標

ID-Mapping體系的建立,旨在打破數據孤島,將更多用戶的數據關聯起來,形成全域用戶畫像,幫助營銷人員進行精細化營銷。

3.制定項目計劃

第一階段:基于用戶賬號體系,用phone關聯注冊用戶的ID,維護一個ID映射庫,統計注冊用戶線上線下行為數據。

第二階段:基于設備,用device ID關聯未注冊用戶的ID,統計未注冊用戶的行為數據。

第三階段:基于賬號&設備,采用數據挖掘算法做ID映射。

4.按計劃進行

接下來要做的就是按計劃開展項目。這個過程中,注意要點在于,基于公司的數據現狀出發,一步步實施;梳理清楚底層數據表中的ID標識;理清楚各ID之間的關系圖,便于做映射。

說在最后:

整個ID體系建設完成后,接下來會開始標簽設計的篇章~

總結

以上是生活随笔為你收集整理的用户id生成规则_阿里/网易/美团/58用户画像中的ID体系建设的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。