日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

用户行为分析案例——天池数据集User Behavior Data from Taobao

發(fā)布時(shí)間:2024/1/1 编程问答 116 豆豆
生活随笔 收集整理的這篇文章主要介紹了 用户行为分析案例——天池数据集User Behavior Data from Taobao 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

用戶行為分析過(guò)程

        • 說(shuō)明
        • 一、數(shù)據(jù)集與分析目的
            • 1、數(shù)據(jù)集
            • 2、分析目的
        • 二、數(shù)據(jù)處理
            • 1、數(shù)據(jù)預(yù)覽
            • 2、數(shù)據(jù)處理
        • 三、數(shù)據(jù)提取與分析
            • 1、網(wǎng)站流量分析
            • 2、用戶分析
            • 3、商品銷售分析
        • 四、總結(jié)
            • 1、關(guān)于平臺(tái)流量與轉(zhuǎn)化率:
            • 2、關(guān)于網(wǎng)站用戶粘性以及用戶消費(fèi)習(xí)慣
            • 3、關(guān)于商品銷售情況

說(shuō)明

本次數(shù)據(jù)分析基于阿里云天池?cái)?shù)據(jù)集(用戶行為數(shù)據(jù)集),使用轉(zhuǎn)化漏斗,AARRR模型,對(duì)常見(jiàn)電商分析指標(biāo),包括轉(zhuǎn)化率,PV,UV,留存率,復(fù)購(gòu)率等進(jìn)行分析,分析過(guò)程中使用MySQL以及Navicat進(jìn)行數(shù)據(jù)預(yù)覽與清洗處理,使用Excel進(jìn)行數(shù)據(jù)可視化。

一、數(shù)據(jù)集與分析目的

1、數(shù)據(jù)集
字段說(shuō)明
user_id整數(shù)類型,序列化后的用戶ID
item_id整數(shù)類型,序列化后的商品ID
category_id整數(shù)類型,序列化后的商品所屬類目ID
behaviortype字符串,枚舉類型,包括(‘pv’, ‘buy’, ‘cart’, ‘fav’)
timestamps行為發(fā)生的時(shí)間戳

該數(shù)據(jù)集記錄用戶在淘寶網(wǎng)站瀏覽商品產(chǎn)生的行為信息。由于數(shù)據(jù)集過(guò)大 ,選取其中10200位用戶,共105萬(wàn)條數(shù)據(jù)。

2、分析目的

1)了解網(wǎng)站流量情況;
2)了解該階段網(wǎng)站用戶粘性以及用戶行為習(xí)慣;
3)了解網(wǎng)站商品銷售情況;
分析邏輯如下:

二、數(shù)據(jù)處理

1、數(shù)據(jù)預(yù)覽

MySQL建表,使用Navicat導(dǎo)入數(shù)據(jù)

use userbehavior; create table user( user_id int not null, item_id int not null, category_id int not null, behavetype varchar(10) not null, times int not null, constraint user_behave PRIMARY KEY (user_id,item_id,times))
2、數(shù)據(jù)處理

(1)日期處理
將行為發(fā)生時(shí)間轉(zhuǎn)為datetime類型,獲取其發(fā)生日期及時(shí)間

SET SQL_SAFE_UPDATES = 0; ALTER TABLE user ADD COLUMN datentime TIMESTAMP(0) NULL; UPDATE user SET datentime = FROM_UNIXTIME(times); ALTER TABLE user ADD COLUMN dates CHAR(10) NULL; UPDATE user SET dates = SUBSTRING(datentime FROM 1 FOR 10); ALTER TABLE user ADD COLUMN hours CHAR(10) NULL; UPDATE user SET hours = SUBSTRING(datentime FROM 12 FOR 2);

(2)數(shù)據(jù)清洗

DELETE FROM user WHERE datentime < '2017-11-25 00:00:00' OR datentime > '2017-12-04 00:00:00';

三、數(shù)據(jù)提取與分析

1、網(wǎng)站流量分析
  • 創(chuàng)建用戶行為視圖
use taobaouser; create view userbehave as select user_id,count(behavetype) num,sum(if(behavetype='pv',1,0)) pv,sum(if(behavetype='cart',1,0)) cartbox,sum(if(behavetype='fav',1,0)) favor,sum(if(behavetype='buy',1,0)) buy,dates,hours from user group by user_id,dates,hours order by user_id,dates,hours


(1)用戶參與度(pv)分析

SELECT distinct user_id,dates FROM taobaouser.user where behavetype='pv' order by dates


分析:11月25日至12月1日使用用戶數(shù)變化幅度小,范圍在7000到8000之間,從12月2日有較大幅度增加,對(duì)比11月25,26(周末)有較大的提升,可能是周末的雙12預(yù)熱營(yíng)銷活動(dòng)效果。

(2)網(wǎng)站購(gòu)買(mǎi)轉(zhuǎn)化率(uv)(支付轉(zhuǎn)化率=支付訪客數(shù)/總訪客數(shù))

select activeuser.dates,activeuser.ac,alluser.au,concat(round(activeuser.ac/alluser.au*100,2),'%') conversion from (SELECT dates,count(distinct user_id) ac FROM taobaouser.userbehave where buy<>0 group by dates) as activeuser join (SELECT dates,count(distinct user_id) au FROM taobaouser.userbehave group by dates) as alluser on activeuser.dates=alluser.dates


支付轉(zhuǎn)化率在11月30日取得最高值,之后呈大幅下降趨勢(shì)。

(3)轉(zhuǎn)化漏斗
獨(dú)立訪客轉(zhuǎn)化率能達(dá)到69.9%,但是從訪客行為來(lái)看,瀏覽到購(gòu)買(mǎi)轉(zhuǎn)化率只有2.3%,若要了解具體環(huán)節(jié)的轉(zhuǎn)化率,需要對(duì)整個(gè)流程接觸到的版面進(jìn)行細(xì)化的數(shù)據(jù)分析。

2、用戶分析

(數(shù)據(jù)有限,用戶新增及激活不做分析)

(1)留存
計(jì)算新增留存率與活躍留存率,視該時(shí)間段內(nèi)首次登陸為新增用戶,購(gòu)買(mǎi)為活躍用戶
新增活躍率:

#計(jì)算留存率 select first_login, concat(round(day_0/day_0*100,2),'%') day0,concat(round(day_1/day_0*100,2),'%') day1, concat(round(day_3/day_0*100,2),'%') day3,concat(round(day_6/day_0*100,2),'%') day6,concat(round(day_7/day_0*100,2),'%') day7 from #計(jì)算不同留存用戶 (select first_login, sum(if(by_date=0,1,0)) as day_0,sum(if(by_date=1,1,0)) as day_1, sum(if(by_date=3,1,0)) as day_3,sum(if(by_date=6,1,0)) as day_6,sum(if(by_date=7,1,0)) as day_7 from #比較瀏覽時(shí)間與第一次瀏覽時(shí)間比較,確定時(shí)間差 (select l.user_id,l.dates login_date,f.first_login,timestampdiff(day,f.first_login,l.dates) by_date from taobaouser.userlogin l join (SELECT user_id,dates first_login FROM taobaouser.userlogin group by user_id order by dates) as fon l.user_id=f.user_id) as b group by first_login order by first_login) as retent




將25日登陸用戶作為新增用戶來(lái)看,次日,3日留存率能達(dá)到60%以上,7日留存率達(dá)到了90%以上,用戶粘性很好,高新增留存率可能與處于雙十一促銷時(shí)段有關(guān),說(shuō)明產(chǎn)品新手引導(dǎo)性很好。
活躍留存率:


活躍留存率在20%上下浮動(dòng),同時(shí)在12月3日有稍大幅度的上升,由于用戶新增時(shí)期未知,活躍留存率維持在20%是不錯(cuò)的現(xiàn)象。

(2)變現(xiàn)——復(fù)購(gòu)分析

SELECT user_id,count(*) FROM taobaouser.user where behavetype='buy' group by user_id


復(fù)購(gòu)次數(shù)集中在1-5次,呈長(zhǎng)尾分布,該階段用戶消費(fèi)欲望不大。
(3)用戶消費(fèi)習(xí)慣分析
一天中各時(shí)段用戶行為分析:
使用切片器分別觀察每天用戶行為:
用戶瀏覽量峰值在晚上20-23點(diǎn);加購(gòu)率往往在早間6-7點(diǎn),晚間22-23點(diǎn)達(dá)到峰值;收藏率往往在早間5-7點(diǎn),下午16-18點(diǎn)達(dá)到峰值;夜間3-4點(diǎn)(消費(fèi)欲望),上午10-11點(diǎn),下午14-15點(diǎn),晚上20點(diǎn)22點(diǎn)為購(gòu)買(mǎi)轉(zhuǎn)化率峰值,其中10-11點(diǎn)轉(zhuǎn)化率最高。
網(wǎng)站可以利用這些時(shí)間點(diǎn)進(jìn)行營(yíng)銷活動(dòng)安排。
另外總體來(lái)看購(gòu)買(mǎi)轉(zhuǎn)化率更貼近于收藏率,可以適當(dāng)利用來(lái)進(jìn)行銷售量預(yù)測(cè)。
(4)用戶價(jià)值分析
借鑒RFM 模型,暫時(shí)不考慮M維度,對(duì)R(最近一次購(gòu)買(mǎi)時(shí)間)F(購(gòu)買(mǎi)頻率)進(jìn)行打分,完成用戶分層

select allrank.user_id,allrank.recent,allrank.buynum, concat(CASE WHEN allrank.r_r<=(6718)/4 THEN '4' WHEN allrank.r_r>(6718)/4 AND allrank.r_r<=(6718)/2 THEN '3'WHEN allrank.r_r>(6718)/2 AND allrank.r_r<=6718/4*3 THEN '2'ELSE '1' END,CASE WHEN allrank.f_r<=(7001)/4 THEN '4' WHEN allrank.f_r>(7001)/4 AND allrank.f_r<=(7001)/2 THEN '3'WHEN allrank.f_r>(7001)/2 AND allrank.f_r<=7001/4*3 THEN '2'ELSE '1' END)AS user_value from( select recent_value.user_id,recent_value.recent,rank()over(order by recent_value.recent) r_r, frequency_value.buynum,rank()over(order by frequency_value.buynum desc) f_r from (select user_id,datediff('2017-12-04',max(dates)) recent FROM taobaouser.user where behavetype='buy' group by user_id) as recent_value join (select user_id,count(user_id) buynum FROM taobaouser.user where behavetype='buy' group by user_id) as frequency_value on recent_value.user_id = frequency_value.user_id ) as allrank

3、商品銷售分析

(1)商品銷售分布

大部分銷售來(lái)源于銷售次數(shù)為1的16190個(gè)商品,說(shuō)明該時(shí)段銷售主要源于長(zhǎng)尾部分,而非銷售數(shù)量較高的暢銷品。

(2)暢銷品及其品類分析

SELECT category_id,item_id,cartbox,dense_rank() over (order by buy desc) r FROM taobaouser.onitem where buy<>0 limit 20

查看銷量top20的商品及品類分布:銷量為前3的商品為3122135,2964774,3237415,分屬1516409,1265358,3231625類

查看瀏覽top20的商品及品類分布:瀏覽量為前3的商品為812879,138964,3845702,分屬4756105,3607361類

查看收藏top20的商品及品類分布:收藏量為前3的商品為2818406,2308741,3330337,分屬982926,4827153,4756105類

查看加購(gòu)商品top20及品類:加購(gòu)量為前3的商品為1535294,2331370,3031354,分屬3848953,3607361,2735466類

通過(guò)分析銷量高的品類的商品銷量都不低,建議通過(guò)調(diào)研等方式推出細(xì)分市場(chǎng)的商品類型,并跟進(jìn)后續(xù)數(shù)據(jù)。

(3)商品購(gòu)買(mǎi)轉(zhuǎn)化率

SELECT item_id,category_id,pv,buy,concat(round(buy/pv*100,2),'%') conversion FROM taobaouser.onitem order by conversion desc limit 200


對(duì)于商品瀏覽量高,而轉(zhuǎn)化率非常低的,建議商家對(duì)商品購(gòu)買(mǎi)流程使用轉(zhuǎn)化漏斗進(jìn)行分析并進(jìn)行改善。

四、總結(jié)

1、關(guān)于平臺(tái)流量與轉(zhuǎn)化率:
  • 整體來(lái)看從瀏覽到有購(gòu)買(mǎi)意愿有6.5%的轉(zhuǎn)化率,從有購(gòu)買(mǎi)意愿到有購(gòu)買(mǎi)行為有28%的轉(zhuǎn)化率,說(shuō)明大多數(shù)用戶以瀏覽頁(yè)面為主而購(gòu)買(mǎi)轉(zhuǎn)化較少,低購(gòu)買(mǎi)意愿轉(zhuǎn)化率可能與剛完成的雙11大促有關(guān)。從9天的趨勢(shì)來(lái)看,前7天轉(zhuǎn)化率處于穩(wěn)步上升階段,說(shuō)明雙11之后的消費(fèi)情況在回升,進(jìn)入12月之后,瀏覽量有稍大幅度的提升,加購(gòu)轉(zhuǎn)化率有小幅提升,購(gòu)買(mǎi)轉(zhuǎn)化率大幅下降。是否需要提高轉(zhuǎn)化率,可以對(duì)比去年同時(shí)段轉(zhuǎn)化率情況,使用使用營(yíng)收目標(biāo)判斷轉(zhuǎn)化率是否達(dá)到目標(biāo)。
    提高加購(gòu)轉(zhuǎn)化率的建議:
    ——優(yōu)化搜索引擎,利用用戶畫(huà)像優(yōu)化商品匹配;
    ——優(yōu)化商品界面加購(gòu)與收藏按鍵布局,以便用戶觸達(dá)。
2、關(guān)于網(wǎng)站用戶粘性以及用戶消費(fèi)習(xí)慣
  • 網(wǎng)站留存較為穩(wěn)定,把9天中第一次登錄視為用戶新增的話,留存率在60%左右,活躍留存率也能達(dá)到20%,并且營(yíng)銷活動(dòng)帶來(lái)的用戶喚醒效果也很明顯。
    提高用戶留存建議:
    ——分析流失用戶特征,進(jìn)行用戶流失預(yù)測(cè),結(jié)合用戶畫(huà)像,通過(guò)各種活動(dòng)進(jìn)行用戶喚醒。
  • 對(duì)于用戶復(fù)購(gòu)情況,9天內(nèi)網(wǎng)站有復(fù)購(gòu)現(xiàn)象的用戶數(shù)接近60%,但是總體上約30%的用戶產(chǎn)生了80%的消費(fèi)次數(shù),復(fù)購(gòu)次數(shù)多的用戶偏少,可能與雙11剛結(jié)束,雙12未開(kāi)始的特殊時(shí)段有關(guān),建議拉長(zhǎng)分析區(qū)間分析復(fù)購(gòu)情況。
    -——提高復(fù)購(gòu)率的建議:開(kāi)展?fàn)I銷活動(dòng),比如淘寶的達(dá)成金主的條件限制,鼓勵(lì)用戶復(fù)購(gòu)。
  • 對(duì)于用戶消費(fèi)習(xí)慣的分析,通過(guò)了解用戶消費(fèi)的集中時(shí)段集中實(shí)施各種營(yíng)銷活動(dòng),提高投入產(chǎn)出比。
3、關(guān)于商品銷售情況
  • 分析發(fā)現(xiàn)商品售賣(mài)主要依靠長(zhǎng)尾商品的累積效應(yīng),而非爆款商品的帶動(dòng),這也是雙11之后用戶的補(bǔ)充采買(mǎi)的特征,同時(shí)發(fā)現(xiàn)此時(shí)用戶購(gòu)買(mǎi)的品類以及商品的瀏覽量很低,用戶的個(gè)人喜好特征表現(xiàn)明顯,同時(shí)瀏覽量高的商品購(gòu)買(mǎi)轉(zhuǎn)化率低。
    -——針對(duì)瀏覽量高而購(gòu)買(mǎi)轉(zhuǎn)化率低的商品,建議商家改善商品頁(yè)面,詳情頁(yè)以及評(píng)論區(qū)管理。

一起學(xué)習(xí),共同進(jìn)步,歡迎大家評(píng)論!

總結(jié)

以上是生活随笔為你收集整理的用户行为分析案例——天池数据集User Behavior Data from Taobao的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。