用户行为分析案例——天池数据集User Behavior Data from Taobao
用戶行為分析過(guò)程
- 說(shuō)明
- 一、數(shù)據(jù)集與分析目的
- 1、數(shù)據(jù)集
- 2、分析目的
- 二、數(shù)據(jù)處理
- 1、數(shù)據(jù)預(yù)覽
- 2、數(shù)據(jù)處理
- 三、數(shù)據(jù)提取與分析
- 1、網(wǎng)站流量分析
- 2、用戶分析
- 3、商品銷售分析
- 四、總結(jié)
- 1、關(guān)于平臺(tái)流量與轉(zhuǎn)化率:
- 2、關(guān)于網(wǎng)站用戶粘性以及用戶消費(fèi)習(xí)慣
- 3、關(guān)于商品銷售情況
說(shuō)明
本次數(shù)據(jù)分析基于阿里云天池?cái)?shù)據(jù)集(用戶行為數(shù)據(jù)集),使用轉(zhuǎn)化漏斗,AARRR模型,對(duì)常見(jiàn)電商分析指標(biāo),包括轉(zhuǎn)化率,PV,UV,留存率,復(fù)購(gòu)率等進(jìn)行分析,分析過(guò)程中使用MySQL以及Navicat進(jìn)行數(shù)據(jù)預(yù)覽與清洗處理,使用Excel進(jìn)行數(shù)據(jù)可視化。
一、數(shù)據(jù)集與分析目的
1、數(shù)據(jù)集
| user_id | 整數(shù)類型,序列化后的用戶ID |
| item_id | 整數(shù)類型,序列化后的商品ID |
| category_id | 整數(shù)類型,序列化后的商品所屬類目ID |
| behaviortype | 字符串,枚舉類型,包括(‘pv’, ‘buy’, ‘cart’, ‘fav’) |
| timestamps | 行為發(fā)生的時(shí)間戳 |
該數(shù)據(jù)集記錄用戶在淘寶網(wǎng)站瀏覽商品產(chǎn)生的行為信息。由于數(shù)據(jù)集過(guò)大 ,選取其中10200位用戶,共105萬(wàn)條數(shù)據(jù)。
2、分析目的
1)了解網(wǎng)站流量情況;
2)了解該階段網(wǎng)站用戶粘性以及用戶行為習(xí)慣;
3)了解網(wǎng)站商品銷售情況;
分析邏輯如下:
二、數(shù)據(jù)處理
1、數(shù)據(jù)預(yù)覽
MySQL建表,使用Navicat導(dǎo)入數(shù)據(jù)
use userbehavior; create table user( user_id int not null, item_id int not null, category_id int not null, behavetype varchar(10) not null, times int not null, constraint user_behave PRIMARY KEY (user_id,item_id,times))2、數(shù)據(jù)處理
(1)日期處理
將行為發(fā)生時(shí)間轉(zhuǎn)為datetime類型,獲取其發(fā)生日期及時(shí)間
(2)數(shù)據(jù)清洗
DELETE FROM user WHERE datentime < '2017-11-25 00:00:00' OR datentime > '2017-12-04 00:00:00';三、數(shù)據(jù)提取與分析
1、網(wǎng)站流量分析
- 創(chuàng)建用戶行為視圖
(1)用戶參與度(pv)分析
分析:11月25日至12月1日使用用戶數(shù)變化幅度小,范圍在7000到8000之間,從12月2日有較大幅度增加,對(duì)比11月25,26(周末)有較大的提升,可能是周末的雙12預(yù)熱營(yíng)銷活動(dòng)效果。
(2)網(wǎng)站購(gòu)買(mǎi)轉(zhuǎn)化率(uv)(支付轉(zhuǎn)化率=支付訪客數(shù)/總訪客數(shù))
select activeuser.dates,activeuser.ac,alluser.au,concat(round(activeuser.ac/alluser.au*100,2),'%') conversion from (SELECT dates,count(distinct user_id) ac FROM taobaouser.userbehave where buy<>0 group by dates) as activeuser join (SELECT dates,count(distinct user_id) au FROM taobaouser.userbehave group by dates) as alluser on activeuser.dates=alluser.dates
支付轉(zhuǎn)化率在11月30日取得最高值,之后呈大幅下降趨勢(shì)。
(3)轉(zhuǎn)化漏斗
獨(dú)立訪客轉(zhuǎn)化率能達(dá)到69.9%,但是從訪客行為來(lái)看,瀏覽到購(gòu)買(mǎi)轉(zhuǎn)化率只有2.3%,若要了解具體環(huán)節(jié)的轉(zhuǎn)化率,需要對(duì)整個(gè)流程接觸到的版面進(jìn)行細(xì)化的數(shù)據(jù)分析。
2、用戶分析
(數(shù)據(jù)有限,用戶新增及激活不做分析)
(1)留存
計(jì)算新增留存率與活躍留存率,視該時(shí)間段內(nèi)首次登陸為新增用戶,購(gòu)買(mǎi)為活躍用戶
新增活躍率:
將25日登陸用戶作為新增用戶來(lái)看,次日,3日留存率能達(dá)到60%以上,7日留存率達(dá)到了90%以上,用戶粘性很好,高新增留存率可能與處于雙十一促銷時(shí)段有關(guān),說(shuō)明產(chǎn)品新手引導(dǎo)性很好。
活躍留存率:
活躍留存率在20%上下浮動(dòng),同時(shí)在12月3日有稍大幅度的上升,由于用戶新增時(shí)期未知,活躍留存率維持在20%是不錯(cuò)的現(xiàn)象。
(2)變現(xiàn)——復(fù)購(gòu)分析
SELECT user_id,count(*) FROM taobaouser.user where behavetype='buy' group by user_id
復(fù)購(gòu)次數(shù)集中在1-5次,呈長(zhǎng)尾分布,該階段用戶消費(fèi)欲望不大。
(3)用戶消費(fèi)習(xí)慣分析
一天中各時(shí)段用戶行為分析:
使用切片器分別觀察每天用戶行為:
用戶瀏覽量峰值在晚上20-23點(diǎn);加購(gòu)率往往在早間6-7點(diǎn),晚間22-23點(diǎn)達(dá)到峰值;收藏率往往在早間5-7點(diǎn),下午16-18點(diǎn)達(dá)到峰值;夜間3-4點(diǎn)(消費(fèi)欲望),上午10-11點(diǎn),下午14-15點(diǎn),晚上20點(diǎn)22點(diǎn)為購(gòu)買(mǎi)轉(zhuǎn)化率峰值,其中10-11點(diǎn)轉(zhuǎn)化率最高。
網(wǎng)站可以利用這些時(shí)間點(diǎn)進(jìn)行營(yíng)銷活動(dòng)安排。
另外總體來(lái)看購(gòu)買(mǎi)轉(zhuǎn)化率更貼近于收藏率,可以適當(dāng)利用來(lái)進(jìn)行銷售量預(yù)測(cè)。
(4)用戶價(jià)值分析
借鑒RFM 模型,暫時(shí)不考慮M維度,對(duì)R(最近一次購(gòu)買(mǎi)時(shí)間)F(購(gòu)買(mǎi)頻率)進(jìn)行打分,完成用戶分層
3、商品銷售分析
(1)商品銷售分布
大部分銷售來(lái)源于銷售次數(shù)為1的16190個(gè)商品,說(shuō)明該時(shí)段銷售主要源于長(zhǎng)尾部分,而非銷售數(shù)量較高的暢銷品。
(2)暢銷品及其品類分析
SELECT category_id,item_id,cartbox,dense_rank() over (order by buy desc) r FROM taobaouser.onitem where buy<>0 limit 20查看銷量top20的商品及品類分布:銷量為前3的商品為3122135,2964774,3237415,分屬1516409,1265358,3231625類
查看瀏覽top20的商品及品類分布:瀏覽量為前3的商品為812879,138964,3845702,分屬4756105,3607361類
查看收藏top20的商品及品類分布:收藏量為前3的商品為2818406,2308741,3330337,分屬982926,4827153,4756105類
查看加購(gòu)商品top20及品類:加購(gòu)量為前3的商品為1535294,2331370,3031354,分屬3848953,3607361,2735466類
通過(guò)分析銷量高的品類的商品銷量都不低,建議通過(guò)調(diào)研等方式推出細(xì)分市場(chǎng)的商品類型,并跟進(jìn)后續(xù)數(shù)據(jù)。
(3)商品購(gòu)買(mǎi)轉(zhuǎn)化率
SELECT item_id,category_id,pv,buy,concat(round(buy/pv*100,2),'%') conversion FROM taobaouser.onitem order by conversion desc limit 200
對(duì)于商品瀏覽量高,而轉(zhuǎn)化率非常低的,建議商家對(duì)商品購(gòu)買(mǎi)流程使用轉(zhuǎn)化漏斗進(jìn)行分析并進(jìn)行改善。
四、總結(jié)
1、關(guān)于平臺(tái)流量與轉(zhuǎn)化率:
- 整體來(lái)看從瀏覽到有購(gòu)買(mǎi)意愿有6.5%的轉(zhuǎn)化率,從有購(gòu)買(mǎi)意愿到有購(gòu)買(mǎi)行為有28%的轉(zhuǎn)化率,說(shuō)明大多數(shù)用戶以瀏覽頁(yè)面為主而購(gòu)買(mǎi)轉(zhuǎn)化較少,低購(gòu)買(mǎi)意愿轉(zhuǎn)化率可能與剛完成的雙11大促有關(guān)。從9天的趨勢(shì)來(lái)看,前7天轉(zhuǎn)化率處于穩(wěn)步上升階段,說(shuō)明雙11之后的消費(fèi)情況在回升,進(jìn)入12月之后,瀏覽量有稍大幅度的提升,加購(gòu)轉(zhuǎn)化率有小幅提升,購(gòu)買(mǎi)轉(zhuǎn)化率大幅下降。是否需要提高轉(zhuǎn)化率,可以對(duì)比去年同時(shí)段轉(zhuǎn)化率情況,使用使用營(yíng)收目標(biāo)判斷轉(zhuǎn)化率是否達(dá)到目標(biāo)。
提高加購(gòu)轉(zhuǎn)化率的建議:
——優(yōu)化搜索引擎,利用用戶畫(huà)像優(yōu)化商品匹配;
——優(yōu)化商品界面加購(gòu)與收藏按鍵布局,以便用戶觸達(dá)。
2、關(guān)于網(wǎng)站用戶粘性以及用戶消費(fèi)習(xí)慣
- 網(wǎng)站留存較為穩(wěn)定,把9天中第一次登錄視為用戶新增的話,留存率在60%左右,活躍留存率也能達(dá)到20%,并且營(yíng)銷活動(dòng)帶來(lái)的用戶喚醒效果也很明顯。
提高用戶留存建議:
——分析流失用戶特征,進(jìn)行用戶流失預(yù)測(cè),結(jié)合用戶畫(huà)像,通過(guò)各種活動(dòng)進(jìn)行用戶喚醒。 - 對(duì)于用戶復(fù)購(gòu)情況,9天內(nèi)網(wǎng)站有復(fù)購(gòu)現(xiàn)象的用戶數(shù)接近60%,但是總體上約30%的用戶產(chǎn)生了80%的消費(fèi)次數(shù),復(fù)購(gòu)次數(shù)多的用戶偏少,可能與雙11剛結(jié)束,雙12未開(kāi)始的特殊時(shí)段有關(guān),建議拉長(zhǎng)分析區(qū)間分析復(fù)購(gòu)情況。
-——提高復(fù)購(gòu)率的建議:開(kāi)展?fàn)I銷活動(dòng),比如淘寶的達(dá)成金主的條件限制,鼓勵(lì)用戶復(fù)購(gòu)。 - 對(duì)于用戶消費(fèi)習(xí)慣的分析,通過(guò)了解用戶消費(fèi)的集中時(shí)段集中實(shí)施各種營(yíng)銷活動(dòng),提高投入產(chǎn)出比。
3、關(guān)于商品銷售情況
- 分析發(fā)現(xiàn)商品售賣(mài)主要依靠長(zhǎng)尾商品的累積效應(yīng),而非爆款商品的帶動(dòng),這也是雙11之后用戶的補(bǔ)充采買(mǎi)的特征,同時(shí)發(fā)現(xiàn)此時(shí)用戶購(gòu)買(mǎi)的品類以及商品的瀏覽量很低,用戶的個(gè)人喜好特征表現(xiàn)明顯,同時(shí)瀏覽量高的商品購(gòu)買(mǎi)轉(zhuǎn)化率低。
-——針對(duì)瀏覽量高而購(gòu)買(mǎi)轉(zhuǎn)化率低的商品,建議商家改善商品頁(yè)面,詳情頁(yè)以及評(píng)論區(qū)管理。
一起學(xué)習(xí),共同進(jìn)步,歡迎大家評(píng)論!
總結(jié)
以上是生活随笔為你收集整理的用户行为分析案例——天池数据集User Behavior Data from Taobao的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: SkinFiner(人像磨皮软件)官方中
- 下一篇: 人教版初中信息技术电子课本_电子课本|2