日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

Python 大数据分析 淘宝商品销量的关系

發布時間:2025/3/11 python 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python 大数据分析 淘宝商品销量的关系 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

我們在上一篇的時候已經將淘寶數據爬取下來了,但是并沒有做數據分析。所以今天這篇文章就是教大家如何去分析數據,得出一些有用的結論!

Python語言相比其他語言的優勢在哪里?豬哥認為是數據分析和人工智能這兩大塊,而且這兩個方向需求會慢慢增大,所以那些想學習Python卻不知道要朝著哪個目標學習的同學可以考慮往這兩個方向發展!

?

一、分析目標

數據分析之前我們需要清楚的知道自己想要分析什么東西,也就是先搞清楚我們的目標。在公司可能是公司財報、用戶增量變化、產品受歡迎程度、一些報表等等。

那我們今天的目標有哪些呢?我們來看看:

  • 分析避孕套標題高頻關鍵字
  • 分析避孕套標題高頻關鍵字 與 商品數量關系
  • 分析避孕套標題高頻關鍵字 與 平均銷量關系
  • 分析避孕套標題高頻關鍵字 與 平均售價關系
  • 分析避孕套商品價格區間分布關系
  • 分析避孕套商品銷量區間分布關系
  • 分析避孕套商品價格區間 與 平均銷量關系
  • 分析避孕套商家數量全國分布關系
  • 分析避孕套商家全國平均銷量關系
  • 注意:以上數據分析全部基于上次爬取的2500款淘寶商品(默認排序),并不代表淘寶所有避孕套商品!

    ?

    二、分析實現

    有了明確的目標之后,我們就要開始技術選型。

    首先數據處理的庫這個很好確定,基本就是numpy和pandas這兩個必備的庫,所以大家首先確保已經安裝了這兩個庫。

    然后數據可視化庫呢?這么多可視化庫該怎么選?如果你不知道怎么選,那豬哥給你推薦:pyecharts 這個由中國人開發的可視化庫,想要什么類型的圖在下面文檔里面找就行。

    中文文檔:https://pyecharts.org/#/zh-cn/intro 源碼地址:https://github.com/pyecharts/pyecharts

    最后技術選型完畢,我們就可以開始正式的敲代碼分析了。(分析的標題將和上面的分析目標一一對應)

    ?

    0.數據清洗

    在我們數據分析之前,我們需要對數據進行清洗。因為從淘寶爬取下來的數據并不是標準的數據,比如:商品銷量,爬取下來的數據是:2.5萬+人付款,我們需要將它轉為:25000(整型),這樣才方面后面的處理!

    我們先來看看從淘寶爬取的原始數據,看看那些數據需要清洗

    ?

    根據使用庫的經驗豬哥認為有兩列數據需要清洗:1、銷量轉成整型 2、地區轉成只包含省份,具體如何清洗我們直接看代碼吧!

    ?

    大家可以看到最后豬哥又從新生成了一個excel文件,目的就是不去污染原始數據,因為原始數據非常重要,所以我們在以后的數據處理中要盡量保存好原始數據,多備份幾個都不多余!

    ?

    1.分析避孕套標題高頻關鍵字

    數據清洗完畢之后,我們就可以開始分析了。

    分析標題高頻關鍵字這都是老生常談的一個流程,也就是使用jieba分詞,然后統計詞頻,最后生成一個詞云圖,我相信經??簇i哥公眾號的同學看都看膩了吧,這種小功能閉著眼睛都會了。

    ?

    十幾行代碼就搞定了,我們來看看效果圖吧

    ?

    分析結論:

  • 從整體看商家取名偏愛情趣二字
  • 從材質看尿酸的最多
  • 從功能看顆粒、螺紋的較多
  • ps:別問豬哥最中意哪個詞,問就是延時。

    ?

    2.分析避孕套標題高頻關鍵字 與 商品數量關系

    上面我們只看到大概哪些功能受歡迎,如果需要看具體的數據怎么辦呢?

    我們就來統計一下包含這些高頻關鍵詞的商品數據數量吧,代碼講解在圖片下方,下同!

    ?

    我們取最高頻的20個關鍵字,然后遍歷所有數據的標題中是否包含其中關鍵字,如果包含則該關鍵字的value就+1。來看看生成的柱狀圖效果吧!

    ?

    分析結論:

  • 包含情趣二字的商品有1150款,占到總數(2500款+)的46%。
  • 前三甲是:情趣、尿酸、顆粒
  • ps:豬哥有個疑問想請教各位老司機:這個 免洗 是咋玩的?

    ?

    3.分析避孕套標題高頻關鍵字 與 平均銷量關系

    這個分析有意思了,就相當于用戶更喜歡哪種功能或者材質的套套。

    ?

    ?

    高頻關鍵字與平均銷量分析數據的實現方法是,同樣遍歷所有數據的標題,如果包含某個關鍵字,則把該項數據的銷量放在關鍵字的value中(一個list),統計完后再對每個關鍵字的value進行求平均值,最后再根據平均銷量排序。來看看效果吧!

    ?

    分析結論:

  • 螺紋功能平均銷量最高,大家的最愛
  • 功能平均銷量前三分別是:螺紋、顆粒、狼牙
  • 小號竟然上榜,哈哈
  • ps:有很多同學問:為什么不是超薄?超薄自己是爽了,可女朋友呢?

    ?

    4.分析避孕套標題高頻關鍵字 與 平均售價關系

    分析完大家喜歡的功能,再來分析下這些功能的價格如何?哪些功能的避孕套比較貴呢?

    ?

    ?

    高頻關鍵字 與 平均售價關系分析原理與上面是相似的,使用的同一個方法,只不過是將原來的銷量換成價格,來看看效果圖吧!

    ?

    分析結論:

  • 可以看到前排幾個基本都是關于材質的
  • 凝膠、透明質、免洗這三項均價最貴,超過100大洋
  • ps:類似凝膠、透明質、免洗的哪位老司機用過,和一般的有啥區別?

    ?

    5.分析避孕套商品價格區間分布關系

    商品的標題和功能差不多分析完了,我們來分析下價格吧!

    ?

    ?

    豬哥人為的對價格進行了劃分,一共分為:’0-20’, ‘21-40’, ‘41-60’, ‘61-80’, ‘81-100’, ‘101-120’, ‘121-150’, ‘151-200’, ‘200以上’這9個區間,然后對數據切割、統計、排序,最后分別生成柱狀圖和餅圖。

    ?

    ?

    分析結論:

  • 價格區間在21-40的商品最多為778款,大約占比31%。
  • 價格在一百以內與超過一百的商品比大概為7:1
  • ps:沒想到還有這么多超過100塊的,我想問下200塊價格的套套是啥感覺?

    ?

    6.分析避孕套商品銷量區間分布關系

    分析完價格當然是分析銷量區間了

    ?

    ?

    銷量區間分布分析實現原理:認為為銷量分區,大概分為:’一千以內’, ‘一千到五千’, ‘五千到一萬’, ‘一萬到五萬’, ‘五萬到十萬’, ‘十萬以上’,這六個區間,然后同上方法進行統計、排序最后可視化。

    ?

    ?

    分析結論:

  • 銷量在1000以內的最多,大概占比90%
  • 銷量過萬的一共也才10款,說明爆款真的很少
  • 有一款套套銷量竟然超過10萬
  • ?

    7.分析避孕套商品價格區間 與 平均銷量關系

    假如你是一個避孕套賣家,新推出一款避孕套,你想知道價格定為多少銷量才會比較高呢?

    這時候我們就可以通過分析價格與商品的銷量關系,用實際的數據來定價,這也正是數據分析的價值之一。

    商品價格區間 與 平均銷量關系分析實現原理是:使用pandas自動分區將價格劃分為12個分區,然后對銷量數據分組、求平均值,來看看可視化之后的效果。

    分析結論:

  • 定價在31.9-39這個區間平均銷量最高,為893
  • 定價在10元以內的銷量竟然高居第二
  • ps:誰用過10以內一盒的套套,出來走走

    ?

    8.分析避孕套商家數量全國分布關系

    標題、價格、銷量都分析過了,最后我們還分析下商家位置的數據。

    分析的目標是統計全國各省避孕套商家數量,然后做成熱力圖和柱狀圖。

    統計商家數量還是比較簡單,因為我們之前在數據清洗的時候已經只保留了省份數據,所以直接value_counts()就可以得到想要的數據,看看效果如何!

    分析結論:

  • 避孕套商家前三甲:廣東、上海、浙江
  • ps:貴州四周都有賣套套的,為何就它沒有?難道和地理有關?

    ?

    9.分析避孕套商家全國平均銷量關系

    分析完商家數后,我們來看看各省的平均銷量吧。

    商家全國平均銷量關系分析實現原理:我們新創建一個透視表并對銷量求平均值,然后再排序,最后生成熱力圖和柱狀圖。

    分析結論:

  • 出乎意料的是山西39個商家平均銷量竟然是第一為1535。
  • ps:為何山西平均銷量是第一?原因是啥真想不通

    ?

    三、總結

    通過上面的數據分析,我們得到了一些有趣的結論:

  • 用戶偏愛螺紋、顆粒、狼牙等功能
  • 凝膠、透明質、免洗這三項均價最貴,超過100大洋
  • 價格區間在21-40的商品最多為778款,大約占比31%
  • 銷量在1000以內的最多,大概占比90%
  • 定價在31.9-39這個區間平均銷量最高,為893
  • 避孕套商家數量前三甲:廣東、上海、浙江
  • 山西省平均銷量最高為山西
  • 通過上述分析結果,如果豬哥作為一個避孕套商家,想要推出一款產品,設置標題帶螺紋、顆粒、狼牙,價格設置在31.9-39元,這樣可能會更暢銷一些。

    數據分析作為一把利刃,能讓你看見別人看不見的事物,如果使用得當完全可以作為你創業的一個重要支點!

    最后豬哥再送你一句忠告:想學數據分析,一定要學好pandas!

    項目源碼:? ?https://cloud.tencent.com/developer/article/1515930

    創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎

    總結

    以上是生活随笔為你收集整理的Python 大数据分析 淘宝商品销量的关系的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: a在线免费观看 | 色婷婷综合成人av | 久久久三级视频 | 日本a级片在线播放 | 亚洲综合免费观看高清完整版在线 | 丰满少妇高潮久久三区 | 国内外成人在线视频 | 三上悠亚中文字幕在线播放 | 久草视频在线免费看 | 色网站在线看 | 粉嫩小箩莉奶水四溅在线观看 | 午夜私人福利 | 国产成人久久精品麻豆二区 | chien国产乱露脸对白 | 色网站免费观看 | 亚洲欧美日韩网站 | 国产日本欧美在线观看 | 国产欧美一区二区三区精品酒店 | 樱井莉亚av| 久久久久久久久精 | 91直接进入 | 国产v片在线观看 | 国产一区自拍视频 | 伊人视频在线观看 | 性欧美丰满熟妇xxxx性仙踪林 | 国内爆初菊对白视频 | 亚洲一区二区三区在线播放 | 日皮视频在线观看 | 中文字幕123区 | 91热在线| 黄色www | 韩国裸体网站 | 午夜av一区二区三区 | 欧美性猛交一区二区三区精品 | 国产东北女人做受av | 欧美高清在线一区 | 成年人免费网 | 亚洲两性视频 | av先锋在线 | 就要操就要射 | 岛国精品一区二区三区 | 91美女片黄 | 7777在线视频 | 日韩中文字幕在线观看 | 夜夜艹天天干 | 奇米影视一区二区三区 | 国产精品国色综合久久 | 性色福利| 精品国产免费无码久久久 | 美女网站免费视频 | 国内自拍2020 | 亚洲在线看片 | 女女调教被c哭捆绑喷水百合 | 国产一区二区网 | 国产1区二区 | 国产色在线 | 影音先锋黑人 | 国产 xxxx| 超碰在线免费播放 | 91看大片 | av中文字幕免费在线观看 | 日本在线视频中文字幕 | 狠狠爱五月婷婷 | 日韩免费在线观看 | 亚洲天堂一级 | 亚洲精品一区三区三区在线观看 | 亚洲一区二区三区四区在线观看 | 交专区videossex非洲 | 亚洲色中色 | 少女国产免费观看 | 1024香蕉视频 | 成人国产av一区二区三区 | 精品久久久久久久久久岛国gif | 91欧美一区二区三区 | 夫妻露脸自拍[30p] | 国产在线观看h | 大奶av | 欧美黄色小说 | 精品无码av一区二区三区不卡 | 亚日韩欧美 | 国产av一区二区三区精品 | 疯狂揉花蒂控制高潮h | 欧美黄色a | 五月激情婷婷在线 | 亚洲一区精品视频在线观看 | 主播一区二区 | 一区二区三区啪啪啪 | 神宫寺奈绪一区二区三区 | 久久夜色精品国产欧美乱极品 | 亚州视频在线 | 亚洲狼人综合网 | 久在操 | 一区二区三区91 | av导航网址 | 亚洲人成网站999久久久综合 | 91好色先生 | 国产成人精品免费在线观看 | 欧美大色| 日韩一区中文字幕 |