日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python excel数据分析实战_一次完整的数据分析实战!仅用4步,效率吊打Excel和Python...

發布時間:2023/12/15 python 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python excel数据分析实战_一次完整的数据分析实战!仅用4步,效率吊打Excel和Python... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

我最近發現很多人都走進了這樣一個誤區:覺得業務數據分析是專業的數據分析崗位的人才需要做的事情,業務人員只需要給他們提需求就可以了。

但實際上業務人員一點數據分析都不會就是只會打仗,不會算賬,缺乏了統籌決策的必備能力。因此一個優秀的業務人員是需要一定的數據分析的能力的,不需要多精通,但起碼要懂基礎的內容。

那么問題來了:做數據分析需要什么工具,不想再用容易卡死的Excel了!

Excel其實很強大的,但一般人充其量只會用其5%的功能,況且它還有這些致命缺點:數據安全性較低,跨平臺性較低,數據量小....python就算了,看著簡單,但做數據分析不是很適合。

要不,就用專業的報表工具或者BI工具來做dashboard,給大家推薦FineBI這款敏捷數據分析工具,好處就在于用起來簡單,數據透視、圖表制作這些功能封裝好的。

整個過程就是連數據,設計模板,web展示。圖表是內設好的或者開發對接Hcharts/Echarts/D3圖標庫,一般內置的圖表以及夠用了,解決分析問題才是主要的。

今天就通過FineBI來帶大家做一個簡單的藥品銷售情況數據分析,幫助大家了解數據分析的基本流程。假設以朝陽醫院2018年銷售數據為例,目的是了解朝陽醫院在2018年里的銷售情況,這就需要知道幾個業務指標,例如:月均消費次數,月均消費金額、客單價以及消費趨勢。

數據分析基本過程

數據分析基本過程包括:導入數據、數據清洗、數據處理、數據可視化以及消費趨勢分析。

一、導入數據

原表數據是excel形式的表格,但對于企業來說,需要分析的數據動輒上百萬,excel無法帶動,所以我們導入到FineBI中。點擊主頁的創建即可直接導入excel數據表。

二、數據清洗

因為一般數據集都會存在臟數據,比如數據出現負值、或者存在缺失值等,所以我們要對數據進行清洗。

1、選擇子集。企業日常的數據量非常龐大,各種數據指標也很多,但并不是每一列都有價值都需要分析,所以就需要從數據表中選擇需要分析的子集來進行分析,這樣能從數據中獲取最大價值。

通過添加自助數據集,選擇剛剛導入的excel數據表就可以選擇子集想要處理的數據子集,在本次案例列數較少,我直接選擇了全部。

2、不規范數據處理由于存在缺失值和負值,要把這些不規范的數據篩除才能夠保證分析出來的結果是準確無誤的。在自助數據集中,添加過濾功能,我們將所有數值型的數據都設置為大于0且其他數據列非空,這樣系統就會自動篩除負數行和空值行

除了缺失值、負值等不規范的值,導入進來的業務數據有時候也會出現數據類型不匹配的情況,比如時間列是數值格式而不是時間格式,但是本次分析沒有這一情況就不做處理。

三、數據處理

1、業務指標計算

由于原始數據表中都是一些基礎的數據,我們需要對這些數據進行簡單的處理才能使其發揮出更大的價值。首先通過FineBI對這些數據進行分組求和,以便計算后面的指標。

(1)業務月均指標月均消費次數 = 總消費次數 / 月份數(同一天內,同一個人所有消費算作一次消費)

月均消費金額 = 總消費金額 / 月份數

(2)客單價客單價 = 總消費金額 / 總消費次數

四、數據可視化

通過密密麻麻的數據是很難直接看出數據變化情況的,只有將數據可視化了才能最直觀地了解到數據的變化趨勢。在FineBI中建立儀表板組件就可以進行實現數據可視化。

1、每日消費趨勢

將購買時間拖入橫軸,選擇年月日,實收金額拖入縱軸,就可以顯示出藥品銷售數據的日變化情況。

從結果可以看出,每天消費總額差異較大,除了個別天出現比較大筆的消費,大部分人消費情況維持在1000-2000元以內。

2、每月的消費金額

接下來,再查看一下每月的消費金額變化趨勢同樣將購買時間拖入橫軸,但是時間選擇年月,實收金額拖至縱軸。可以看出月份之間的也存在較大的波動。由于7月份數據不完整,不作分析。2.3月份的數據驟降,需要重點關注,分析原因,以防再次出現類似的銷售額走低現象。

3、各藥品銷售情況

將商品名稱拖入橫軸,實收金額拖入縱軸,可以發現不同藥品之間的銷售額差距顯著。

除了查看總體情況,還可以對可視化數據進行過濾,比如對實收金額進行過濾,選擇最大的10個,就可以得到銷售額排名前10的藥品,同理也可得排名倒數的藥品。根據可視化結果,可以對排名前列和倒數的藥品銷售數據進行具體分析,了解原因,幫助提高末位藥品的銷售額。

如果覺得柱狀圖單調,最近大火的詞云也是一個不錯的選擇,通過詞云顯示結果,我們也能發現開博通的銷售額一騎絕塵,其次是絡活喜、安內真、代文等藥品。

以上就是一個簡單的藥品銷售情況分析過程了。由于數據較為簡單,本次只是做了一些非常基礎的分析,主要是幫助大家了解數據分析的全過程,下一次教大家做一個復雜的數據分析。

總結

以上是生活随笔為你收集整理的python excel数据分析实战_一次完整的数据分析实战!仅用4步,效率吊打Excel和Python...的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。