PandasGUI:使用图形用户界面分析 Pandas 数据帧
數據預處理是數據科學管道的重要組成部分,需要找出數據中的各種不規則性,操作您的特征等。Pandas 是我們經常使用的一種工具,用于處理數據,還有 seaborn 和 matplotlib用于數據可視化。PandasGUI 是一個庫,通過提供可用于制作
安裝 PandasGUI
使用pip 命令像安裝任何其他 python 庫一樣安裝 PandasGUI。相同的命令是:
pip?install?pandasgui要在 PandasGUI 中讀取 文件,我們需要使用show()函數。讓我們從將它與 pandas 一起導入開始。數據集是titanic
import?pandas?as?pd from?pandasgui?import?show from?pandasgui.datasets?import?titanic show(titanic)這是我們的數據框,我們可以滾動查看數據。可以看到表示 NaN 值的空單元格。可以通過單擊單元格并編輯其值來編輯數據。只需單擊特定列即可根據特定列對數據框進行排序。在下圖中,我們可以通過單擊fare列對數據框進行排序。
PandasGUI 中的過濾器
假設我們想查看 MSSubClass 的值大于或等于 120 的行。在 Pandas 中,我們可以使用以下命令:
titanic[titanic['age']?>=?20]PandasGUI 為我們提供了過濾器,可以在其中編寫查詢表達式來過濾數據。上述查詢表達式將是:
Pandas GUI 中的統計信息
匯總統計數據為您提供了數據分布的概覽。在pandas中,我們使用describe()方法來獲取數據的統計信息。
titanic.describe()在 PandasGUI 中,可以轉到統計部分并獲取每列的統計信息。
PandasGUI 中的數據可視化
數據可視化通常不是 Pandas 的用途,我們使用 matplotlib、seaborn、plotly 等庫。但 PandasGUI 在 Grapher 部分下提供了使用 plotly 繪制的交互式圖形。
我們通過將fare拖放到x下來創建fare的直方圖。
除了這些,還可以創建箱線圖、3d 散點圖、線圖等。如果您想快速概覽數據,從檢查匯總統計數據到繪制數據,PandasGUI 是一個很好的工具,可以輕松完成,無需代碼。
推薦閱讀
牛逼!Python常用數據類型的基本操作(長文系列第①篇)
牛逼!Python的判斷、循環和各種表達式(長文系列第②篇)
牛逼!Python函數和文件操作(長文系列第③篇)
牛逼!Python錯誤、異常和模塊(長文系列第④篇)
總結
以上是生活随笔為你收集整理的PandasGUI:使用图形用户界面分析 Pandas 数据帧的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 最真实的办公自动化案例!
- 下一篇: “阿里味” PUA 编程语言火上GitH