日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程语言 > python >内容正文

python

Python-csvkit:强大的CSV文件命令行工具

發(fā)布時(shí)間:2024/9/15 python 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python-csvkit:强大的CSV文件命令行工具 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

如果你在學(xué)Python數(shù)據(jù)處理,一定對(duì)CSV文件不陌生。日常本地?cái)?shù)據(jù)存儲(chǔ)中,除了Excel文件外,大部分?jǐn)?shù)據(jù)都是以CSV文件格式保存的。

CSV(Comma-Separated Values)是一種文本文件,也叫作逗號(hào)分隔值文件格式。顧名思義,它就是用來(lái)保存純文本,被分隔符分隔為多個(gè)字段。

CSV文件能夠被Excel、notepad++、Java、Python等各種軟件讀取,非常方便。

因?yàn)樗Y(jié)構(gòu)簡(jiǎn)單、易傳輸、易讀取的特性,使其廣受個(gè)人和商業(yè)領(lǐng)域歡迎。

在Python中,可以使用read函數(shù)、pandas庫(kù)、csv庫(kù)等讀寫CSV文件,而且這些也是常用的方法。

這次給大家介紹一個(gè)非常強(qiáng)大的第三方庫(kù)-csvkit,它是專門處理CSV文件的命令行工具,可以實(shí)現(xiàn)文件互轉(zhuǎn)、數(shù)據(jù)處理、數(shù)據(jù)統(tǒng)計(jì)等,十分便捷。

因?yàn)閏svkit是Python第三方庫(kù),我們直接使用pip來(lái)安裝csvkit。

pip install csvkit

csvkit是命令行工具,所以代碼都在命令行執(zhí)行,下面列舉一些常見的使用場(chǎng)景。

我們先在本地保存一個(gè)Excel表(DoubanMovie),其內(nèi)容是豆瓣電影數(shù)據(jù)。

注意命令行地址要切換到該表所在位置。

比如我放在E:\csvkit_tutorial\里面,可以用下面命令來(lái)切換。

E: cd?csvkit_tutorial

1、Excel轉(zhuǎn)CSV

csvkit支持將Excel等其他數(shù)據(jù)文件轉(zhuǎn)化為CSV文件,使用in2csv命令實(shí)現(xiàn)。

in2csv?DoubanMovie.xlsx?>?DoubanMovie.csv

除了Excel的xlsx和xls文件外,你還可以對(duì)下面多種數(shù)據(jù)格式進(jìn)行CSV的轉(zhuǎn)換

包括:dbf , fixed , geojson , json , ndjson

2、對(duì)SQL數(shù)據(jù)庫(kù)進(jìn)行讀寫和查詢操作

從MySQL數(shù)據(jù)庫(kù)中讀取一張表存到本地CSV文件中,使用csvsql命令實(shí)現(xiàn)。

csvsql?--db?"mysql://user:pass@host/database?charset=utf8"?--tables?"test1"?--insert?test1.csv

直接對(duì)MySQL數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)查詢,使用sql2csv命令實(shí)現(xiàn)

sql2csv?--db?"mysql://user:pass@host/database?charset=utf8"?--query?"select?*?from?test2"

注意代碼中--db參數(shù)后面需要輸入數(shù)據(jù)庫(kù)的信息,用于連接數(shù)據(jù)庫(kù)。

3、將CSV文件轉(zhuǎn)換為Json格式

除了將Json文件轉(zhuǎn)化為CSV格式外,csvkit也支持將CSV文件轉(zhuǎn)化為Json格式,使用csvjson命令實(shí)現(xiàn)。

csvjson?test.csv

如果你是做地理空間分析,還可以將csv文件轉(zhuǎn)化為GeoJson格式。

4、數(shù)據(jù)處理和分析

csvkit中還有用于數(shù)據(jù)處理分析的命令,如下:

  • csvcut:對(duì)數(shù)據(jù)進(jìn)行索引切片

  • csvgrep:對(duì)數(shù)據(jù)進(jìn)行過濾,可按照正則表達(dá)式規(guī)則

  • csvjoin:對(duì)不同數(shù)據(jù)表按鍵進(jìn)行連接

  • csvsort:對(duì)數(shù)據(jù)進(jìn)行排序

  • csvstack:將多個(gè)數(shù)據(jù)表進(jìn)行合并

  • csvlook:以 Markdown 兼容的固定寬度格式將 CSV 呈現(xiàn)到命令行

  • csvstat:對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單的統(tǒng)計(jì)分析

小結(jié)

csvkit適合那些經(jīng)常處理CSV文件的小伙伴,可快速的進(jìn)行轉(zhuǎn)化、清晰、分析等任務(wù)。特別當(dāng)你的文件較大,一般軟件難以打開時(shí),csvkit的速度絕對(duì)會(huì)讓你驚艷到。

學(xué)習(xí)文檔:https://csvkit.readthedocs.io/en/latest/index.html

END

各位伙伴們好,詹帥本帥搭建了一個(gè)個(gè)人博客和小程序,匯集各種干貨和資源,也方便大家閱讀,感興趣的小伙伴請(qǐng)移步小程序體驗(yàn)一下哦!(歡迎提建議)

推薦閱讀

牛逼!Python常用數(shù)據(jù)類型的基本操作(長(zhǎng)文系列第①篇)

牛逼!Python的判斷、循環(huán)和各種表達(dá)式(長(zhǎng)文系列第②篇)

牛逼!Python函數(shù)和文件操作(長(zhǎng)文系列第③篇)

牛逼!Python錯(cuò)誤、異常和模塊(長(zhǎng)文系列第④篇)

總結(jié)

以上是生活随笔為你收集整理的Python-csvkit:强大的CSV文件命令行工具的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。