excel处置4000行数据卡_懂Excel就能轻松入门Python数据分析包pandas(三):制作成绩条...
系列文章:
經(jīng)常聽(tīng)別人說(shuō) Python 在數(shù)據(jù)領(lǐng)域有多厲害,結(jié)果學(xué)了很長(zhǎng)時(shí)間,連數(shù)據(jù)處理都麻煩得要死。后來(lái)才發(fā)現(xiàn),原來(lái)不是 Python 數(shù)據(jù)處理厲害,而是他有數(shù)據(jù)分析神器—— pandas
前言
很多從未接觸 pandas 的小伙伴看到相關(guān)資料后,會(huì)覺(jué)得這玩意無(wú)法處理像 Excel 那樣格式復(fù)雜多變的數(shù)據(jù)。其實(shí) pandas 比起手動(dòng)操作、透視表操作甚至 Vba 操作,他可以更靈活快速處理復(fù)雜形狀的數(shù)據(jù)。
這次,我們來(lái)看看怎么用 pandas 一次生成各種形如工資條的格式數(shù)據(jù)。
案例
繼續(xù)沿用成績(jī)單數(shù)據(jù):
我們希望把每位學(xué)生的成績(jī)單獨(dú)列出來(lái),也就是一行記錄成為一個(gè)小表:
Excel 技巧
用 Excel 自帶功能可不可以批量完成這個(gè)工作呢?當(dāng)然可以,只不過(guò)需要許多技巧。但我總是說(shuō),思路比方法更重要,這是因?yàn)?#xff0c;如果你理解這 Excel 操作過(guò)程,同樣的思路就可以應(yīng)用在 pandas 中完成。
看看 Excel 是怎么完成此需求的,我們用10條記錄做演示:
添加輔助序列,每個(gè)數(shù)值相隔2(這是因?yàn)榻Y(jié)果數(shù)據(jù)每行相隔2行)
在輔助列下面,生成序列(結(jié)束值為上一步序列的尾數(shù))
使用 Excel 自帶的生成系列功能即可
批量添加標(biāo)題行
從3開始,每隔3行設(shè)置一標(biāo)題
去除重復(fù)的序列行
最后根據(jù)輔助列排序,即可得到結(jié)果
pandas 做法
pandas 中有多種實(shí)現(xiàn)方式,本節(jié)先介紹與上述 Excel 的解決思路基本一致的方式。如下:
修改行索引值,相當(dāng)于 Excel 的第一步
reindex 可以給予不存在的行索引值,此時(shí)那些行會(huì)變成空行
相當(dāng)于 Excel 中的第二與第四步
最后,把從索引3開始,每隔3行賦值列標(biāo)題即可
完整代碼如下:
最后
本文介紹的方式實(shí)際限制比較大,比如不能按任意維度劃分等,并且需要使用者對(duì) pandas 中的索引有深入理解。下次將介紹一種通用的方式,而且還可以在每個(gè)小表格中添加匯總行。
如果希望從零開始學(xué)習(xí) pandas ,那么可以看看我的 pandas 專欄。
總結(jié)
以上是生活随笔為你收集整理的excel处置4000行数据卡_懂Excel就能轻松入门Python数据分析包pandas(三):制作成绩条...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: db2 jdbc驱动参数_JDBC详细整
- 下一篇: python property作用_py