Pandas处理Excel文件源码学习
生活随笔
收集整理的這篇文章主要介紹了
Pandas处理Excel文件源码学习
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
pandas.read_excel
pandas.read_excel API
pandas.read_excel(io, sheet_name=0, header=0, names=None, index_col=None) 讀取Excel文件并轉化為DataFrame結構Parameters
默認將第0行設置為DataFrame的列標簽,也可指定任一行為列標簽;如果excel文件中沒有列標簽,則將其設置為None
默認用序列[0-n]作為DataFrame的行標簽
Example
新建一個temp.xlsx文件
pandas中,行列標簽不計入df的shape中
pandas.DataFrame.set_index
pandas.DataFrame.set_index API:
DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) 將已存在的列設置為DataFrame的行標簽Parameters
1. keys: label or array-like or list of labels/arrays 這個參數可以是單個列標簽、含有多個列標簽的列表、與DataFrame行數相同的一維Series數組、含有列標簽和Series數組的列表……2. drop: bool, default True 刪除原先的列,并將其作為新的行索引Example
import pandas as pd df = pd.DataFrame({'month': [1, 4, 7, 10],'year': [2012, 2014, 2013, 2014],'sale': [55, 40, 84, 31]}) dfmonth year sale 0 1 2012 55 1 4 2014 40 2 7 2013 84 3 10 2014 31 df.set_index('month')year sale month 1 2012 55 4 2014 40 7 2013 84 10 2014 31 df.set_index([pd.Index([1, 2, 3, 4]), 'year'])month saleyear 1 2012 1 55 2 2014 4 40 3 2013 7 84 4 2014 10 31numpy.sum()
numpy.sum() API
在某個axis上對numpy數組求和
a是求和對象
axis=0: 沿著行做垂直方向的運算,將Numpy數組壓縮成一行
axis=1: 沿著列做水平方向的運算,將Numpy數組壓縮成一列
閱讀文章: numpy.sum()的使用
pandas.DataFrame.stack
pandas.DataFrame.stack API
stack的意思是堆疊,堆積
DataFrame結構中,表格在行列方向上均有索引,而將DataFrame進行Stack后,只有列方向上的索引,這類似于層次化的Series結構。stack函數會將數據從表格結構變成花括號結構,即將其行索引變成列索引,反之,unstack函數將數據從花括號結構變成表格結構,即要將其中一層的列索引變成行索引。
閱讀文章:python pandas stack和unstack函數
但是將DataFrame進行stack的目的是什么?
總結
以上是生活随笔為你收集整理的Pandas处理Excel文件源码学习的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python的__str__()方法
- 下一篇: 为什么Servlet程序的init(Se