写csv文件_机器学习Python实践——数据导入(CSV)
一,CSV
逗號分隔值(逗號分隔值,CSV,有時也稱為字符分隔值,因為分隔字符也可以不是逗號),其文件以純文本形式存儲表格數據(數字和文本)。字幕:純意味著該文件的英文一個字符序列,不含必須像二進制數字那樣被解讀的數據。CSV文件由任意數目的記錄組成,記錄間以某種換行符分隔;每條記錄由字段組成,字段間的分隔符是其它字符或字符串,最常見的的英文逗號或制表符。通常,所有記錄都有完全相同的字段序列。通常都是純文本文件。建議使用WORDPAD或是記事本(注)來開啟,再則先另存新檔后用EXCEL開啟,也是方法之一。
CSV文件格式的通用標準并不存在,但是在RFC 4180中有基礎性的描述。的使用字符編碼同樣沒有被指定,但是7位ASCII是最基本的通用編碼。
CSV其實就是文本文件,而并不是表格;
csv和.xls的區別在于,.xls的只能用Excel中打開,而且,XLS和CSV的編碼格式也不一樣,簡單來說,CSV可以用文本(TXT)打開也可以用EXCLE打開,而XLS只能用擅長打開
最后,如何在CSV與XLS之間抉擇呢?這里我們要弄清楚幾個問題,CSV只是單純的文本文件,同樣的,也只是單純的以文本格式存儲,CSV無法生成公式,依賴,也無法保存公式,依賴!所以,如果單純的只是存儲文本格式的數據,可以直接選擇使用CSV文件,讀寫方便,易于實現,數據可以表格化展示,這就是優點!
注意:CSV文件可以通過改變文件后綴名或者通過練成工具強制轉換成的的.xls文件,但是要注意亂碼問題。
二,CSV文件讀和寫
1)通過標準的Python中的庫導入CSV文件
CSV,用來處理CSV文件。
這個類庫中的閱讀器()函數用來讀入CSV文件。當CSV文件被讀入后,可以利用這些數據生成一個numpy的數組,用來訓練算法模型。
2)采用numpy的導入CSV文件
可以使用Munpy的loadtxt()函數導入數據。使用這個函數處理的數據沒有文件頭,并且所有的數據結構都是一樣的,也就是說,數據類型都是一樣的。
#!/usr/bin/python3import numpy as np filename='pima_data.csv' with open(filename,'rt') as raw_data:data=loadtxt(raw_data,delimiter=',')print(data.shape)(3)采用Pandas導入CSV文件 - 機器學習項目中常用來做數據清洗與數據準備工作。推薦使用。
使用熊貓來導入文件需要使用pandas.read_csv()函數。這個函數的返回值是數據幀,可以很方便地進行下一步的處理。
#!/usr/bin/python3from pandas import read_csv filename='iris.data.csv' names=['separ-length','separ-width','petal-length','petal-width','class'] dataset=read_csv(filename,names=names) print(dataset.shape)參考:
https://blog.csdn.net/u012325865/article/details/81670555?blog.csdn.net 超強干貨來襲 云風專訪:近40年碼齡,通宵達旦的技術人生總結
以上是生活随笔為你收集整理的写csv文件_机器学习Python实践——数据导入(CSV)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: undertale人物_「underta
- 下一篇: python中case的用法_pytho