當前位置：首頁 > 编程语言 > python >内容正文

python

写csv文件_机器学习Python实践——数据导入（CSV）

發布時間：2024/4/13 python 34 豆豆

生活随笔收集整理的這篇文章主要介紹了写csv文件_机器学习Python实践——数据导入（CSV）小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一，CSV

逗號分隔值（逗號分隔值，CSV，有時也稱為字符分隔值，因為分隔字符也可以不是逗號），其文件以純文本形式存儲表格數據（數字和文本）。字幕：純意味著該文件的英文一個字符序列，不含必須像二進制數字那樣被解讀的數據。CSV文件由任意數目的記錄組成，記錄間以某種換行符分隔;每條記錄由字段組成，字段間的分隔符是其它字符或字符串，最常見的的英文逗號或制表符。通常，所有記錄都有完全相同的字段序列。通常都是純文本文件。建議使用WORDPAD或是記事本（注）來開啟，再則先另存新檔后用EXCEL開啟，也是方法之一。

CSV文件格式的通用標準并不存在，但是在RFC 4180中有基礎性的描述。的使用字符編碼同樣沒有被指定，但是7位ASCII是最基本的通用編碼。

CSV其實就是文本文件，而并不是表格;

csv和.xls的區別在于，.xls的只能用Excel中打開，而且，XLS和CSV的編碼格式也不一樣，簡單來說，CSV可以用文本（TXT）打開也可以用EXCLE打開，而XLS只能用擅長打開

最后，如何在CSV與XLS之間抉擇呢？這里我們要弄清楚幾個問題，CSV只是單純的文本文件，同樣的，也只是單純的以文本格式存儲，CSV無法生成公式，依賴，也無法保存公式，依賴！所以，如果單純的只是存儲文本格式的數據，可以直接選擇使用CSV文件，讀寫方便，易于實現，數據可以表格化展示，這就是優點！

注意：CSV文件可以通過改變文件后綴名或者通過練成工具強制轉換成的的.xls文件，但是要注意亂碼問題。

二，CSV文件讀和寫

1）通過標準的Python中的庫導入CSV文件

CSV，用來處理CSV文件。
這個類庫中的閱讀器（）函數用來讀入CSV文件。當CSV文件被讀入后，可以利用這些數據生成一個numpy的數組，用來訓練算法模型。

#!/usr/bin/python3from csv import reader import numpy as np filename='pima_data.csv' #這個文件中所有數據都是數字，并且數據中不包含文件頭。 with open(filename,'rt') as raw_data:readers = reader(raw_data, delimiter=',')x=list(readers)data=np.array(x).astype('float')print(data.shape)

2）采用numpy的導入CSV文件

可以使用Munpy的loadtxt（）函數導入數據。使用這個函數處理的數據沒有文件頭，并且所有的數據結構都是一樣的，也就是說，數據類型都是一樣的。

#!/usr/bin/python3import numpy as np filename='pima_data.csv' with open(filename,'rt') as raw_data:data=loadtxt(raw_data,delimiter=',')print(data.shape)

（3）采用Pandas導入CSV文件 - 機器學習項目中常用來做數據清洗與數據準備工作。推薦使用。

使用熊貓來導入文件需要使用pandas.read_csv（）函數。這個函數的返回值是數據幀，可以很方便地進行下一步的處理。

#!/usr/bin/python3from pandas import read_csv filename='iris.data.csv' names=['separ-length','separ-width','petal-length','petal-width','class'] dataset=read_csv(filename,names=names) print(dataset.shape)

參考：

https://blog.csdn.net/u012325865/article/details/81670555?blog.csdn.net 超強干貨來襲云風專訪：近40年碼齡，通宵達旦的技術人生

總結

以上是生活随笔為你收集整理的写csv文件_机器学习Python实践——数据导入（CSV）的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： undertale人物_「underta
下一篇： python中case的用法_pytho