Python:数据导入、爬虫:csv,excel,sql,html,txt
生活随笔
收集整理的這篇文章主要介紹了
Python:数据导入、爬虫:csv,excel,sql,html,txt
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
'''
來源:天善智能韋瑋老師課堂筆記
作者:Dust
數據導入
·導入csv數據csv是一種常見的數據存儲格式,基本上我們遇到的數據都可以轉為這種存儲格式。在Python數據分析中,我們可以使用pandas模塊導入csv數據。
·導入excel數據excel是一種表格文件,在Python數據分析中,我們同樣可以使用pandas模塊導入excel表格里面的數據。
·導入MySQL數據庫里的數據MySQL是一種很常見的數據庫,在Python數據分析中,我們也可以直接從MySQL中取數據。
·導入html數據使用pandas,可以直接從html網頁中加載對應table表格中的數據,但是在使用read_html()之前,需要先安裝html5lib模塊與beautifulsoup4模塊。
·導入文本數據有時我們希望直接導入txt文本數據,其實也是可以的。
'''
import pandas as pda
i=pda.read_csv("G:/Python/data/starcraft.csv") # 導入csv格式的數據
print(i.describe())
# 按照某一列進行排序
print(i.sort_values(by="Age")) # 按照年齡進行排序'''
pda.read_excel("G:/Python/csv/starcraft.xls") 導入excel文件import pymysql 導入數據庫文件
conn=pymysql.connet(host="127.0.0.1",user="root",password="root",db="hexun")
sql=select * from myhexun
k=pda.read_sql(sql,conn)
print(k.describe())
'''print("---html---")
m=pda.read_html("http://www.weifang.gov.cn/")
# 額,這個是濰坊市政府的網站,確定要爬嗎?但我一時半會找不著別的帶table的網站了……
print(m)print("---txt---")
n=pda.read_table("G:\\Python\\data\\abc.txt")
print(n)
運行結果:
總結
以上是生活随笔為你收集整理的Python:数据导入、爬虫:csv,excel,sql,html,txt的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 龙珠是谁画的呢?
- 下一篇: Python:matplotlib实践: