當(dāng)前位置：首頁(yè) > 编程语言 > python >内容正文

python

python3爬虫初探（一）之urllib.request

發(fā)布時(shí)間：2024/1/23 python 54 豆豆

生活随笔收集整理的這篇文章主要介紹了 python3爬虫初探（一）之urllib.request 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

#----第一把武器-----urllib.request---------

　　urllib.request是python3自帶的庫(kù)（python3.x版本特有），我們用它來請(qǐng)求網(wǎng)頁(yè)，并獲取網(wǎng)頁(yè)源碼。話不多說，上代碼。

import urllib.request #調(diào)入要使用的庫(kù)url = 'http://www.baidu.com' data = urllib.request.urlopen(url) #urlopen用來打開一個(gè)網(wǎng)頁(yè) data = data.read() #這里的rend()是必須的，否則不能打印源碼。 print(data) #在python3里面print是要加括號(hào)的 #b'<!DOCTYPE html><html><head><meta http-equiv="content-type" content="text/html;charset=utf-8"><meta http-equiv="X-UA-Compatible" content="IE=Edge"><meta content="always" name="referrer"><meta name="theme-color" content="#2932e1"><link rel="shortcut icon" href="/favicon.ico" type="image/ #這是部分源碼，現(xiàn)在已經(jīng)成功走出第一步了，之后就是解析網(wǎng)頁(yè)了。

總結(jié)

以上是生活随笔為你收集整理的python3爬虫初探（一）之urllib.request的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：爬虫基于ADSL动态获取ip
下一篇： python3爬虫初探（二）之reque