python3爬虫初探(一)之urllib.request
生活随笔
收集整理的這篇文章主要介紹了
python3爬虫初探(一)之urllib.request
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
#----第一把武器-----urllib.request---------
urllib.request是python3自帶的庫(kù)(python3.x版本特有),我們用它來請(qǐng)求網(wǎng)頁(yè),并獲取網(wǎng)頁(yè)源碼。話不多說,上代碼。
import urllib.request #調(diào)入要使用的庫(kù)url = 'http://www.baidu.com' data = urllib.request.urlopen(url) #urlopen用來打開一個(gè)網(wǎng)頁(yè) data = data.read() #這里的rend()是必須的,否則不能打印源碼。 print(data) #在python3里面print是要加括號(hào)的 #b'<!DOCTYPE html><!--STATUS OK--><html><head><meta http-equiv="content-type" content="text/html;charset=utf-8"><meta http-equiv="X-UA-Compatible" content="IE=Edge"><meta content="always" name="referrer"><meta name="theme-color" content="#2932e1"><link rel="shortcut icon" href="/favicon.ico" type="image/ #這是部分源碼,現(xiàn)在已經(jīng)成功走出第一步了,之后就是解析網(wǎng)頁(yè)了。總結(jié)
以上是生活随笔為你收集整理的python3爬虫初探(一)之urllib.request的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 爬虫基于ADSL动态获取ip
- 下一篇: python3爬虫初探(二)之reque