日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python豆瓣历史评分_Python实战-爬取豆瓣top250评分高于指定值的电影信息

發布時間:2023/12/4 python 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python豆瓣历史评分_Python实战-爬取豆瓣top250评分高于指定值的电影信息 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

思路

1. 要獲得怎么樣的數據

2. 找到數據來源

3. 模擬瀏覽器發送請求獲得數據

4. 處理數據,保存數據

第一步:

在這里數據是豆瓣top250中高于指定分數的電影信息

信息有:名稱,評分,格言

第二步:

數據在網頁html中,這里我使用xpath語法分析htm代碼提取數據即可

當然也有其它方法比如:找出頁面請求的數據包,抓包分析,找出數據來源

故猜測第k頁的url只需start為25*(k-1)

所以我們枚舉url,提取有效的數據。

第三步:

獲得網頁源碼是一般是發送get請求。故

制定請求頭

找到url

模擬瀏覽器發送數據def GetHelpfulElement(Html,socre):#根據html代碼獲得希望的element列表

Xpath=r'//div[@ class="item"]//div[@ class="star"]/span[2][text()>={}]/../../..'.format(socre)

HtmlElement=etree.HTML(Html)

return HtmlElement.xpath(Xpath)

def GetHtml(url):#根據url獲得html字符串

Headers={

"User - Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36"

}

resp=requests.get(url,headers=Headers)

return resp.content.decode()

最后一步就是代碼了

數據保存在date文件。

mport requests

from lxml import etree

from pprint import pprint

import re

'''

目的:爬取豆瓣top250中 評分高于指定值的電影名字,導演,演員信息,評分。

url="https://movie.douban.com/top250?start={}"25的增加,10次即可

針對每個html字符串用xpath語法進行處理

1.找出符合條件的element元素

2.對element元素進行信息提取成字典形式

3.把每一頁的信息整理成一個列表追加即可

'''

def GetHelpfulElement(Html,socre):#根據html代碼獲得希望的element列表

Xpath=r'//div[@ class="item"]//div[@ class="star"]/span[2][text()>={}]/../../..'.format(socre)

HtmlElement=etree.HTML(Html)

return HtmlElement.xpath(Xpath)

def GetHtml(url):#根據url獲得html字符串

Headers={

"User - Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36"

}

resp=requests.get(url,headers=Headers)

return resp.content.decode()

def HandleList(Mylist):#處理xpath的獲得的列表 返回第一個,否則返回None

return Mylist[0] if len(Mylist)!=0 else None

def ElementToDict(Element):#一個elemengt信息轉化為dict

ret={}

html=etree.tostring(Element,encoding="utf-8").decode()

Element=etree.HTML(html)#不知道為什么只有這樣,每次函數得到的信息才不同

RatingXpath=r'//span[@class="rating_num"]/text()'

TitleXpath=r'//a/span[@class="title"]/text()'

QuoteXpath=r'//span[@class="inq"]/text()'

ret['rating:num']=HandleList(Element.xpath(RatingXpath))

ret['title'] = HandleList(Element.xpath(TitleXpath))

ret['quote'] = HandleList(Element.xpath(QuoteXpath))

return ret

def ElementlistToDictlist(Elementlist):#element列表轉化為有用的dict列表

Mylist=[]

for i in Elementlist:

Mylist.append(ElementToDict(i))

return Mylist

def Save(Mydict):#保存一條信息

Keylist = ['title', 'rating:num', 'quote']

NameList = ['名稱', '評分', '格言']

with open('date.txt','a',encoding='utf-8') as fp:

for i in range(len(Keylist)):

fp.write(NameList[i])

fp.write(' : ')

fp.write(Mydict[Keylist[i]] if Mydict[Keylist[i]]!=None else " ")

fp.write('\n')

fp.write('\n')

def run(score):#實現主要邏輯

TempUrl = r"https://movie.douban.com/top250?start={}"

Dictlist =[]

for numbers in range(10):

Url = TempUrl.format(numbers * 25)

ElementList = GetHelpfulElement(GetHtml(Url), score)

TempDictList= ElementlistToDictlist(ElementList)

global total

total+=len(TempDictList)

for i in TempDictList:

Save(i)

if __name__ == '__main__':

RatingNum=float(input("請輸入最低評分:"))

total=0

print("請稍等...")

run(RatingNum)

print("共有:",total,"個結果。")

總結

以上是生活随笔為你收集整理的python豆瓣历史评分_Python实战-爬取豆瓣top250评分高于指定值的电影信息的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 无码久久av一区二区三区 | 久草中文网 | 欧美久久久久久久久久久久 | 综合久久中文字幕 | 修女也疯狂3免费观看完整版 | 少妇紧身牛仔裤裤啪啪 | 黄视频在线免费看 | 日韩精品1区2区 | 91精品国产一区二区三区蜜臀 | 亚洲av无码专区首页 | 91在线观看免费高清 | 日本黄色一级网站 | 中文精品久久久久人妻不卡 | 人妻少妇无码精品视频区 | 久久黄色小视频 | av日韩中文字幕 | 亚洲AV无码乱码国产精品牛牛 | 性——交——性——乱免费的 | 污污视频在线播放 | 亚洲国产成人精品一区二区三区 | 日韩精品欧美在线 | 风流还珠之乱淫h文 | 日韩久久一区二区三区 | 手机看片福利一区 | 日本精品一区二区三区四区 | 永久免费网站直接看 | 国产做爰全免费的视频软件 | 性视屏| 91成人一区 | av一区二区在线观看 | 国产第113页 | 九九久久99 | 一区二区三区四区国产精品 | 少妇人妻互换不带套 | 欧美大片免费观看 | 亚洲一区二区久久久 | 天天射寡妇 | 国产一区中文字幕 | 国产一区二区在线免费 | 少妇做爰免费理伦电影 | 国产三级一区二区 | 男女天堂av | 国产一区在线看 | 暧暧视频在线观看 | 香蕉视频污在线观看 | 一区二区三区免费观看视频 | 高潮av| 打开免费观看视频在线播放 | 久久久久久9| 欧美女人一区二区 | 中文日本在线 | 少妇搡bbbb搡bbb搡打电话 | 国产成人99久久亚洲综合精品 | 色性av | 九色视频91 | 国产黄色一级网站 | 一乃葵在线 | 亚洲av无码日韩精品影片 | 日韩成人av在线 | 欧美一级黄色片在线观看 | 国产精品久久久久久久久久久久 | 九九视频这里只有精品 | 尤物视频一区 | 亚洲色大成网站www www.97ai.com | 久久久午夜影院 | 无码h肉动漫在线观看 | julia一区二区中文久久97 | 在线观看亚洲a | 伊人久久99 | 国产一区二区欧美日韩 | 欧美成人高清视频 | 婷婷综合av | 日韩精品第一 | 黄色特级视频 | 久久婷婷综合色 | 天堂在线免费观看 | 久久精品视频一区 | 超碰国产97 | 国产亚洲色婷婷久久99精品91 | 亚洲区av | 日韩亚射吧| www.com毛片| 麻豆av片 | 成人午夜免费在线 | h片在线观看网站 | 三级久久 | 欧美啪啪一区 | 97精品人妻一区二区三区在线 | 天堂在线1 | 国产一区二区三区中文字幕 | 成人欧美一区二区三区黑人孕妇 | 欧美在线性爱视频 | 久久影库 | 中文在线字幕免费观 | 好吊视频一区二区三区 | 日本乱偷中文字幕 | 贝利弗山的秘密1985版免费观看 | 亚洲天堂无吗 | 中文字幕成人 |