日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

爬取网易云音乐解析页面数据的三种方法

發(fā)布時間:2023/12/9 编程问答 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 爬取网易云音乐解析页面数据的三种方法 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

爬取網(wǎng)易云音樂解析頁面數(shù)據(jù)的三種方法

from selenium import webdriver
from lxml import etree
import time,re

準(zhǔn)備動作

#以張學(xué)友為例
driver = webdriver.Chrome()
down_url = ‘http://music.163.com/song/media/outer/url?id=’
driver.get(‘https://music.163.com/#/artist?id=6460’)
driver.switch_to.frame(‘g_iframe’)
time sleep(1)
html = driver.page_source

第一種方法:etree方法獲取數(shù)據(jù)

data = etree.HTML(html) ids = data.xpath('//div[@class="ttc"]/span/a/@href')#//=span,下面是例子 names = data.xpath('//div[@class="ttc"]//a/b/@title') j=0 for id,name in zip(ids,names):i = id.split('=')[-1]j += 1down_link=down_music_url+i+'.mp3'print(j, name,down_link)

第二種方法:re正則表達式提取數(shù)據(jù)

data = re.findall('href="/song\?id=(.*?)">',html) name = re.findall('b title="(.*?)"',html) i = 0 for id,mc in zip(data,name):n = mc.replace(' ','')i += 1print(i,id,n)

第三種方法:selenium直接頁面獲取數(shù)據(jù)

data = driver.find_elements_by_xpath('//div[@class="ttc"]/span/a') for id in data:i = id.get_attribute('href').split('=')[-1]name = id.get_attribute('text')url = down_url+i+'.mp3'print(url)

總結(jié)并記錄下來,供參考,不足之處還請指點

總結(jié)

以上是生活随笔為你收集整理的爬取网易云音乐解析页面数据的三种方法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。