當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

爬取网易云音乐解析页面数据的三种方法

發(fā)布時間：2023/12/9 编程问答 31 豆豆

生活随笔收集整理的這篇文章主要介紹了爬取网易云音乐解析页面数据的三种方法小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

爬取網(wǎng)易云音樂解析頁面數(shù)據(jù)的三種方法

from selenium import webdriver
from lxml import etree
import time,re

準(zhǔn)備動作

#以張學(xué)友為例
driver = webdriver.Chrome()
down_url = ‘http://music.163.com/song/media/outer/url?id=’
driver.get(‘https://music.163.com/#/artist?id=6460’)
driver.switch_to.frame(‘g_iframe’)
time sleep(1)
html = driver.page_source

第一種方法：etree方法獲取數(shù)據(jù)

data = etree.HTML(html) ids = data.xpath('//div[@class="ttc"]/span/a/@href')#//=span,下面是例子 names = data.xpath('//div[@class="ttc"]//a/b/@title') j=0 for id,name in zip(ids,names):i = id.split('=')[-1]j += 1down_link=down_music_url+i+'.mp3'print(j, name,down_link)

第二種方法：re正則表達式提取數(shù)據(jù)

data = re.findall('href="/song\?id=(.*?)">',html) name = re.findall('b title="(.*?)"',html) i = 0 for id,mc in zip(data,name):n = mc.replace(' ','')i += 1print(i,id,n)

第三種方法：selenium直接頁面獲取數(shù)據(jù)

data = driver.find_elements_by_xpath('//div[@class="ttc"]/span/a') for id in data:i = id.get_attribute('href').split('=')[-1]name = id.get_attribute('text')url = down_url+i+'.mp3'print(url)

總結(jié)并記錄下來，供參考，不足之處還請指點

總結(jié)

以上是生活随笔為你收集整理的爬取网易云音乐解析页面数据的三种方法的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： js 控制超出字数显示省略号
下一篇： MM看过来!教你如何打扮变成时尚达人 -