當前位置：首頁 > 编程语言 > python >内容正文

python

爬取猎聘python_爬取猎聘大数据岗位相关信息--Python

發布時間：2023/12/4 python 29 豆豆

生活随笔收集整理的這篇文章主要介紹了爬取猎聘python_爬取猎聘大数据岗位相关信息--Python 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

獵聘網站搜索大數據關鍵字，只能顯示100頁，爬取這一百頁的相關信息，以便做分析。

__author__ = ‘Fred Zhao‘

import requests

from bs4 import BeautifulSoup

import os

import csv

class JobSearch():

def __init__(self):

self.headers = {

‘User-Agent‘: ‘Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.95 Safari/537.36‘}

self.base_url = ‘https://www.liepin.com/zhaopin/?ckid=c1a868fa8b83aa5b&fromSearchBtn=2&init=-1&sfrom=click-pc_homepage-centre_searchbox-search_new&degradeFlag=0&key=大數據&headckid=c1a868fa8b83aa5b&d_pageSize=40&siTag=LGV-fc5u_67LtFjetF6ACg~fA9rXquZc5IkJpXC-Ycixw&d_headId=8e7325814e7ed9919787ee3fe85e1c94&d_ckId=8e7325814e7ed9919787ee3fe85e1c94&d_sfrom=search_fp&d_curPage=99&curPage=‘

self.base_path = os.path.dirname(__file__)

def makedir(self, name):

path = os.path.join(self.base_path, name)

isExist = os.path.exists(path)

if not isExist:

os.makedirs(path)

print("File has been created.")

else:

print(‘OK!The file is existed. You do not need create a new one.‘)

os.chdir(path)

def request(self, url):

r = requests.get(url, headers=self.headers)

return r

def get_detail(self, page):

r = self.request(self.base_url + page)

ul = BeautifulSoup(r.text, ‘lxml‘).find(‘ul‘, class_=‘sojob-list‘)

plist = ul.find_all(‘li‘)

self.makedir(‘job_data‘)

rows = []

for item in plist:

job_info = item.find(‘div‘, class_=‘sojob-item-main clearfix‘).find(‘div‘, class_=‘job-info‘)

position = job_info.find(‘h3‘).get(‘title‘)

print(position)

job_info_list = job_info.find_all(‘p‘)

job_condition = job_info_list[0].get(‘title‘)

print(job_condition)

job_time = job_info_list[1].find(‘time‘).get(‘title‘)

print(job_time)

company_info = item.find(‘div‘, class_=‘sojob-item-main clearfix‘).find(‘div‘, class_=‘company-info‘)

company = company_info.find(‘p‘, class_=‘company-name‘).find(‘a‘).get(‘title‘)

print(company)

rows.append([position, job_condition, job_time, company])

self.save_to_csv(rows)

def save_to_csv(self, rows):

with open(‘job.csv‘, ‘a‘) as f:

writer = csv.writer(f)

writer.writerows(rows)

if __name__ == ‘__main__‘:

job = JobSearch()

for page in range(0, 100):

job.get_detail(str(page))

總結

以上是生活随笔為你收集整理的爬取猎聘python_爬取猎聘大数据岗位相关信息--Python的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：手把手教你怎么自己制作手机铃声
下一篇： python tuple args_Py