日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

㊙️【教你用python挣零花钱】自动化简历内推,学弟直呼牛逼!!

發布時間:2024/7/23 python 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 ㊙️【教你用python挣零花钱】自动化简历内推,学弟直呼牛逼!! 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

最近,小編在處理簡歷時,發現大量簡歷需要一個個打開文件,復制姓名、郵箱、電話號碼、學歷等關鍵信息,效率特別低且部分文件無法直接復制。于是,小編便寫了簡歷解析處理的腳本,支持文件格式有:doc,docx,pdf。

ps. 上月戰績,內推400+人,內推成功8人,入職5人,收入8000*2 + 5000*3=31000 元。

{'感謝您的投遞': 331, '簡歷處理中': 19, '簡歷初篩': 5, '本輪通過': 6,?'Offer已發放': 1, '進行中': 2, '拒絕Offer': 3, '接受Offer': 5}?

?

一 準備工作

腳本功能:分析簡歷文本,一鍵內推

輸入:要解析的文件路徑

輸出:解析的內容,包括不限于姓名、郵箱、電話號碼、學歷等信息。

環境準備:python 3.6 、mac(下文中doc轉docx是mac寫法,windows更簡單,導入win32的包即可)

需要導入的包

# encoding: utf-8 import os, sys import docx from pdfminer.pdfparser import PDFParser from pdfminer.pdfdocument import PDFDocument from pdfminer.pdfpage import PDFPage from pdfminer.pdfinterp import PDFResourceManager from pdfminer.pdfinterp import PDFPageInterpreter from pdfminer.layout import LAParams from pdfminer.converter import PDFPageAggregator

二 開始解析

2.1 獲取簡歷文件

def get_files(path):res = []for i in os.listdir(path):# 去掉臨時文件if os.path.isfile(path+i) and '~$' not in i and '.DS' not in i:# 去重 1.doc 和 1.docxif (path+i).split(".")[0] not in str(res):res.append(path+i)return res

2.2 解析PDF

得到res文本后,可以通過正則,匹配出郵箱,手機號,學歷等

def pdf_reader(file):fp = open(file, "rb")# 創建一個與文檔相關聯的解釋器parser = PDFParser(fp)# PDF文檔對象doc = PDFDocument(parser)# 鏈接解釋器和文檔對象parser.set_document(doc)# doc.set_paeser(parser)# 初始化文檔# doc.initialize("")# 創建PDF資源管理器resource = PDFResourceManager()# 參數分析器laparam = LAParams()# 創建一個聚合器device = PDFPageAggregator(resource, laparams=laparam)# 創建PDF頁面解釋器interpreter = PDFPageInterpreter(resource, device)# 使用文檔對象得到頁面集合res = ''for page in PDFPage.create_pages(doc):# 使用頁面解釋器來讀取interpreter.process_page(page)# 使用聚合器來獲取內容layout = device.get_result()for out in layout:if hasattr(out, "get_text"):res = res + '' + out.get_text()return res

2.3 解析word

? ? ? ? 待優化情況:word中如果包含execl,無法解析。

def word_reader(file):try:# docx 直接讀if 'docx' in file:res = ''f = docx.Document(file)for para in f.paragraphs:res = res + '\n' +para.textelse:# 先轉格式doc>docxos.system("textutil -convert docx '%s'"%file)word_reader(file+'x')res = ''f = docx.Document(file+'x')for para in f.paragraphs:res = res + '\n' +para.textreturn resexcept:# print(file, 'read failed')return ''

2.4 完整代碼

# encoding: utf-8 import os, sys import docx from pdfminer.pdfparser import PDFParser from pdfminer.pdfdocument import PDFDocument from pdfminer.pdfpage import PDFPage from pdfminer.pdfinterp import PDFResourceManager from pdfminer.pdfinterp import PDFPageInterpreter from pdfminer.layout import LAParams from pdfminer.converter import PDFPageAggregatordef get_files(path):res = []for i in os.listdir(path):# 去掉臨時文件if os.path.isfile(path+i) and '~$' not in i and '.DS' not in i:# 去重 1.doc 和 1.docxif (path+i).split(".")[0] not in str(res):res.append(path+i)return resdef pdf_reader(file):fp = open(file, "rb")# 創建一個與文檔相關聯的解釋器parser = PDFParser(fp)# PDF文檔對象doc = PDFDocument(parser)# 鏈接解釋器和文檔對象parser.set_document(doc)# doc.set_paeser(parser)# 初始化文檔# doc.initialize("")# 創建PDF資源管理器resource = PDFResourceManager()# 參數分析器laparam = LAParams()# 創建一個聚合器device = PDFPageAggregator(resource, laparams=laparam)# 創建PDF頁面解釋器interpreter = PDFPageInterpreter(resource, device)# 使用文檔對象得到頁面集合res = ''for page in PDFPage.create_pages(doc):# 使用頁面解釋器來讀取interpreter.process_page(page)# 使用聚合器來獲取內容layout = device.get_result()for out in layout:if hasattr(out, "get_text"):res = res + '' + out.get_text()return resdef word_reader(file):try:# docx 直接讀if 'docx' in file:res = ''f = docx.Document(file)for para in f.paragraphs:res = res + '\n' +para.textelse:# 先轉格式doc>docxos.system("textutil -convert docx '%s'"%file)word_reader(file+'x')res = ''f = docx.Document(file+'x')for para in f.paragraphs:res = res + '\n' +para.textreturn resexcept:# print(file, 'read failed')return ''def file_reader(file):if 'doc' in file:res = word_reader(file)elif 'pdf' in file:res = pdf_reader(file)else:res = '不是doc,也不是pdf,文件格式不支持!'return resif __name__ == '__main__':path = "/Users/XXXXX/Mine/XXXXX/"abs_files = get_files(path)print(abs_files)for file in abs_files:file_text = file_reader(file)print(file_text)

三 效果展示

姓名? 工齡? 電話? 學歷背景? 公司背景? 關鍵標簽? 郵箱

??


本期實現:任何格式的簡歷,解析成文本,便于后續篩選優質簡歷。

下期揭曉:簡歷分析,推送到最適合的崗位,包括學歷背景,穩定性,公司背景,擅長技術組件等。

?

我是橋哥,專注分享互聯網黑科技,點贊、收藏不迷路?!!!

?

總結

以上是生活随笔為你收集整理的㊙️【教你用python挣零花钱】自动化简历内推,学弟直呼牛逼!!的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 污污免费在线观看 | 国产九九在线 | 欧美性视频在线 | 久久久久成人精品无码中文字幕 | 插插插91 | 麻豆传媒在线视频 | 天天摸天天干天天操 | 成人性生交大片 | 麻豆视屏 | 日韩在线视频免费 | 久久伊人国产 | 1024金沙人妻一区二区三区 | 成人h视频在线观看 | 五月激情视频 | 欧美a√| 欧美成人一级 | 91亚洲视频在线 | 夜夜操免费视频 | 网站免费在线观看 | avxx| 欧美色xxx| 四季av日韩精品一区 | 激情网站免费 | 亚洲AV无码成人精品区明星换面 | av2014天堂网 | 亚洲系列在线 | 中文永久免费观看 | 女同av在线 | 久久久青| 免费日皮视频 | 中文字幕在线天堂 | 久久久久a | 一级片视频在线观看 | 欧美日韩免费视频 | 影音先锋制服 | 在线视频一区二区 | 米奇影音 | 日本免费三片在线播放 | 成人在线观看18 | 禁断介护老人中文字幕 | 欧美成人a交片免费看 | 26uuu亚洲国产精品 | 久久综合婷婷 | 成人精品一区日本无码网 | 免费se99se| 久久精品男人的天堂 | 国产a区 | 欧美国产中文字幕 | 强行挺进白丝老师里呻吟 | 狠狠五月婷婷 | 日韩一区二区三区不卡视频 | 欧美日韩国产网站 | 免费毛片在线播放 | 美女av网站 | 亚洲av永久一区二区三区蜜桃 | 免费观看黄一级视频 | 亚洲成人手机在线 | 成人久久精品 | 少妇名器的沉沦 | 欧美性猛交xxxx乱大交hd | 秋霞欧美一区二区三区视频免费 | 黄色一级片久久 | 东南亚毛片 | 夜间福利视频 | 午夜亚洲福利在线老司机 | 日韩视频福利 | 国产乱码一区二区三区 | 日韩永久免费视频 | 牛牛免费视频 | 老熟女高潮一区二区三区 | 国产不卡一区 | 日韩少妇一区二区三区 | 日日操夜夜摸 | 国产精品成人久久久 | 乖疼润滑双性初h | 亚洲污片| 男女xx网站 | 狠狠久久婷婷 | 91亚州| 天天色天天干天天色 | 男女深夜福利 | 成人网在线视频 | 日本爽爽| 久久国内视频 | 色播导航 | www伊人| 丹丹的呻吟声1一7 | 亚洲AV成人无码网站天堂久久 | 亚洲美女色视频 | 亚洲性在线 | 欧美午夜视频在线观看 | 女人色极品影院 | 亚洲精品观看 | 2018av| 26uuu亚洲国产精品 | 国产第一福利 | 色四月| 美国一级特黄 | 亚洲三级国产 |