如何将模糊的扫描版pdf转为清晰的pdf或word_pdf问题小结
20220109
pdf拆分
不要點提取頁面為單獨文件 這樣會提取出完整的一個文件
而如果選了的話會全部拆分成一頁一頁
20220107
# code=utf-8
import os
import time
import sys
import fitz
import pdfplumber
from openpyxl import Workbook
from tqdm import tqdm
PATH = r'D:\project_pycharm\medicine_standard_lib/'def analysis_table(pdf_file):# 打開表格workbook = Workbook()sheet = workbook.active# 打開pdfwith pdfplumber.open(pdf_file) as pdf:# 遍歷每頁pdffor page in tqdm(pdf.pages):# 提取表格信息table = page.extract_table()# print(table)# 格式化表格數(shù)據(jù)for row in table:# print(row)sheet.append(row)workbook.save(filename="醫(yī)保藥品分類與代碼數(shù)據(jù)庫更新202110.pdf.xlsx")analysis_table(PATH+'醫(yī)保藥品分類與代碼數(shù)據(jù)庫更新202110.pdf')
抽取表格
https://blog.csdn.net/wxplol/article/details/109304946
基于pymupdf的PDF的文本、圖片和表格信息提取
https://mp.weixin.qq.com/s/59UiYl1AJh-kWQOCeeIMHA
各種pdf解析庫
https://www.jianshu.com/p/d38f2a582aa8
Python實現(xiàn)PDF內(nèi)容抽取PyMuPDF
平滑的地方都選上
自定義分辨率
或者用2345 pdf閱讀器 很清晰
可以調(diào)節(jié)顯示器的 clear vision 來調(diào)節(jié)對比度 增加顯示效果
模糊的pdf文檔會變的清晰
</div><!--一個博主專欄付費入口--><!--一個博主專欄付費入口結(jié)束--><link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-4a3473df85.css"><link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-4a3473df85.css"><div class="htmledit_views" id="content_views"><p><strong>AdobeAcrobat是一款不錯的pdf編輯閱讀器,大家常用來閱讀文獻(xiàn)資料,但是在安裝完成使用時候,常常出現(xiàn)頁面字體不清晰的情況,需要做一下調(diào)整:</strong></p>
(1)打開AdobeAcrobat屬性中的兼容性設(shè)置界面(右擊桌面AdobeAcrobat的圖標(biāo),選擇屬性,點擊兼容性)
(2)對兼容性做如下設(shè)置,調(diào)整成為程序自動使用高DPI
(3)打開AdobeAcrobat,選擇編輯——首選項——頁面設(shè)置,將分辨率調(diào)整成為使用系統(tǒng)設(shè)置,渲染部分的平滑文本選擇用于顯示器,其他的默認(rèn)打鉤。頁面布局和縮放類型可以自己調(diào)整了看,這里選擇自動。
(4)重啟AdobeAcrobat即可
?
總結(jié)
以上是生活随笔為你收集整理的如何将模糊的扫描版pdf转为清晰的pdf或word_pdf问题小结的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Ramsey定理数学
- 下一篇: Python怎么利用多核cpu