日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

vb.net读取excel并写入dgv_读取PDF中的表格写入EXCEL?30行代码搞定

發布時間:2024/7/19 编程问答 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 vb.net读取excel并写入dgv_读取PDF中的表格写入EXCEL?30行代码搞定 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

辦公自動化系列+1

現在,各類數據分析的書籍,都可以在網上找到PDF版本;

同時,百度文庫、各類數據統計文庫、行業研究等眾多論文報告,是通過PDF的形式去展示輸出的;

但是,令人都頭疼的是,各類數據分析書中,PDF版本中的表格數據,我們想轉化成自己的數據庫文件,或者EXCEL文件,卻是很難編輯;

今天,就給大家解決這個問題,利用Python,將PDF中的表格和數據讀取出來,并寫入EXCEL中保存到本地;

先上代碼,代碼只有30行;

源PDF文件中的表格數據:

代碼:

#?-*-?coding:?utf-8?-*-
"""
請確保你在運行這個代碼的時候,已經安裝了pdfplumber庫
如果沒有安裝,請在[附件-命令提示符]下輸入:
pip?install?pdfplumber
"""

import?pdfplumber
import?xlwt

#?定義保存Excel的位置
workbook?=?xlwt.Workbook()??#定義workbook
sheet?=?workbook.add_sheet('Sheet1')??#添加sheet
i?=?0?#?Excel起始位置

path?=?input("請輸入PDF文件位置:")
#path?=?"aaaaaa.PDF"??#?導入PDF路徑
pdf?=?pdfplumber.open(path)
print('\n')
print('開始讀取數據')
print('\n')

for?page?in?pdf.pages:
????#?獲取當前頁面的全部文本信息,包括表格中的文字
????#?print(page.extract_text())
????for?table?in?page.extract_tables():
????????#?print(table)
????????for?row?in?table:
????????????print(row)
????????????for?j?in?range(len(row)):
????????????????sheet.write(i,?j,?row[j])
????????????i?+=?1
????????print('----------?分割線?----------')

pdf.close()

#?保存Excel表
workbook.save('保存路徑/文件名.xls')
print('\n')
print('寫入excel成功')
print('保存位置:')
print('保存路徑/文件名.xls')
print('\n')
input('PDF取讀完畢,按任意鍵退出')

最終導出的EXCEL文件:

簡簡單單30行代碼,就將PDF中的表格數據讀取出來,并寫入EXCEL啦;

拓展:

1、pdfplumber簡介

Pdfplumber是一個可以處理pdf格式信息的庫。可以查找關于每個文本字符、矩陣、和行的詳細信息,也可以對表格進行提取并進行可視化調試。

2、pdfplumber安裝

安裝直接采用pip即可。命令行中輸入

pip?install?pdfplumber

3、簡單使用

import?pdfplumber
with?pdfplumber.open("path/to/file.pdf")?as?pdf:
????first_page?=?pdf.pages[0]
????print(first_page.chars[0])

pdfplumber.pdf中包含了.metadata和.pages兩個屬性。

  • .metadata是一個包含pdf信息的字典。
  • .pages是一個包含頁面信息的列表。

每個pdfplumber.page的類中包含了幾個主要的屬性。

  • .page_number 頁碼
  • .width 頁面寬度
  • .height 頁面高度
  • .objects/.chars/.lines/.rects 這些屬性中每一個都是一個列表,每個列表都包含一個字典,每個字典用于說明頁面中的對象信息, 包括直線,字符, 方格等位置信息。

4、一些常用的方法

  • .extract_text() 用來提取頁面中的文本,將頁面的所有字符對象整理為的那個字符串
  • .extract_words() 返回的是所有的單詞及其相關信息
  • .extract_tables() 提取頁面的表格

python自動化辦公寶典

其中?《python自動化辦公寶典》?共包含六個章節97頁,不僅有詳細的代碼解釋,而且還有詳細的圖文說明,通俗易懂,讓你輕松完成辦公自動化。

  • python使用openpyxl操作excel;
  • python使用PyPDF2和pdfplumber操作pdf;
  • python使用python-docx操作word;
  • python使用python-pptx操作PPT;
  • python如何自動收發郵件;
  • python制作電話號碼歸屬地查詢工具;

后臺回復關鍵詞:自動化? 即可獲得 !!!

下面這本書限時300積分兌換哦

也可參加當當活動每滿100減50

感謝北京大學出版社的大力支持

總結

以上是生活随笔為你收集整理的vb.net读取excel并写入dgv_读取PDF中的表格写入EXCEL?30行代码搞定的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。