日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > java >内容正文

java

纯Java实现PDF转txt文件

發布時間:2023/12/29 java 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 纯Java实现PDF转txt文件 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

展示這個Demo的原因是一哥們需要我幫他把一些PDF格式的資料轉為txt,我在網上找了下在線的工具,都不好用,網上大多數的在線pdf轉txt文件都需要付費,而免費的一次轉換文件大小不能超過2M,比較痛苦,于是去網上搜了下Java實現Pdf轉txt,剛好看見了大神寫的代碼(http://www.cnblogs.com/fanc/p/6197786.html),就直接拿來用了,哈哈,在此分享下!

package demo;import java.io.File; import java.io.FileOutputStream; import java.io.OutputStreamWriter; import java.io.Writer; import java.net.MalformedURLException; import java.net.URL;import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.util.PDFTextStripper;public class PdfToTxt {public static void main(String[] args) {try {//取得F盤下的pdf的內容readPdf("F:/SJXLX/心理咨詢師考試重點整理---20150429.pdf");} catch (Exception e) {e.printStackTrace();}} /*** 傳入一個.pdf文件* @param file* @throws Exception*/public static void readPdf(String file) throws Exception {// 是否排序boolean sort = false;// pdf文件名String pdfFile = file;// 輸入文本文件名稱String textFile = null;// 編碼方式String encoding = "UTF-8";// 開始提取頁數int startPage = 1;// 結束提取頁數int endPage = Integer.MAX_VALUE;// 文件輸入流,生成文本文件Writer output = null;// 內存中存儲的PDF DocumentPDDocument document = null;try {try {// 首先當作一個URL來裝載文件,如果得到異常再從本地文件系統//去裝載文件URL url = new URL(pdfFile);//注意參數已不是以前版本中的URL.而是File。document = PDDocument.load(pdfFile);// 獲取PDF的文件名String fileName = url.getFile();// 以原來PDF的名稱來命名新產生的txt文件if (fileName.length() > 4) {File outputFile = new File(fileName.substring(0, fileName.length() - 4)+ ".txt");textFile ="F:/SJXLX/"+outputFile.getName();}} catch (MalformedURLException e) {// 如果作為URL裝載得到異常則從文件系統裝載//注意參數已不是以前版本中的URL.而是File。document = PDDocument.load(pdfFile);if (pdfFile.length() > 4) {textFile = pdfFile.substring(0, pdfFile.length() - 4)+ ".txt";}}// 文件輸入流,寫入文件倒textFileoutput = new OutputStreamWriter(new FileOutputStream(textFile),encoding);// PDFTextStripper來提取文本PDFTextStripper stripper = null;stripper = new PDFTextStripper();// 設置是否排序stripper.setSortByPosition(sort);// 設置起始頁stripper.setStartPage(startPage);// 設置結束頁stripper.setEndPage(endPage);// 調用PDFTextStripper的writeText提取并輸出文本stripper.writeText(document, output);System.out.println(textFile + " 輸出成功!");} finally {if (output != null) {// 關閉輸出流output.close();}if (document != null) {// 關閉PDF Documentdocument.close();}}} }
成功轉換幾十個pdf文件,截圖為證!

Java項目運行需要的基礎包我會上傳,需要下載的請自便,不謝!



總結

以上是生活随笔為你收集整理的纯Java实现PDF转txt文件的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。