linux 分割pdf,PDFBox分割PDF文档
在前一章中,我們已經(jīng)看到了如何將JavaScript添加到PDF文檔。 現(xiàn)在來學(xué)習(xí)如何將給定的PDF文檔分成多個文檔。
分割PDF文檔中的頁面
可以使用Splitter類將給定的PDF文檔分割為多個PDF文檔。 該類用于將給定的PDF文檔分成幾個其他文檔。
以下是拆分現(xiàn)有PDF文檔的步驟
第1步:加載現(xiàn)有的PDF文檔
使用PDDocument類的靜態(tài)方法load()加載現(xiàn)有的PDF文檔。 此方法接受一個文件對象作為參數(shù),因為這是一個靜態(tài)方法,可以使用類名稱調(diào)用它,如下所示。
File file = new File("path of the document")
PDDocument document = PDDocument.load(file);
第2步:實例化Splitter類
這個Splitter類包含了分割給定的PDF文檔的方法,因此實例化這個類,如下所示。
Splitter splitter = new Splitter();
第3步:分割PDF文檔
使用Splitter類的Split()方法來分割給定的文檔。 該方法接受PDDocument類的一個對象作為參數(shù)。
List Pages = splitter.split(document);
split()方法將給定文檔的每個頁面分割為單獨的文檔,并以列表的形式返回所有這些文檔。
第4步:創(chuàng)建一個迭代器對象
要遍歷文檔列表,需要獲取上述步驟中獲取的列表的迭代器對象,使用listIterator()方法獲取列表的迭代器對象,如下所示。
Iterator iterator = Pages.listIterator();
第5步:關(guān)閉文檔
最后,使用PDDocument類的close()方法關(guān)閉文檔,如下所示。
document.close();
示例
假設(shè)在目錄:F:\worksp\pdfbox 中有一個名稱為mypdf.pdf的PDF文檔,并且該文檔包含兩個頁面 - 一個頁面包含圖像,另一個頁面包含文本,如下所示。
這個例子演示了如何分割上面提到的PDF文檔。 在這里,將把名稱為mypdf.pdf的PDF文檔分成兩個不同的文檔:sample1.pdf和sample2.pdf。 將此代碼保存在名為SplitPages.java的文件中。
package com.yiibai;
import org.apache.pdfbox.multipdf.Splitter;
import org.apache.pdfbox.pdmodel.PDDocument;
import java.io.File;
import java.io.IOException;
import java.util.List;
import java.util.Iterator;
public class SplitPages {
public static void main(String[] args) throws IOException {
//Loading an existing PDF document
File file = new File("F:/worksp/pdfbox/mypdf.pdf");
PDDocument document = PDDocument.load(file);
//Instantiating Splitter class
Splitter splitter = new Splitter();
//splitting the pages of a PDF document
List Pages = splitter.split(document);
//Creating an iterator
Iterator iterator = Pages.listIterator();
//Saving each page as an individual document
int i = 1;
while(iterator.hasNext()) {
PDDocument pd = iterator.next();
pd.save("F:/worksp/pdfbox/sample"+ i +".pdf");
i = i + 1;
}
System.out.println("Multiple PDF’s created");
document.close();
}
}
執(zhí)行上面示例代碼,得到以下結(jié)果 -
Multiple PDF’s created
生成的兩個文件,打開效果如下 -
第二個PDF文件:
¥ 我要打賞
糾錯/補充
收藏
加QQ群啦,易百教程官方技術(shù)學(xué)習(xí)群
注意:建議每個人選自己的技術(shù)方向加群,同一個QQ最多限加 3 個群。
總結(jié)
以上是生活随笔為你收集整理的linux 分割pdf,PDFBox分割PDF文档的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mysql 默认时间字段 1067,my
- 下一篇: linux克隆后重新封装,克隆后立即在O