Python实现word转pdf
Python實現(xiàn)word轉pdf
在做word轉未pdf的功能過程中找了很多java的實現(xiàn)(POI),對于普通的文檔還是支持的還可以,但是對于文檔里面涉及圖片、表格、水印等就會出現(xiàn)很多樣式上的問題,字體重復,水印丟失,表格位置錯亂等。
1、poi用到的轉pdf的相關代碼如下:
public static byte[] docx2pdf(byte[] docxBytes) throws XWPFConverterException, IOException {PdfOptions options = PdfOptions.create();XWPFDocument document = new XWPFDocument(new ByteArrayInputStream(docxBytes));ByteArrayOutputStream baos = new ByteArrayOutputStream(); // XHWPFDocument doc = new XHWPFDocument(new ByteArrayInputStream(docxBytes));//document.getp//XWPFHeaderFooterPolicy xFooter = new XWPFHeaderFooterPolicy(document);/* XWPFHeader defaultHeader = xFooter.getDefaultHeader();defaultHeader.getParagraphArray(0).getCTP().getRArray(0).getPictArray().XWPFParagraph item = defaultHeader.getParagraphArray(0).getCTP().getRArray(0).getPictArray();document.setParagraph(item, document.getPosOfParagraph(document.getLastParagraph()) -2);*///xFooter.createWatermark("復制");PdfConverter.getInstance().convert(document, baos, options);return baos.toByteArray();}2、經過了很多次的努力發(fā)現(xiàn)還是解決不了上面的問題(功力不夠呀,請有解決方法的猿友不吝賜教!),所以不再java上做努力了,經過研究發(fā)現(xiàn)用Python可以比較好的實現(xiàn)word轉pdf的需求,可是我對于Python一點不熟,學習了一天多,了解了一些基本語法,當然又找了不少的資料,還真是挺多的,word轉pdf,轉html,pdf轉word等等,其他怎么看,就找到了一篇word轉pdf的開始研究,Python確實比Java方便多了,只要把以來導入,盡可以執(zhí)行了,未來調試代碼,我就用idea搭起來了Python項目。
python代碼如下:
# -*- encoding: utf-8 -*- import os import sysfrom win32com import client# pip install win32com def templateDoc2pdf(doc_name, pdf_name):""":word文件轉pdf:param doc_name word文件名稱:param pdf_name 轉換后pdf文件名稱"""try:word = client.DispatchEx("Word.Application")if os.path.exists(pdf_name):os.remove(pdf_name)worddoc = word.Documents.Open(doc_name, ReadOnly=1)worddoc.SaveAs(pdf_name, FileFormat=17)worddoc.Close()return pdf_nameexcept:return 1templateDoc2pdf(sys.argv[1], sys.argv[2])這個是封裝后的代碼,是供Java代碼調用。
原始代碼如下,可以直接運行:
# -*- encoding: utf-8 -*- import os from win32com import client #pip install win32com def doc2pdf(doc_name, pdf_name):""":word文件轉pdf:param doc_name word文件名稱:param pdf_name 轉換后pdf文件名稱"""try:word = client.DispatchEx("Word.Application")if os.path.exists(pdf_name):os.remove(pdf_name)worddoc = word.Documents.Open(doc_name,ReadOnly = 1)worddoc.SaveAs(pdf_name, FileFormat = 17)worddoc.Close()return pdf_nameexcept:return 1def main():input = r'E:/大倉租賃合同(1).docx'print(input);output = r'E:/Python.pdf'print(output);rc = doc2pdf(input, output)print(rc);# rc = doc2html(input, output)# rc = pdf2doc(input, output)if rc:print('轉換成功')else:print('轉換失敗')if __name__ == '__main__':main()這個可以直接雙擊調用,就會在指定目錄生成pdf文件,完美轉化,樣子簡直和wps轉出來的pdf一毛一樣,哈哈哈,開心的開始搞代碼。
用Java開始調用python,調用代碼如下:
@Overridepublic void word2Pdf(String pythonFilePath, String docPath, String pdfPath) {File file = new File(pdfPath);String[] arguments = new String[] {"python",pythonFilePath, docPath, "e:/doc/測試11.pdf"};try {Runtime.getRuntime( ).exec(arguments);} catch (Exception e) {e.printStackTrace( );}}這樣就實現(xiàn)Java調用python實現(xiàn)word轉pdf的功能拉。
但是,本來這樣就完美了,但是,但是,這些代碼,python代碼所依賴的包都是Windows系統(tǒng)的包,這些代碼放到Linux系統(tǒng)上是支持不了的,坑爹啊,快搞完了,才知道這些。。。。但是還是有方案滴,這里就先不透露了,因為還在改,下篇我們再聊,其實我們用了kkFileView(一個2k星的項目)來完成這個功能,哈哈忍不了,透漏一下。
?
?
?
每天努力一點,每天都在進步。
總結
以上是生活随笔為你收集整理的Python实现word转pdf的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Matlab颜色RGB值
- 下一篇: 用python实现pdf转word_Py