python中文件路径格式_Python应用-临床路径格式转换
有這么一個需求:有近1000個臨床路徑,給的doc格式的文檔,里面有文字描述形式的住院流程和表格形式的臨床路徑表單,現在需要將其中的表格按照模板存為excel格式,導入醫院HIS。
doc中表格是這樣:
excel模板是這樣:
時間段排序12345,主要診療工作、重點醫囑、主要護理工作排序123,組合成1-1、1-2、1-3、2-1形式的單元標記。
手動做一兩個沒問題,多了就太麻煩了,想想辦法批量處理吧。
先考慮一下如何讀取word中的表格,在網上查詢、踩坑之后總結如下:
環境是Python3.5,網上先搜到的win32com和docx不好用,要用的是python-docx模塊,When import docx in python3.3 I have error ImportError: No module named 'exceptions' 這個里面說明了Python3x與python-docx兼容。另外搜到的是,python-docx不支持讀取doc,需要先將doc轉存為docx了再處理。
只需要導入:
from主要操作如下:
轉換doc到docx:
if建表格:
#過濾文本檢查表格是否為7行,不是的話不進行后續的處理:
#取每一個表格,檢查表格是否為7行,表格行數存tablelength中WORD的表格中,第一列、第一行,第五行及以上的文字都不需要,跳過。每一列作為序號,每一大行作為小序號;內容分行,與歸屬路徑和單元標記一起寫進excel表格中保存;
#取每一個表格運行結果如下,打印日志提取出了要寫入表格的內容,生成了上述模板:
批量處理:
def生成的excel模板加上自定義的歸屬路徑編號就可以往HIS里面上傳制作臨床路徑了。
除開兩個主要模塊之外的其它部分:
import總結
以上是生活随笔為你收集整理的python中文件路径格式_Python应用-临床路径格式转换的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ksql 数量大于2_A股史上唯一能暴涨
- 下一篇: websocket python爬虫_p