OpenXLSX 中文字段读取问题
生活随笔
收集整理的這篇文章主要介紹了
OpenXLSX 中文字段读取问题
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
在讀取excel的時候發現有些中文字段無法讀取,通過把excel文件解壓后對比發現,正常讀取和不
能正常讀取的中文字段在sharedString.xml中存儲的格式有差異,取其中一個字段,如下圖:
正常讀取的
不能讀取的
?對比可以看到其區別,然后查找openxlsx對這塊的處理,通過調試代碼找到代碼如下:
const char* XLSharedStrings::getString(uint32_t index) const {auto iter = xmlDocument().document_element().children().begin();std::advance(iter, index);return iter->first_child().text().get(); }?通過分析代碼上下文,并結合getString函數,發現其只處理了si結點的第一個子節點,所以無法
處理上圖的存儲格式,找到問題了,做一個兼容即可,修改后的代碼如下:
const char* XLSharedStrings::getString(uint32_t index) const {auto iter = xmlDocument().document_element().children().begin();std::advance(iter, index);if (!iter->first_child().empty() && !strcmp(iter->first_child().name(), "r")){pugi::xml_node iter_r = iter->first_child();if (!iter_r.first_child().empty() && !strcmp(iter_r.first_child().name(), "rPr")){pugi::xml_node iter_rPr = iter_r.first_child();if (!iter_rPr.next_sibling().empty() && !strcmp(iter_rPr.next_sibling().name(), "t")){pugi::xml_node iter_t = iter_rPr.next_sibling();return iter_t.text().get();}}}return iter->first_child().text().get(); }從上面代碼可以看到,實際就是如果si標簽下面如果是r標簽,那就查找rPr標簽,然后再找到t標簽
即可,如果si標簽下面直接是r標簽,就還沿用原來的代碼。
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的OpenXLSX 中文字段读取问题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 银行理财子公司是干什么的?与银行理财有哪
- 下一篇: epoll怎么实现的