代码处理doc文档

代码处理doc文档 需求对一份doc文档进行操作读取内容、把内容存储起来、修改内容再把内容放回原文档输出新的word文档内容主要涉及文本、文本样式、表格等难点doc文档属于老旧文档本身格式属于二级制 开源工具如poi对doc支持有限能实现简单的需求如手工处理一份文档在文档中用占位符号标明要修改的地方再用新的内容去替换掉文档中的符号需要用到poi中一个replacexx的方法开源工具如poi对doc支持有限想要插入一个新的表格这个表格是无法设置表格属性的官方文档也没有找到设置表格的属性方法调用insert表格的一个方法结果1一个丑陋的缩在一起的表格你的内容不好插入表格同时内容就算插进去了你会得到一个更丑陋的表格样式无法设置文本撑大了表格2插入了表格文档其他地方格式损坏如页脚、页眉doc属于二级制文件它对于各个区域的界定相当于是用一个游标界定某些区域是什么标题、页脚、页眉等随意插入文本但是poi工具不会帮你去移动游标不可比避免损坏文档内容跑去了其他区域解决方法有实力可以使用付费库Aspose处理doc文档这个库是商业库免费用时文档有水印很好的支持doc老旧二进制的一些处理手动处理在文档进入代码处理之气那手动将文档用工具另存为docx版本如wps文件很多需要尽可能代码流程化需要用到外部工具LibreOffice转换代码服务器做一个类似于手动用wps转换的步骤工具开源也是专栏后续使用的工具安装使用LibreOffice通知上游系统能否直接提供新版本docx文档