最近项目中要实现WORD的文件预览功能,我们可以通过将WORD转换成PDF或者HTML,然后通过浏览器预览。
OpenOffice
OpenOffice.org 是一套跨平台的办公室软件套件,能在 Windows、Linux、MacOS X (X11)、和 Solaris 等操作系统上执行。它与各个主要的办公室软件套件兼容。OpenOffice.org 是自由软件,任何人都可以免费下载、使用、及推广它。
下载地址
JodConverter
jodconverter-2.2.2.zip 下载地址:
http://sourceforge.net/projects/jodconverter/files/JODConverter/
Word转换
启动OpenOffice的服务
进入openoffice安装目录,通过cmd启动一个soffice服务,启动的命令是soffice -headless -accept="socket,host=127.0.0.1,port=8100;urp;"
。
如果觉得后台运行OpenOffice服务比较麻烦,可以通过
运行代码
public class PDFDemo { |
Word、ppt转Html
只需要将后缀名从.pdf
改为.html
即可。
public static void main(String[] args) { |
Maven配置
Maven依赖
<dependency> |
Maven只有 2.2.1版本,2.2.1版本有一个问题,那就是不兼容docx和pptx,如果你们不使用jodconverter-2.2.2 中lib,而想要使用2.2.1版本,需要修改一下 BasicDocumentFormatRegistry
类中的 getFormatByFileExtension
方法:
- 新建包
com.artofsolving.jodconverter
- 新建类
BasicDocumentFormatRegistry
,复制下面代码
package com.artofsolving.jodconverter; |
下面是增加的部分,仅仅增加了将docx按照doc的处理方式处理。而2.2.2版本已经默认增加了。
if (extension.indexOf("doc") >= 0) { |
参考文档: