OpenOfficeConnection con = new SocketOpenOfficeConnection("127.0.0.1", 8100); con.connect(); // 創建轉換器 DocumentConverter converter = new OpenOfficeDocumentConverter(con); // 轉換文檔問html converter.convert(docFile, htmlFile); // 關閉openoffice連接 con.disconnect();
這樣就把office文檔轉換為html文件:htmlFile了。 但ppt默認是轉換為一個html文件,每一頁ppt會生成一個圖片,並且html文件是上一頁下一頁的形式每次只能看到一頁ppt。我們希望把這個html直接展現所有ppt頁的圖片。於是稍微改造了下,把ppt轉換為html後的文件夾下所有圖片做輪訓,然後拼接一個html文件: 1 <br><center><img src=" + tempDate + "/" + imgName+ " alt=\"\"></center> 開發完成後,發現非常完美。 但後面還是遇到了兩個坑,分析了很久才發現。 1、部分ppt轉換Html始終是亂碼。 2、部分word文檔轉換為html始終是空白。 上面兩個問題折騰了比較久,有問題的office始終有問題,沒有問題的office一定能轉換成功,分析了很久才發現問題。 最後經過一頁一頁ppt,一個一個文字刪除和轉換才發現。 第一個問題ppt裡如果有備注通過openoffice轉換為html就會是亂碼,並且內容很少。 第二個問題是word文檔裡部分文字復制到openoffice的文檔裡,可能有文字字體不兼容導致。就是比如wps打開這個word,看到都是宋體,但把文字復制到openoffice裡,發現有幾個字不是宋體了。 解決方法暫時是: 第一個問題把所有ppt的備注人工刪除了,就能轉換成功了。 第二個問題簡單解決方法是把所有文字的字體都再重新修改成一樣的字體,比如修改成宋體。