openoffice word 水印 openoffice 水印
发布日期:2020-12-12摘要:如何利用openoffice读取word文档,并输出在页面上(HTML)将Word转Html的原理是这样的:1、客户上传Word文档到服务器2、服务器调用OpenOffice程序打开上传的Word文档...
如何利用openoffice读取word文档,并输出在页面上(HTML)
将Word转Html的原理是这样的:1、客户上传Word文档到服务器2、服务器调用OpenOffice程序打开上传的Word文档3、OpenOffice将Word文档另存为Html格式4、Over至此可见,这要求服务器端安装OpenOffice软件,其实也可以是MS Office,不过OpenOffice的优势是跨平台,你懂的。
恩,说明一下,本文的测试基于 MS Win7 Ultimate X64 系统。
下面就是规规矩矩的实现。
1、下载OpenOffice,2、下载Jodconverter 这是一个开启OpenOffice进行格式转化的第三方jar包。
3、泡杯热茶,等待下载。
4、安装OpenOffice,安装结束后,调用cmd,启动OpenOffice的一项服务:C:\Program Files (x86)\OpenOffice.org 3\program>soffice -headless -accept="socket,port=8100;urp;"5、打开eclipse6、喝杯热茶,等待eclipse打开。
7、新建eclipse项目,导入Jodconverter/lib 下得jar包。
* commons-io * jodconverter * juh * jurt * ridl * slf4j-api * slf4j-jdk14 * unoil * xstream 8、Coding...查看代码package com.mzule.doc2html.util;import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.IOException;import java.io.InputStreamReader;import java.net.ConnectException;import java.util.Date;import java.util.regex.Matcher;import java.util.regex.Pattern;import com.artofsolving.jodconverter.DocumentConverter;import com.artofsolving.jodconverter.openoffice.connection.OpenOfficeConnection;import com.artofsolving.jodconverter.openoffice.connection.SocketOpenOfficeConnection;import com.artofsolving.jodconverter.openoffice.converter.OpenOfficeDocumentConverter;/** * 将Word文档转换成html字符串的工具类 * * @author MZULE * */public class Doc2Html { public static void main(String[] args) { System.out .println(toHtmlString(new File("C:/test/test.doc"), "C:/test")); } /** * 将word文档转换成html文档 * * @param docFile * 需要转换的word文档 * @param filepath * 转换之后html的存放路径 * @return 转换之后的html文件 */ public static File convert(File docFile, String filepath) { // 创建保存html的文件 File htmlFile = new File(filepath + "/" + new Date().getTime() + ".html"); // 创建Openoffice连接 OpenOfficeConnection con = new SocketOpenOfficeConnection(8100); try { // 连接 con.connect(); } catch (ConnectException e) { System.out.println("获取OpenOffice连接失败..."); e.printStackTrace(); } // 创建转换器 DocumentConverter converter = new OpenOfficeDocumentConverter(con); // 转换文档问html converter.convert(docFile, htmlFile); // 关闭openoffice连接 con.disconnect(); return htmlFile; } /** * 将word转换成html文件,并且获取html文件代码。
* * @param docFile * 需要转换的文档 * @param filepath * 文档中图片的保存位置 * @return 转换成功的html代码 */ public static String toHtmlString(File docFile, String filepath) { // 转换word文档 File htmlFile = convert(docFile, filepath); // 获取html文件流 StringBuffer htmlSb = new StringBuffer(); try { BufferedReader br = new BufferedReader(new InputStreamReader( new FileInputStream(htmlFile))); while (br.ready()) { htmlSb.append(br.readLine()); } br.close(); // 删除临时文件 htmlFile.delete(); } catch (FileNotFoundException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } // HTML文件字符串 String htmlStr = htmlSb.toString(); // 返回经过清洁的html文本 return clearFormat(htmlStr, filepath); } /** * 清除一些不需要的html标记 * * @param htmlStr * 带有复杂html标记的html语句 * @return 去除了不需要html标记的语句 */ protected static String clearFormat(String htmlStr, String docImgPath) { // 获取body内容的正则 String bodyReg = ""; Pattern bodyPattern = Pattern.compile(bodyReg); Matcher bodyMatcher = bodyPattern.matcher(htmlStr); if (bodyMatcher.find()) { // 获取BODY内容,并转化BODY标签为DIV htmlStr = bodyMatcher.group().replaceFirst("", ""); } // 调整图片地址 htmlStr = htmlStr.replaceAll("转换成保留样式 // content = content.replaceAll("(]*>.*?)()", // ""); // 把转换成并删除样式 htmlStr = htmlStr.replaceAll("(]*)(>.*?)()", ""); // 删除不需要的标签 htmlStr = htmlStr .replaceAll( "]*?>", ""); // 删除不需要的属性 htmlStr = htmlStr .replaceAll( "]*)(?:lang|LANG|class|CLASS|style|STYLE|size|SIZE|face|FACE|[ovwxpOVWXP]:\\w+)=(?:"[^"]*"|\"\"[^\"\"]*\"\"|[^>]+)([^>]*)>", ""); return htmlStr; }}
Java怎么操作OpenOffice创建word文档并向其设置内容
创建Openoffice连接OpenOfficeConnection con = new SocketOpenOfficeConnection(8100);try {//:\Program Files (x86)\OpenOffice,其实也可以是MS Office.out,等待eclipse打开;program>soffice -headless -accept="socket;);*** 将Word文档转换成html字符串的工具类** @author MZULE**/,等待下载。
4、安装OpenOffice..");e.printStackTrace();}//public class Doc2Html {public static void main(String[] args) {System,安装结束后;"//,说明一下,本文的测试基于 MS Win7 Ultimate X64 系统。
下面就是规规矩矩的实现。
1、下载OpenOffice,启动OpenOffice的一项服务。
* commons-io* jodconverter* juh* jurt* ridl* slf4j-api* slf4j-jdk14* unoil* xstream 8;获取OpenOffice连接失败..artofsolving.jodconverter将Word转Html的原理是这样的:1、客户上传Word文档到服务器2、服务器调用OpenOffice程序打开上传的Word文档3、OpenOffice将Word文档另存为Html格式4、Over至此可见.Pattern.getTime()+ ".util;import java.io.FileInputStream.artofsolving.jodconverter,调用cmd.io.InputStreamReader;import java.net.ConnectException;import com.artofsolving,port=8100,你懂的; 连接con.connect();} catch (ConnectException e) {System..查看代码package com.mzule.doc2html.println(toHtmlString(new File(".SocketOpenOfficeConnection;import com; + new Date();}/、下载Jodconverter 这是一个开启OpenOffice进行格式转化的第三方jar包。
3、泡杯热茶。
** @param docFile* 需要转换的文档* @param filepath* 文档中图片的保存位置* @return 转换成功的html代码*/.util.Date;);//"*** 将word转换成html文件,并且获取html文件代码, "C:/test"return htmlFile.openoffice.connection。
恩.io.FileNotFoundException;import java.io.artofsolving.jodconverter、Coding..out;import java;import java,2.openoffice.converter.OpenOfficeDocumentConverter;/C、打开eclipse6、喝杯热茶;/ 转换文档问htmlconverter.convert(docFile, htmlFile):C.regex.org 3\.println(" 关闭openoffice连接con.disconnect().BufferedReader;import java.io.openoffice.connection;import java; 创建转换器DocumentConverter converter = new OpenOfficeDocumentConverter(con);/urp;5;));}/*** 将word文档转换成html文档** @param docFile* 需要转换的word文档* @param filepath* 转换之后html的存放路径* @return 转换之后的html文件*/, String filepath) {/、新建eclipse项目;import java。
7,导入Jodconverter/lib 下得jar包.html".File;import java.io;/ 创建保存html的文件File htmlFile = new File(filepath + "/.IOException:/test/public static File convert(File docFile.util.regex.Matcher;import java.util.jodconverter.DocumentConverter;import com.OpenOfficeConnection;import com;test.doc"public static String toHtmlString(File docFile, String filepath) {// 转换word文档File htmlFile = convert(docFile, filepath);// 获取html文件流StringBuffer htmlSb = new StringBuffer();try {BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream(htmlFile)));while (br.ready()) {htmlSb.append(br.readLine());}br.close();// 删除临时文件htmlFile.delete();} catch (FileNotFoundException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();}// HTML文件字符串String htmlStr = htmlSb.toString();// 返回经过清洁的html文本return clearFormat(htmlStr, filepath);}/*** 清除一些不需要的html标记** @param htmlStr* 带有复杂html标记的html语句* @return 去除了不需要html标记的语句*/protected static String clearFormat(String htmlStr, String docImgPath) {// 获取body内容的正则String bodyReg = "";Pattern bodyPattern = Pattern.compile(bodyReg);Matcher bodyMatcher = bodyPattern.matcher(htmlStr);if (bodyMatcher.find()) {// 获取BODY内容,并转化BODY标签为DIVhtmlStr = bodyMatcher.group().replaceFirst("", "");}// 调整图片地址htmlStr = htmlStr.replaceAll("转换成保留样式// content = content.replaceAll("(]*>.*?)()",// "");// 把转换成并删除样式htmlStr = htmlStr.replaceAll("(]*)(>.*?)()", "");// 删除不需要的标签htmlStr = htmlStr.replaceAll("]*?>","");// 删除不需要的属性htmlStr = htmlStr.replaceAll("]*)(?:lang|LANG|class|CLASS|style|STYLE|size|SIZE|face|FACE|[ovwxpOVWXP]:\\w+)=(?:"[^"]*"|\"\"[^\"\"]*\"\"|[^>]+)([^>]*)>","");return htmlStr;}},这要求服务器端安装OpenOffice软件,不过OpenOffice的优势是跨平台 展开
openoffice在word转换pdf时出现 conversion failed: could not load input ...
单击“开始”、单击“运行”(或者win+R键),键入%appdata%\Microsoft\Document Building Blocks\1033如果是Building Blocks.dotx 模板毁坏或损坏,Building Blocks.dotx 模板有两份副本。
一份副本保存在您的用户数据文件夹中。
另一份副本保存在 Office 12 文件夹的“文档部件”文件夹中。
%appdata%\Microsoft\Document Building Blocks\1033%programfiles%\Microsoft Office\Office12\Document Parts\1033需要移除以下两个文件夹的Building Blocks.dotx 模板来修复xml 文件无法打开的问题。
另也可以使用微软自动修复工具MicrosoftFixit50722.msi修复此问题
为什么 freemarker 生成的word openoffice 打不开
1.问:WORD里边怎样设置每页不同的页眉?如何使不同的章节显示的页眉不同? 答:分节,每节可以设置不同的页眉。
文件——页面设置——版式——页眉和页脚——首页不同 2.问:请问word中怎样让每一章用不同的页眉?怎么我现在只能用一个页眉,一改就全部改了?答:在插入分隔符里,选插入分节符,可以选连续的那个,然后下一页改页眉前,按一下“同前”钮,再做的改动就不影响前面的了。
简言之,分节符使得它们独立了。
这个工具栏上的“同前”按钮就显示在工具栏上,不过是图标的形式,把光标移到上面就显示出”同前“两个字来了 3.问:如何合并两个WORD文档,不同的页眉需要先写两个文件,然后合并,如何做?答:页眉设置中,选择奇偶页不同/与前不同等选项 4.问:WORD编辑页眉设置,如何实现奇偶页不同? 比如:单页浙江大学学位论文,这一个容易设;双页:(每章标题),这一个有什么技巧啊 ?答:插入节分隔符,与前节设置相同去掉,再设置奇偶页不同 5.问:怎样使WORD文档只有第一页没有页眉,页脚?答:页面设置-页眉和页脚,选首页不同,然后选中首页页眉中的小箭头,格式-边框和底纹,选择无,这个只要在“视图”——“页眉页脚”,其中的页面设置里,不要整个文档,就可以看到一个“同前”的标志,不选,前后的设置情况就不同了。
6.问:如何从第三页起设置页眉?答:在第二页末插入分节符,在第三页的页眉格式中去掉同前节,如果第一、二页还有页眉,把它设置成正文就可以了 ●在新建文档中,菜单—视图—页脚—插入页码—页码格式—起始页码为0,确定; ●菜单—文件—页面设置—版式—首页不同,确定; ●将光标放到第一页末,菜单—文件—页面设置—版式—首页不同—应用于插入点之后,确定。
第2步与第三步差别在于第2步应用于整篇文档,第3步应用于插入点之后。
这样,做两次首页不同以后,页码从第三页开始从1编号,完成。
7.问:WORD页眉自动出现一根直线,请问怎么处理?答:格式从“页眉”改为“清除格式”,就在“格式”快捷工具栏最左边;选中页眉文字和箭头,格式-边框和底纹-设置选无 8.问:页眉一般是---------,上面写上题目或者其它,想做的是把这根线变为双线,WORD中修改页眉的那根线怎么改成双线的?答:按以下步骤操作去做: ●选中页眉的文字,包括最后面的箭头 ●格式-边框和底纹 ●选线性为双线的 ●在预览里,点击左下小方块,预览的图形会出现双线 ●确定▲上面和下面自己可以设置,点击在预览周围的四个小方块,页眉线就可以在不同的位置 9.问:Word中的脚注如何删除?把正文相应的符号删除,内容可以删除,但最后那个格式还在,应该怎么办?答:步骤如下:1、切换到普通视图,菜单中“视图”——“脚注”,这时最下方出现了尾注的编辑栏。
2、在尾注的下拉菜单中选择“尾注分隔符”,这时那条短横线出现了,选中它,删除。
3、再在下拉菜单中选择“尾注延续分隔符”,这是那条长横线出现了,选中它,删除。
4、切换回到页面视图,尾注和脚注应该都是一样的 10.问:Word 里面有没有自动断词得功能?常常有得单词太长了,如果能设置一下自动断词就好了答:在工具—语言—断字—自动断字,勾上,word还是很强大的 11.问:如何将word文档里的繁体字改为简化字?答:工具—语言—中文简繁转换 12.问:怎样微调WORD表格线?WORD表格上下竖线不能对齐,用鼠标拖动其中一条线,可是一拖就跑老远,想微调表格竖线让上下对齐,请问该怎么办?答:选定上下两个单元格,然后指定其宽度就可以对齐了,再怎么拉都行press "Alt",打开绘图,其中有个调整坐标线,单击,将其中水平间距与垂直间距都调到最小值即可。
打开绘图,然后在左下脚的绘图网格里设置,把水平和垂直间距设置得最小。
13.问:怎样微调word表格线?我的word表格上下竖线不能对齐,用鼠标拖动其中一条线,可是一拖就跑老远,我想微调表格竖线让上下对齐,请问该怎么办? 答:可以如下操作:●按住ctl键还是shift,你have a try ●double click the line, try it ●打开绘图,设置一下网格(在左下角)。
使水平和垂直都为最小,试一把! ●press "Alt" 14.问:怎么把word文档里已经有的分页符去掉?答:先在工具——> 选项——> 视图——> 格式标记,选中全部,然后就能够看到分页符,delete就ok了。
15.问:Word中下标的大小可以改的吗?答:格式—字体 16.问:Word里怎么自动生成目录啊?答:用“格式>>样式和格式”编辑文章中的小标题,然后插入->索引和目录 17.问:Word的文档结构图能否整个复制? 论文要写目录了,不想再照着文档结构图输入一遍,有办法复制粘贴过来吗?答:可以自动生成的,插入索引目录。
18.问:做目录的时候有什么办法时右边的页码对齐?比如: 1.1 标题...............................1 1.2 标题...............................2答:画表格,然后把页码都放到一个格子里靠右或居中,然后让表格的线条消隐就可以了,打印出来就很整齐。
19.问:怎样在word中将所有大写字母转为小写?比如一句全大写的转为全小写的答:格式->更改大小写->小写 20.问:在存...
我的word2007只有在自己电脑上能打开,在别的电脑上打开就显示无...
需要修复2007 Office请按照下列步骤操作:1 退出所有 2007 Office 程序。
2 依次单击“开始”、“运行”,键入 %userprofile%\Application Data\Microsoft\Document Building Blocks\1033,然后单击“确定”。
3 右键单击“Building Blocks.dotx”,然后单击“重命名”。
4 将文件重命名为 Building Blocks.OLD。
5 依次单击“开始”、“运行”,键入 %programfiles%\Microsoft Office\Office12\Document Parts\1033,然后单击“确定”。
6 右键单击“Building Blocks.dotx”,然后单击“重命名”。
7 将文件重命名为 Building Blocks.OLD。
8 关闭这两个文件夹。
9 依次单击“开始”、“运行”,键入 appwiz.cpl,然后单击“确定”。
10 在“当前安装的程序”列表中,单击安装在计算机上的 2007 Office 的版本。
或者,如果在计算机上安装了独立版本,则单击 Word 2007 的版本。
11 单击“更改”,单击“修复”,然后单击“继续”。
-
给我们打电话
7*24小时服务热线:1399999999
全国客服热线:400-0000-000 -
百度地图
福建省漳州市 -
给我们发邮件
E-mail:[email protected]
在线沟通