文章插图
文章插图
在实际的开发中都会遇到 Java操作word文档,pdf文档,excel表格,以实现基本的功能和需要 。如果没有接触之前,我们无从下手,今天我就对这些操作用什么工具或者方法做一些简单的陈述,以便可以直接查找对应的资料 。
Java操作word文档:
【免费word在线编辑插件 在线word编辑器 开源】Java 操作word,对word文档进行读写时,主要用 Apache写的POI这个工具类,网上有POI对用的API和文档,在自己实际的项目中可以查找对应的API进行对应的操作 。特别注意的是: word 文档分03版和07版的,doc和docx两种,这两种读取的方式是不同的 。以.docx文件结尾实际上也是压缩文件,当你把docx后缀名改成.zip,然后解压可以看到很多xml文件,实际上读取docx文档就是解析xml文档 。不相信的可以自己尝试 。
把docx改成为zip 的效果图
1 什么是Apache POI
全称Apache POI,使用Java编写的免费开源的跨平台的Java API 。是创建和维护操作各种符合 Office Open XML(OOXML)标准和微软的 OLE 2 复合文档格式(OLE2)的 Java API 。用它可以使用 Java 读取和创建, 修改 MS Excel 文件. 而且, 还可以使用 Java 读取和创建 MS Word 和 MSPowerPoint 文件 。Apache POI 提供 Java 操作 Excel 解决方案(适用于 Excel97-2008) 。
2 Apache POI的组件
Apache POI包含用于MS-Office的所有OLE2复合文档的类和方法 。此API的组件列表如下:
附上一个简单的代码: POIFS:此组件是所有其他POI元素的基本因素 。它用于显式读取不同的文件 。HSSF:用于读取和写入.xls格式的MS-Excel文件 。XSSF(XML SpreadSheet格式):用于MS-Excel的.xlsx文件格式 。HPSF:用于提取MS-Office文件的属性集 。HWPF:用于读取和写入MS-Word的.doc扩展文件 。XWPF(XML字处理器格式):用于读取和写入MS-Word的扩展文件 .docx。HSLF:用于阅读,创建和编辑PowerPoint演示文稿 。HDGF(Horrible DiaGram格式):它包含MS-Visio二进制文件的类和方法 。HPBF(Horrible PuBlisher格式):用于读取和写入MS-Publisher文件 。
packagecom.lq.readDoc;importorg.apache.poi.hwpf.extractor.WordExtractor;importorg.apache.poi.ooxml.POIXMLDocument;importorg.apache.poi.ooxml.extractor.POIXMLTextExtractor;importorg.apache.poi.openxml4j.opc.OPCPackage;importorg.apache.poi.xwpf.extractor.XWPFWordExtractor;importjava.io.File;importjava.io.FileInputStream;importjava.io.IOException;importjava.io.InputStream;/***读取文档中的doc和docx的内容*/publicclassReadDocUtils{publicstaticStringReadDoc(Stringpath)throwsIOException{Stringresullt="";//首先判断文件中的是doc/docxtry{if(path.endsWith(".doc")){InputStreamis=newFileInputStream(newFile(path));WordExtractorre=newWordExtractor(is);resullt=re.getText();re.close();}elseif(path.endsWith(".docx")){OPCPackageopcPackage=POIXMLDocument.openPackage(path);POIXMLTextExtractorextractor=newXWPFWordExtractor(opcPackage);resullt=extractor.getText();extractor.close();}else{System.out.println("此文件不是word文件");}}catch(Exceptione){e.printStackTrace();}returnresullt;}}
Java 操作PDF文档:Java 操作PDF文档使用Itext 工具类比较方便,可以替换文字,上传图片,进行word和PDf之间的转化 。网上有对应的文档和API,可以自己查找封装工具类 。
Java 操作Excel表格:
Java 操作Excel: 目前我了解到的主要工具类有两个,一个是Apache的POI,另一个是Alibaba 开源的EasyExcel,EasyExcel解决了 POI 中存在的问题,如果要excel数据量很小,可以用Apache下的,如何是海量数据,建议用EasyExcel,他又很多优势 。
EasyExcel的核心功能
读任意大小的03、07版Excel不会OOM读Excel自动通过注解,把结果映射为java模型读Excel支持多sheet读Excel时候是否对Excel内容做trim()增加容错写小量数据的03版Excel(不要超过2000行)写任意大07版Excel不会OOM写Excel通过注解将表头自动写入Excel写Excel可以自定义Excel样式 如:字体,加粗,表头颜色,数据内容颜色写Excel到多个不同sheet写Excel时一个sheet可以写多个Table写Excel时候自定义是否需要写表头
- 有没有免费的U盘数据恢复软件 u盘免费恢复数据的软件
- u盘数据恢复软件哪个好 u盘数据恢复软件哪个好用免费
- u盘数据恢复软件哪个好 真正免费u盘数据恢复软件
- 哪个免费的pdf编辑器好用 pdf免费编辑软件哪个好
- Adobe下载网站 adobe官方网站adobe免费下载
- 免费项目管理系统 免费的项目管理软件有哪些
- 免费恢复U盘数据的软件有哪些 免费好用的u盘数据恢复软件
- mov格式转换mp4格式 mov格式的视频在线转换mp4
- 语音合成软件免费版下载 免费的语音合成软件
- 免费恢复u盘文件 U盘数据恢复软件免费版