自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 问答 (2)
  • 收藏
  • 关注

原创 字符串匹配所有子串坐标

最近一直在做一些文本内容处理,用的比较多,贴出来交流下,有更好的思路欢迎交流学习

2017-12-06 11:15:26 401

原创 docx文档表格抽取(openoffice)

引子之前使用word去抽取word中table并转成png,过程和思路就不多赘述了。由于office的局限性,这里使用了openoffice去实现word抽取table的功能。1.因为通过setTable生成新的文档会出现样式丢失的情况,所以这里我们需要记录下table的index并且移除除了index位置的Element去获取新的table文档。/** * 获取表格数据 *

2017-07-04 10:41:59 1165

原创 docx文档表格抽取(word)

最近在做一个知识库系统,遇到了用户需求是要抽取出word中的表格。大家都知道用poi抽取出来的table没有格式只包含文本内容,所以这里我用 word表格提取—》表格单存为word-》word转pdf-》pdf转图片-》表格文本替换为图片url 这个思路来实现。话不多说,下面上代码

2017-06-29 17:04:15 1423

翻译 HSLF操作PPT

最近做到的一个项目,需要对ppt文档进行解析,网上找了半天也没有合适的中文文档,这里对poi的hslf进行的翻译

2017-03-03 10:48:35 7641

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除