自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (1)
  • 收藏
  • 关注

原创 空间搜索-射线法

在几何学中,PIP(Point in Polygon)问题即判断一点在多边形的内部或外部。射线法(Ray casting algorithm)是一种判断点是否在多边形内部的一种简单方法。即从该点做一条射线,计算它跟多边形边界的交点个数,如果交点个数为奇数,那么点在多边形内部,否则点在多边形外部。

2020-06-23 18:53:03 2111 1

原创 联想词搜索(suggest)

1 .智能搜索联想功能,baidu,google,各种电商都有这种搜索智能提示功能,可以帮助用户尽快找到自己想要的,用户是比较懒的,如下图所示用户输入 “数据结构”,联想出下面的结果以及结果数量2.实现原理这种联想功能有两种实现方式2.1 倒排索引比如说lucene的 suggest模块),而且性能也是问题。这里主要是通过字典树trie来实现的,效果很好,目前线上再使用的

2016-09-25 12:23:35 19987 2

原创 java解析word2003 doc文件中的表格

1;apache poi插件链接http://poi.apache.org/ 这个插件主要用于office文件文本内以及富文本(表格,图片)等的提取,还有支持对已知密码的office文件的提取, 其他格式的文件加密以及解密都有 见链接http://poi.apache.org/encryption.html因为之前做全文检索的时候需要提取word03里面的表格进行分析,使用这个插件对加密

2015-11-12 22:38:13 5054

poi-scratchpad-3.9

以前全文检索的时候涉及到一些富文本文件内容的提取,包括word系列,这里只涉及到word03的内容提取 程序需要提供文件密码,这里提取文件中的表格信息,具体解码算法可以看代码以及参考博客 链接 https://github.com/DusonWang/word95-03parse.git 参考项目代码http://sourceforge.net/projects/wvware/

2015-11-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除