自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(0)
  • 资源 (7)
  • 收藏
  • 关注

空空如也

横瓜数据库全文检索中间件

横瓜数据库全文检索中间件全套软件,英文名称HdMap,可让你轻松将自己的数据库文件架构成全文搜索引擎,你无需对自己的数据库文件做任何更改,就可以为数据库文件创建可供编程语言调用的ActiveX DLL全文检索接口,可用于任何与数据库检索有关的查询,例如全文搜索、垂直搜索、海量数据库LIKE式快速查询等。软件主要特点如下: (1)支持目前所有主流数据库(例如Access、SQL_server、Oracle、MySQL、DB2等),这些数据库文件都可以被架构成全文检索,HdMap并且支持异构数据库、多数据库,最多可容纳200个任意类型的数据库,但每个数据库须少于999万条记录。 (2)中间件接口支持目前所有主流编程语言调用(例如PHP、ASP、VB、VC、Delphi、C#等),程序员可在HdMap基础上用几十行代码打造出亿级规模的搜索引擎来。而对于打造堪比百度规模的搜索引擎,你也只缺少分布式通讯模块的编写。 (3)HdMap采用最大右匹配分词切词技术、倒排技术、MD5摘要信息抽取技术、硬盘整理加速技术、中文海量词典查询技术、HTM转换TXT技术、ActiveX DLL中间件技术、实时增量索引技术等。分词速度约为2500万字/分钟,约占99.984%关键词检索时间小于0.001秒。最低PC配置内存2G、主频1G、NTFS文件系统、中高档转速硬盘、WINDOW系列操作系统。 (4)绿色软件解压即可使用,软件使用前先执行Setup.exe以安装system32支持库。 (5)HdMap基础词典已用MD5加密封装,用户可在dic.txt中自由添加新词典,新词被添加到dic.txt后,被检索的几率变大。若不添加新词,也可以被检索到,只是几率稍小些。 (6)若要使用HdMap必须确保网络可以连接。此外不得将本软件用于赢利目的、销售他人、非法用途等,否则将会被追究法律责任。搜索引擎开发及合作,请联系QQ(601069289)。

2010-12-29

横瓜文件FTP下载资源搜索服务器V3.2

软件介绍: 横瓜文件FTP下载资源搜索服务器,主要用来架构图片搜索下载、视频搜索下载、图书搜索下载、 软件搜索下载、电影搜索下载、MP3搜索下载、音乐搜索下载、游戏搜索下载等任何资源文件的 搜索下载服务器。最大并发连接数可达1000,仅依靠一台PC服务器,就可同时为1000个客户提供 负载均衡的并发下载服务和检索服务,同时支持断点续传下载、迅雷下载、快车下载、IE浏览器 HTTP下载等,在负载均衡方面,将迅雷快车等软件的风暴下载技术斩断成普通HTTP下载,实现了 全体资源文件公平公正均衡下载的目标,节省了资源服务商带宽,提高了并发数量。单个被下载 文件最大可达2G字节,文件检索数量最多可达2000万个文件,扫描文件速度约2000个文件/秒, 分词速度2500万字/分钟,平均检索时间小于0.001秒。对于10万个文件,可在50秒内完成所有 架构工作。横瓜采用横瓜分布式Map数据库技术、分词索引技术、最大左匹配切词技术、倒排技术、 MD5摘要信息抽取技术、新词智能识别技术、硬盘整理加速技术、疑似垂直搜索技术、中文海量 词典技术、横瓜HTTP检索服务器web-search缓存技术、HTM转换TXT技术等,横瓜是根据文件名进行 检索的,是基于Windows平台的WEB服务器软件系统,用来提供超大文件下载服务和检索服务。横瓜 PC硬件最低配置,需要700M内存、空闲硬盘空间1G、文件系统NTFS。 搜索引擎开发及合作,请联系QQ(601069289) 安装说明: 1、第一次使用软件前,先执行Setup.exe。程序add.exe、title.exe为系统内核,勿动! 2、架构搜索步骤:先将资源文件放在当前目录下的'file'文件夹('file'文件夹内可以随意组织 子文件夹),然后单击websearch.exe程序的按钮"创建索引",若标签提示分词完成,就可单击按钮 "WWW查询"使用检索查询服务了。若硬盘文件有变动,可重新单击"创建索引"来更新检索系统。 3、websearch.exe可实现扫描、索引、分词等,若要执行HTTP检索下载服务,websearch.exe须挂机。 4、websearch.exe挂机后,从IE中输入"http://IP地址或域名:7777/"可检索查询。在www目录下, 存有搜索引擎的主页和LOGO,客户可以根据个性需要自行修改。 5、使用本软件,必须开放端口:7000、7001、70002、70003、70004、7777、7778 6、本软件使用的基础词典已经用MD5加密封装,用户可以在dic.txt中自由添加新词,新词被添加到 dic.txt后,被检索的几率变大。若不添加新词,也可以被检索到,只是几率稍小些。 7、不得将本软件用于赢利目的、销售他人、非法用途等,否则将会被追究法律责任。 搜索引擎开发及合作,请联系QQ(601069289)

2010-08-30

横瓜垂直搜索引擎V3.2-横瓜Windows平台的垂直搜索引擎

软件介绍: 横瓜垂直搜索引擎,是Windows平台的垂直搜索引擎(不提供网络爬虫),最大可容量6000万条记录。 对于100万条记录规模的数据库,可在2分钟内完成所有架构工作。横瓜垂直搜索引擎分词速度约为 2500万字/分钟,约占99.984%的关键词检索时间小于0.001秒。横瓜垂直搜索引擎的PC硬件配置, 仅需要700M内存、空闲硬盘10G、文件系统NTFS。横瓜垂直搜索引擎采用横瓜分布式Map数据库技 术、分词索引技术、最大左匹配切词技术、倒排技术、MD5摘要信息抽取技术、新词智能识别技术、 硬盘整理加速技术、疑似全文搜索技术、中文海量词典技术、横瓜HTTP检索服务器web-search缓存 技术、HTM转换TXT技术等。 搜索引擎开发及合作,请联系QQ(601069289) 安装说明: 1、第一次使用软件前,先执行Setup.exe。程序add.exe、body.exe、title.exe为系统内核,勿动! 2、架构搜索步骤:须依次单击websearch.exe程序中的按钮"数据清零"、"导入记录"、"标题分词"、 "正文分词"、"WWW查询"。若只对标题分词,无需单击按钮"正文分词"即可。 3、数据清零。建立新的搜索之前,须单击"数据清零"按钮来清除旧数据和旧索引。 4、websearch.exe可管理记录、索引、分词等,若要执行HTTP检索查询服务,websearch.exe须挂机。 5、数据导入。在web目录下,有Access格式的输入接口文件web.mdb(字段id取值越小排名越靠前)。 将待处理数据输入到web.mdb后,单击“导入记录”按钮,web.mdb中的记录被导入到web.dat。在检 索时直接从web.dat取记录,web.mdb仅起接口作用,导入完成后可自愿删留。对于增量记录,可允许 从web.mdb中多次导入新记录,但新增量的记录,检索排名靠后,增量导入后,须再依次单击按钮 "标题分词"、"正文分词"后,才能被检索到。 6、websearch.exe挂机后,从IE中输入"http://IP地址或域名:7777/"可检索查询。在www目录下, 存有搜索引擎的主页和LOGO,客户可以根据个性需要自行修改。 7、使用本软件,必须开放端口:7000、7001、70002、70003、70004、7777、7778 8、本软件使用的基础词典已经用MD5加密封装,用户可以在dic.txt中自由添加新词,新词被添加到 dic.txt后,被检索的几率变大。若不添加新词,也可以被检索到,只是几率稍小些。 9、web目录中web.mdb的记录(制药企业名录)是赠送测试用的,可将待处理数据输入“模板web.mdb” 替换该文件。 10、不得将本软件用于赢利目的、销售他人、非法用途等,否则将会被追究法律责任。 搜索引擎开发及合作,请联系QQ(601069289)

2010-08-30

横瓜全文搜索引擎v3.2-是基于Windows平台的全文搜索引擎

软件介绍: 横瓜全文搜索引擎,是基于Windows平台的全文搜索引擎(不提供网络蜘蛛),最大容量150万网页。 对于150万网页规模的数据,可在30分钟内完成所有架构工作。横瓜全文搜索引擎分词速度约为 2500万字/分钟,约占99.984%的关键词检索时间小于0.001秒。横瓜全文搜索引擎的PC硬件配置, 仅需要700M内存、空闲硬盘10G、文件系统NTFS。横瓜全文搜索引擎采用横瓜分布式Map数据库技 术、分词索引技术、最大左匹配切词技术、倒排技术、MD5摘要信息抽取技术、新词智能识别技术、 硬盘整理加速技术、疑似垂直搜索技术、中文海量词典技术、横瓜HTTP检索服务器web-search缓存 技术、HTM转换TXT技术等。 搜索引擎开发及合作,请联系QQ(601069289) 安装说明: 1、第一次使用软件前,先执行Setup.exe。程序add.exe、body.exe、title.exe为系统内核,勿动! 2、架构搜索步骤:须依次单击websearch.exe程序中的按钮"数据清零"、"导入记录"、"标题分词"、 "正文分词"、"WWW查询"。 3、数据清零。建立新的搜索之前,须单击"数据清零"按钮来清除旧数据和旧索引。 4、websearch.exe可管理记录、索引、分词等,若要执行HTTP检索查询服务,websearch.exe须挂机。 5、数据导入。在web目录下,有Access格式的输入接口文件web.mdb(字段id取值越小排名越靠前)。 将待处理数据输入到web.mdb后,单击“导入记录”按钮,web.mdb中的记录被导入到web.dat。在检 索时直接从web.dat取记录,web.mdb仅起接口作用,导入完成后可自愿删留。对于增量记录,可允许 从web.mdb中多次导入新记录,但新增量的记录,检索排名靠后,增量导入后,须再依次单击按钮 "标题分词"、"正文分词"后,才能被检索到。 6、websearch.exe挂机后,从IE中输入"http://IP地址或域名:7777/"可检索查询。在www目录下, 存有搜索引擎的主页和LOGO,客户可以根据个性需要自行修改。 7、使用本软件,必须开放端口:7000、7001、70002、70003、70004、7777、7778 8、本软件使用的基础词典已经用MD5加密封装,用户可以在dic.txt中自由添加新词,新词被添加到 dic.txt后,被检索的几率变大。若不添加新词,也可以被检索到,只是几率稍小些。 9、web目录中web.mdb的记录是赠送测试用的,可以将待处理数据输入“模板web.mdb”替换该文件。 10、不得将本软件用于赢利目的、销售他人、非法用途等,否则将会被追究法律责任。 搜索引擎开发及合作,请联系QQ(601069289)

2010-08-30

横瓜硬盘搜索v3.2_可对全盘所有文件实现检索

横瓜硬盘搜索,可对全盘所有文件实现检索,全盘每一个文件的路径名和文件名都要被分词索引。 横瓜硬盘搜索,是基于Windows平台的搜索引擎,最大容量可检索2000万硬盘文件的路径名和文件名。 对于存有10万个文件规模的硬盘,可在50秒内完成所有架构工作。横瓜硬盘搜索,扫描文件速度约 2000个文件/秒,分词速度2500万字/分钟,平均检索时间小于0.001秒。横瓜硬盘搜索PC硬件配置, 需要700M内存、空闲硬盘空间1G、文件系统NTFS。横瓜硬盘搜索引擎采用横瓜分布式Map数据库技 术、分词索引技术、最大左匹配切词技术、倒排技术、MD5摘要信息抽取技术、新词智能识别技术、 硬盘整理加速技术、疑似垂直搜索技术、中文海量词典技术、横瓜HTTP检索服务器web-search缓存 技术、HTM转换TXT技术等。横瓜硬盘搜索,可对全盘所有每一个文件实现检索,可以快速定位目标 文件,查找病毒文件、控件文件OCX、库文件DLL等敏感文件异常方便。为了避免冗余信息的膨胀, 横瓜硬盘搜索不对各文件的正文进行分词索引,专对全盘所有文件的路径名和文件名进行分词索引。 搜索引擎开发及合作,请联系QQ(601069289) 安装说明: 1、第一次使用软件前,先执行Setup.exe。程序add.exe、title.exe为系统内核,勿动! 2、架构搜索步骤:须依次单击websearch.exe程序中的按钮"创建索引"、"WWW查询"。若标签提示 分词完成,便可单击"WWW查询"使用检索查询服务。若硬盘文件有变动,可重新单击"创建索引"来 更新检索系统。 3、websearch.exe可实现扫描、索引、分词等,若要执行HTTP检索查询服务,websearch.exe须挂机。 4、在www目录下,存有搜索引擎的主页和LOGO,客户可以根据个性需要自行修改。 5、使用本软件,必须开放端口:7000、7001、70002、70003、70004、7777、7778 6、本软件使用的基础词典已经用MD5加密封装,用户可以在dic.txt中自由添加新词,新词被添加到 dic.txt后,被检索的几率变大。若不添加新词,也可以被检索到,只是几率稍小些。 7、不得将本软件用于赢利目的、销售他人、非法用途等,否则将会被追究法律责任。 搜索引擎开发及合作,请联系QQ(601069289)

2010-08-30

刨丁解羊中文分词器-主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词

刨丁解羊中文分词器,主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词,支持繁体中文分词、简体中文分词、英文分词,是制作通用搜索引擎和垂直搜索引擎的核心组件。该软件在普通PC机器上测试显示:TXT格式正文分词速度约为3000万字/分钟,网页分词速度约为277.8个网页/秒。该软件采用基础词库(63万词语)+扩展词库(用户可手工添加新词)。DLL及OCX调用请联系QQ(601069289)。

2010-08-30

刨丁解羊HTMl网页信息抽取器

刨丁解羊HTMl网页信息抽取器,是制作搜索引擎、网络蜘蛛、网络爬虫、分词索引的核心组件。采用人工智能启发式算法、高斯积分去噪算法,对HTML格式的源代码网页进行抽取,通过过滤无用的HTM标签、主题相悖信息,抽取出核心正文信息。DLL及OCX调用请联系QQ(601069289)。

2010-08-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除