自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(0)
  • 资源 (33)
  • 收藏
  • 关注

空空如也

Spire的相关产品

Spire相关产品 Free Spire.Doc for Java_3.9.0.zip + Spire.Pdf-FE_3.9.0.zip

2021-02-09

aspose资源相关信息

aspose资源 aspose-cells-8.6.3.jar + aspose-words-16.8.0-javadoc.jar + aspose-words-16.8.0-jdk16.jar + aspose-words-18.6-jdk16.jar

2021-02-09

cas_project.zip

内部还有源代码,和相关的配置文档,希望都大家学习cas有帮助,主要cas的版本为5.2.3,你有客户端和服务端的代码,同时项目还有自定义登录和自定义返回,自定义定制页面等

2020-03-28

tts 语音合成&语音转文字

科大讯飞的API demo 实现文字转语音 语音转文字,语义分析,但是需要网络,因为语音库还是科大讯飞上

2018-09-26

php5apache2_2.dll

php5apache2_2.dll 和 php5apache2.dll 提供,解决PHP集成问题

2018-03-12

最全VISIO图标集-附网络拓扑图实例

最全VISIO图标集-附网络拓扑图实例 特别漂亮的图片,方便大家画网络架构图

2018-02-09

制定网页的插件

控件拖拉生成网页,自带布局,并可以保存,目前保存在浏览器的存储中。

2017-10-23

制定流程图插件

制定流程图插件,拖拉生成工作流,流程图,并支持保存功能。

2017-10-23

Android开发的实例

基于Android 开发的登陆界面,滑动页面,树形结构,viwelist等页面效果 以及一些特定功能如 二维码 条纹码的生成和扫描,GPS定位,wifi定位,基站定位 和外部系统交互的方式如WEBSERICE,HTTP等 基于混合模式开发的采用phonegap开发,如照相机调用,数据库操作,地图的调用等等 我对这个还会陆续的开发,以后在给大家分享更多的移动开发技术

2013-11-30

Android 操作读取并解析二维码(内包括所需的包)

Android 操作读取并解析二维码包括照相处理 解析二维码条纹码并显示内容

2013-03-14

.Net 对于MSN的操作包括用户的读取等等

.Net 对于MSN的操作包括用户的读取等等

2013-03-14

Android配合WebService(包含包)

Android配合WebService例子和需要的包,希望大家学习有帮助,

2012-09-27

.NET 技术XML加密解密技术

.NET 技术XML加密解密技术

2012-09-17

commons-digester

commons-digester

2012-02-28

二维码的生成和解析

二维码的生成和解析

2012-02-19

IVR 文档和工具

IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具IVR 文档和工具

2011-11-02

cit的源代码 c++的

cit的源代码 c++的cit的源代码 c++的cit的源代码 c++的cit的源代码 c++的cit的源代码 c++的cit的源代码 c++的cit的源代码 c++的cit的源代码 c++的cit的源代码 c++的cit的源代码 c++的cit的源代码 c++的cit的源代码 c++的cit的源代码 c++的cit的源代码 c++的cit的源代码 c++的cit的源代码 c++的cit的源代码 c++的cit的源代码 c++的

2011-11-02

jquery+file+ajax+upload

jquery+file+ajax+upload

2011-10-06

仿世纪佳缘网ASP+SQL

仿世纪佳缘网ASP+SQL仿世纪佳缘网ASP+SQL仿世纪佳缘网ASP+SQL

2011-04-07

爱情公寓整站程序(修改+完整版)ASP+MSSQL

爱情公寓整站程序(修改+完整版)ASP+MSSQL爱情公寓整站程序(修改+完整版)ASP+MSSQL爱情公寓整站程序(修改+完整版)ASP+MSSQL爱情公寓整站程序(修改+完整版)ASP+MSSQL

2011-04-07

jeecms,很好用的CMS系统

可以那他直接做网站开发,功能强大,基本上的网站功能全部具备。并有开发相关文档

2011-04-07

Linux下JAVA开发环境的搭建

Linux下JAVA开发环境的搭建Linux下JAVA开发环境的搭建

2011-03-23

Subversion Installation guide

Subversion Installation guide

2011-03-23

java文件传输客户端服务器

文件传输文件传输文件传输文件传输文件传输

2011-01-11

JAVA双向语音通信

JAVA双向语音通信,JAVA双向语音通信,JAVA双向语音通信

2010-11-20

XFire建立Webservice实例

XFire建立Webservice实例

2010-11-04

axis2-1.4.1

axis2-1.4.1-war.zip 直接运行的包

2010-11-04

javaee_6.0.jar

javaee

2010-11-04

axis2 webservice 项目

axis2 webservice 项目 下载 官方 axis2 webservice 项目 下载 官方

2010-04-15

WSDL2Java tools

WSDL2Java 例子和工具 WSDL2Java 例子和工具

2010-04-15

Heritrix部署直接能运行的项目

Heritrix是IA的开放源代码,可扩展的,基于整个Web的,归档网络爬虫工程 Heritrix工程始于2003年初,IA的目的是开发一个特殊的爬虫,对网上的 资源进行归档,建立网络数字图书馆,在过去的6年里,IA已经建立了400TB的数据。 IA期望他们的crawler包含以下几种: 宽带爬虫:能够以更高的带宽去站点爬。 主题爬虫:集中于被选择的问题。 持续爬虫:不仅仅爬更当前的网页还负责爬日后更新的网页。 实验爬虫:对爬虫技术进行实验,以决定该爬什么,以及对不同协议的爬虫爬行结果进行分析的。 Heritrix的主页是http://crawler.archive.org Heritrix是一个爬虫框架,可加如入一些可互换的组件。 它的执行是递归进行的,主要有以下几步: 1。在预定的URI中选择一个。 2。获取URI 3。分析,归档结果 4。选择已经发现的感兴趣的URI。加入预定队列。 5。标记已经处理过的URI Heritrix主要有三大部件:范围部件,边界部件,处理器链 范围部件:主要按照规则决定将哪个URI入队。 边界部件:跟踪哪个预定的URI将被收集,和已经被收集的URI,选择下一个URI,剔除已经处理过的URI。 处理器链:包含若干处理器获取URI,分析结果,将它们传回给边界部件 Heritrix的其余部件有: WEB管理控制台:大多数都是单机的WEB应用,内嵌JAVA HTTP 服务器。 操作者可以通过选择Crawler命令来操作控制台。 Crawler命令处理部件:包含足够的信息创建要爬的URI。 Servercache(处理器缓存):存放服务器的持久信息,能够被爬行部件随时 查到,包括IP地址,历史记录,机器人策略。 处理器链: 预取链:主要是做一些准备工作,例如,对处理进行延迟和重新处理,否决随后的操作。 提取链:主要是获得资源,进行DNS转换,填写请求和响应表单 抽取链:当提取完成时,抽取感兴趣的HTML,JavaScript,通常那里有新的也适合的URI,此时URI仅仅被发现,不会被评估 写链:存储爬行结果,返回内容和抽取特性,过滤完存储。 提交链:做最后的维护,例如,测试那些不在范围内的,提交给边界部件 Heritrix 1.0.0包含以下关键特性: 1.用单个爬虫在多个独立的站点一直不断的进行递归的爬。 2。从一个提供的种子进行爬,收集站点内的精确URI,和精确主机。 3。主要是用广度优先算法进行处理。 4。主要部件都是高效的可扩展的 5。良好的配置,包括: a。可设置输出日志,归档文件和临时文件的位置 b。可设置下载的最大字节,最大数量的下载文档,和最大的下载时间。 c。可设置工作线程数量。 d。可设置所利用的带宽的上界。 e。可在设置之后一定时间重新选择。 f。包含一些可设置的过滤机制,表达方式,URI路径深度选择等等。 Heritrix的局限: 1。单实例的爬虫,之间不能进行合作。 2。在有限的机器资源的情况下,却要复杂的操作。 3。只有官方支持,仅仅在Linux上进行了测试。 4。每个爬虫是单独进行工作的,没有对更新进行修订。 5 。在硬件和系统失败时,恢复能力很差。 6。很少的时间用来优化性能。

2009-11-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除