自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

转载 Html转义字符表

特殊字符 字符   十进制   转义字符    "   "   "   &   &

2009-12-28 15:50:00 947

原创 HtmlParser使用心得

用 htmlparser1.6 解析html在解析了大量的html测试后发现了htmlparser的问题,称之为问题也不算是问题,因为htmlparser本身也预留了解决途径,其实这两个问题属于同一种问题:问题1:      当解析脚本时,如果脚本文本中出现如 时,当走到 他会认为到了,脚本分析完毕,导致后面的脚本文本被漏掉。问题2:      当解析 ,

2009-12-25 12:22:00 2277

原创 CR和LF,回车换行符心得

最近需要按行解析文本,所以要自动找到文本中的每一个换行符lineSeparator,原本以为lineSeparator==/r/n,所以就用/r/n分析文本,开始分析的是保存到本地的网页文件,得到的行数没错,没有问题!后来分析直接从网上读取的Html文件,得到的行数就有错了,问题来了。用/r/n作为分行符得到的行数会少于实际行数(我用编辑器打开直接看的)。这

2009-12-09 11:05:00 9610

原创 an unexpected error has been detected by java runtime environment

 本人在用jni调用.dll的时候,经常碰见这类问题,于是在网上查了相关的资料,但最终也没有找到最合理的解释,就整理一些思路:1 修改jvm的内存大小,把size增大一点2 呵呵 很感谢olivesoup和xql80329的关心。这个问题现在有所进展。大幅削减了Log输出后,已经4天没有crash了。由于用了一个第三方的Log工具,当时不知道这个Log工具会向 标准输出 也输出Log。

2009-11-06 18:18:00 1957

原创 Berkely DB Java Edition学习笔记

Berkely DB对于高并发、要求速度快的应用来说是个不错的选择,mysql就是用BDB实现的(mysql的后台) ,mysql快,BDB比mysql还要快N倍。BDB是一种嵌入式的、非关系数据库,它与其他的关系数据库RMDBS不同,它没有提供SQL,而是提供了自己的访问接口。作为一种嵌入式的数据库,它是进程内模式的,也就是说它和应用程序在同一内存空间运行,所以速度要高很多,与嵌入式的数据库如D

2009-10-28 10:07:00 1726

转载 http报头参数详解

 HTTP(HyperTextTransferProtocol)是超文本传输协议的缩写,它用于传送WWW方式的数据,关于HTTP 协议的详细内容请参 考RFC2616。HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求,请求头包含请求的方法、URI、协议版本、以及包含请求修饰符、客户 信息和内容的类似于MIME的消息结构。服务器以一个状态行作为响应,相应的内容包括消息协议的版本,成功

2009-09-16 16:20:00 29081 1

转载 互联网网站的反爬虫策略浅析

因为搜索引擎的流行,网络爬虫已经成了很普及网络技术,除了专门做搜索的Google,Yahoo,微软,百度以外,几乎每个大型门户网站都有自己的搜索 引擎,大大小小叫得出来名字得就几十种,还有各种不知名的几千几万种,对于一个内容型驱动的网站来说,受到网络爬虫的光顾是不可避免的。 一些智能的搜索引擎爬虫的爬取频率比较合理,对网站资源消耗比较少,但是很多糟糕的网络爬虫,对网页爬取能力很差,经常并发几十上百

2009-09-04 16:26:00 2195

原创 当 你 在 20 与 25 之 间 。

如果你到了20岁,还没到 25岁 作者:李开复 如果你已经过了20岁但还不到25岁的话,你必须找到除了爱情之外,能够使你用双脚坚强站在大地上的东西。 你要找到谋生的方式。 现在考虑不晚了。 我从来不以为学历有什么重要,天才都不是科班,但,不是科班,连龙套都跑不了。 你必须把那些浮如飘絮的思绪,渐渐转化为清晰的思路和简单的文字。 华丽和漂浮都不易长久。 你要知道,给予文字阅读快感不够

2009-08-28 08:41:00 1252

转载 程序累积性技巧心得

1、为了程序的健壮性 我们可能使用Integer.ValueOf(1)去代替new Integer(1); 2、return result.size() > 0;   代替if(result.size>0) return true; return false; 3、没必要这样 if(flag==true) ... 4、"const".eqauls(variable)代替 variable.eqau

2009-08-21 23:40:00 10567

转载 中文分词技术

 信息的飞速增长,使搜索引擎成为人们查找信息的首选工具,Google、百度、中国搜索等大型搜索引擎一直是人们讨论的话题。随着搜索市场价值的不断增加,越来越多的公司开发出自己的搜索引擎,阿里巴巴的商机搜索、8848的购物搜索等也陆续面世,自然,搜索引擎技术也成为技术人员关注的热点。  搜索引擎技术的研究,国外比中国要早近十年,从最早的Archie,到后来的Excite,以及altvista、ov

2009-08-14 21:25:00 1476

原创 嵌入式jetty的使用

 下载jetty-6.1.19.zip 注意:新版本的好多对象和方法都跟旧版本不一样,现在网上大多是以前的版本的例子,我的例子是最新版本的例子。 以我的经历来看,搞清楚导入那些jar包是非常重要的,是成功的关键,首先是这三个jar包,它是jetty支持自身语法的jar包jetty-6.1.19.jarjetty-util-6.1.19.jarservlet-api-2.5-20

2009-08-13 13:32:00 12757 1

原创 做梦也是个体力活

    白天折腾一天代码,晚上睡觉又做了一晚的梦,早晨起来感觉自己就没闲着,这个累!临床经验表明,不是万不得已千万别带着问题睡觉,尤其是缠你半天的问题,晚上睡觉都能把你整疯了。我的梦大概是这样的。   梦中场景:         抓耳挠腮的整一个问题,怎么都整不出来。经理来了,摸摸我的头很温柔的说:不想干了?我:....          接着回家了,身边几个亲近的人都特别冷漠

2009-07-31 09:43:00 1239

原创 请求http的返回状态码含义

1**:请求收到,继续处理2**:操作成功收到,分析、接受3**:完成此请求必须进一步处理4**:请求包含一个错误语法或不能完成5**:服务器执行一个完全有效请求失败100——客户必须继续发出请求101——客户要求服务器根据请求转换HTTP协议版本200——交易成功201——提示知道新文件的URL202——接受和处理、但处理未完成203——返回信息不确定或不完整204——请求收到,但返回信

2009-07-29 18:04:00 1515

转载 DOS命令大全

DOS命令字典 收藏 DOS命令字典..收藏 net use //ip/ipc$ " " /user:" " 建立IPC空链接 net use //ip/ipc$ "密码" /user:"用户名" 建立IPC非空链接 net use h: //ip/c$ "密码" /user:"用户名" 直接登陆后映射对方C:到本地为H: net use h: //ip/c$ 登陆后映射对方C:到本地为H:

2009-07-29 14:20:00 2040

原创 log4j输出多个自定义日志文件,动态配置路径

1.    log4j输出多个自定义日志文件  log4j的强大功能无可置疑,但实际应用中免不了遇到某个功能需要输出独立的日志文件的情况,怎样才能把所需的内容从原有日志中分离,形成单独的日志文件呢?其实只要在现有的log4j基础上稍加配置即可轻松实现这一功能。  先看一个常见的log4j.properties文件,它是在控制台和myweb.log文件中记录日志: log4j.r

2009-07-29 14:12:00 39003 14

转载 IT學習力[转]

 自從《執行力》一書暢銷之後,開始有很多書都流行取個「XX力」的名稱,我也仿效這些作風,弄個「IT學習力」。不管處於任何行業,都必須每隔一段時間充實自己的技能,以免被淘汰。對於IT界來說,技術的「半衰期」更是相當短,所以「IT學習力」相當重要。就如同CMM用五個層次來評估軟體成熟度一樣,我將IT學習力分成五個層次,分別描述如下:【幼稚班】這個等級的人,相當被動,不會主動注意IT新知,不會主

2009-07-29 13:57:00 1200

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除