- 博客(6)
- 资源 (61)
- 收藏
- 关注
原创 C#string数组去重方案
public static void Purge(ref ListneedToPurge) { for(int i=0;i { string deststring=needToPurge[i]; for(int j=i+1;j
2009-07-31 10:59:00 1135
原创 html 标签解嵌套
一:前言:网页源码中有很多嵌套的标签例如div标签嵌套如:[email protected]我们的网页解析工作中有时候需要解嵌套。通俗的讲就是把嵌套的标签以线性表的形式表示出来。还拿上面的例子来说明。即解嵌套为aurora [email protected] class=/"Cited1/">ggff核心代码如下: CodeCo
2009-07-31 10:57:00 806
原创 C#操纵大量数据表的一种方法菜鸟经验谈
问题描述:一个数据库中的某张表A有5,6万条记录。我们要对该表的每条记录做相同的处理,并将处理结果保存到表B。这时我们不能采用SqlDataReader读一条记录,处理,储存到表B的方案。因为sqldatareader对数据库连接具有独占性,所以我们就不能储存记录到表B了。还有一种方案是可行的,就是在内存中采用datatable数据结构映射一张A的虚表A‘,这种方法固然可行。但是这样做无疑是耗内存
2009-07-31 10:55:00 594 1
原创 http404 error的一种解决方案
需求分析:本人最近做一个项目,项目中需要从新闻的索引页(就是上面有很多链接的那种网页),获取新闻正文页源码,并将新闻正文页源码保存到本地数据库中。 但是由于网络稳定性的原因,总会出现 404 page not found 类型的error。(但是网页是确确实实存在的)。而且这种错误,往往是在程序运行一段时间后出现的,觉得很不可思议。我在网络上查这种问题的解决方案时,发现没有一种管用
2009-07-31 10:49:00 8018
原创 菜鸟练习C#htmlparser----C#正则加htmlDOM进行网页解析腾讯新闻帖子列表相关信息提取
适用网站有7.奇闻异事:http://news.qq.com/newssh/qwqs/qwqs3j.htm(简单无其他连接)·组图:地球上最像外星的九大地方(2009年05月04日11:17)时间8.社会观察:http://news.qq.com/newssh/sh-shgc3jy.htm(同上)tr>·齐鲁晚报:“三鹿”之后为何仍有“晨园”(2009年04月27日08:0
2009-05-06 22:15:00 5530
原创 菜鸟入门:C#htmlparser的配置与使用。
1 。配置先下载C#的htmlparser包(Winistaparser)。及说明见我CSDN的资源空间。VS2005下项目->添加引用->浏览(找到)Winistaparser/bin/debug/winstahtmlparser.dll添加即可。2。练习使用快速入门教程见http://www.zhangyongjun.com/blog/article.asp?id=226;代码
2009-05-05 22:09:00 3570 1
面向中文DBLP的知识族谱算法
2013-05-31
面向中文DBLP的关键词和术语聚类算法
2013-05-31
面向中文DBLP的人名消歧机构名称归一化算法
2013-05-31
TabControl CLISTCtrl的用法示例程序
2010-12-31
point wise mi 特征词选择算法中间文件
2010-10-04
音标学习软件,音标发音
2010-09-13
LibSVM进行文本分类
2010-09-04
C++写Arff数据预处理
2010-09-03
bzip boost安装组件
2010-08-23
Zlib boost 安装组件
2010-08-23
ICU unicode转化
2010-08-23
词性标注软件所需的模型文件
2010-08-18
词性标注模型软件所需要的模型文件(Part2)
2010-08-18
词性标注软件需要的模型文件
2010-08-18
新闻文本分类libsvm格式数据
2010-08-17
48个国际音标 英语音标发音软件
2010-06-26
自然语言处理语料凤凰新闻第二部分
2010-05-08
自然语言处理语料库新闻文本凤凰新闻第一部分
2010-05-08
Dynamic Extreme Learning Machine: A learning Algorithm for Neural Network with Elastic output structure
2010-05-08
文本KL熵计算(计算两段文字的KL熵)java编程
2010-03-12
ASP.Net 编程实例 简易BBS系统
2010-01-27
Matlab版prim Kruskal算法实现文档
2010-01-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人