自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

dongpf的专栏

Technical Blog

  • 博客(35)
  • 资源 (6)
  • 收藏
  • 关注

原创 如何在Cygwin中安装并配置SSH

1. 下载Cygwin安装文件 2. 运行安装文件,选择一个下载站点,继续 3. 选择要安装的程序,默认是不安装OpenSSH的,需要手动选择,在Net类别下选上OpenSSH和OpenSSL两项   4. 等待下载并完成安装,之后,设置环境变量,把 C:/cygwin/bin;C:/cygwin/usr/bin 加入到系统环境变量的Path中 5. 打开cygwin,输入 ssh-host-config     当询问if privilege separation should be us

2011-03-28 17:49:00 71811 4

原创 推荐两个安装Cygwin时的快速源

还在为安装Cygwin时缓慢不堪的蜗牛般下载速度抓狂吗?来试试这两个快速源吧! 1. 在下载列表里选择:http://www.cygwin.cn ,如果没有,直接在URL里输入http://www.cygwin.cn/pub/ 2. 在URL里输入:http://mirrors.163.com/cygwin/,点击Add按钮,然后选中 http://mirrors.163.com/cygwin 进行安装 我亲自体验过,随谈不上网上吹嘘的飞速,但能保证合适可接受的速度,我用2M宽带基本可以达到100KB

2011-03-27 10:05:00 13847 5

转载 乔布斯2005年斯坦福大学毕业典礼演讲原文 – Stay hungry, stay foolish

From Stanford Report, June 14, 2005 This is the text of the Commencement address by Steve Jobs, CEO of Apple Computer and of Pixar Animation Studios Delivered on June 12, 2005.   I am honored to be with you today at your commencement from one o

2011-03-21 09:03:00 19795

原创 FileSystemXmlApplicationContext、ClassPathXmlApplicationContext和XmlWebApplicationContext简介

FileSystemXmlApplicationContext、ClassPathXmlApplicationContext和XmlWebApplicationContext简介今天在用Spring时遇到一个问题,提示找不到applicationContext.xml文件。原来是在加载这个文件时调用的方法不太合适,所以造成了程序找不到项目下的xml配置文件。

2010-12-10 19:33:00 10517 1

原创 Flex元素布局规则总结

一、Flex中的元素分类从功能层面可以把Flex中的元素分为组件(Components)和容器(Containers)两大类:组件 - 是指那类具有明确交互或数据展示功能的元素,例如Button、Checkbox、Datagrid、List等。容器 - 是指那类用来放置其他元素的元素,容器往往不具有特定的交互功能,主要的功能就是容纳元素。容器再细分又可以分为布局(Layout)容器和导航(Navigator)容器,其中布局容器的功能就是用来布局界面元素的,例如Application、Panel等

2010-12-10 19:11:00 4078 1

原创 Java clone 详解

Java clone方法详解

2010-11-30 23:38:00 773

转载 Java虚拟机(JVM)中的内存设置详解教程

Java虚拟机(JVM)中的内存设置详解教程

2010-11-30 23:37:00 881

原创 存储基础知识

归档文件(archive file)和压缩文件(compressed file) 在线存储和离线存储 近线存储(NearStore)

2010-11-30 23:33:00 716

转载 马云:超越微软和沃尔玛是阿里的使命

<br /><br />近日,阿里巴巴董事局主席马云在美国接受著名脱口秀节目主持人查理·罗斯(Charlie Rose)专访,围绕阿里的成功之道、未来方向以及自己的创富心得等内容,马云进行了阐释。在马云眼中,企业成功的关键因素并非创新力本身,而是这一能力背后的执行者与推动者--企业员工。马云指出,创业者只有坚守这一理念,懂得尊重人才,同时坚持将服务做到最好,企业盈利将是必然。<br />以下为马云与查理·罗斯谈话实录:<br /><br />科技不是我的事业<br /><br />罗斯:你是怎样投身于科技的

2010-10-04 09:49:00 1664

转载 乔布斯8条创新秘诀:创新想法需要让人兴奋

<br /><br />乔布斯有人爱有人恨,但没有多少人能质疑其在科技产品领域的创新能力。他创立了苹果,开发出引领潮流的众多产品,且苹果的市值已超过微软,成为全球第一大科技公司。<br />Carmine Gallo创作了一本名为《乔布斯的创新秘密》(The Innovation Secrets of Steve Jobs)的书,以下为这本书的一些纲要:<br /> <br />1.做感兴趣的事<br />换个角度看待事业。乔布斯遵从自己的内心,将整个生命从事自己感兴趣的事物,事业的意义已完全不同。<br

2010-10-04 09:39:00 937

转载 IT人士应当知道的10个行业小内幕

<br /><br />如果你打算从事IT行业或刚进入这个行业,也许本文下面的小内幕会吓到你,因为这些事平常都不会公开讨论的。如果你是IT资深人士,或许你已经遇到其中的大部分了。如果你愿意,请一起来参与讨论吧。<br /> 这些内幕大多数是针对网络管理员、IT经理和桌面支持专业人士。虽然这些小内幕并不针对开发人员和程序员(这两类人员也有对应的小内幕。),但有些或许也适用于他们。<br /><br />10. 虽然IT业的薪酬比其他很多行业要好,但有公司因此视你为其“佣人”。<br /><br />尽管I

2010-10-04 09:36:00 746

转载 那些登峰造极的编程高手们-----激励计算机专业的大学生

<br />Bill Joy<br /><br />前任Sun的首席科学家,当年在Berkeley时主持开发了最早版本的BSD。他还是vi和csh的作者。当然,Csh Programming Considered Harmful 是另一个话题乐。据说他想看看自己能不能写个操作系统,就在三天里写了个自己的Unix, 也就是BSD的前身。当然是传说了,但足见他的功力。另一个传说是,1980年初的时候,DARPA让BBN在Berkley Unix里加上BBN开发的TCP/IP代码。但当时还是研究生的B伯伯怒了,拒

2010-10-02 09:45:00 1079

原创 合理使用namespace

<br /><br />所谓namespace,是指标识符的各种可见范围。<br />C++标准程序库中的所有标识符都被定义于一个名为std的namespace中。<br />由于namespace的概念,使用C++标准程序库的任何标识符时,可以有三种选择:<br />1、直接指定标识符。<br />例如std::ostream而不是ostream。完整语句如下:<br />std::cout<< std::hex << 3.4 << std::endl;<br /> <br />2、使用using关键

2010-10-02 09:39:00 873

原创 C++头文件解惑

1. C++头文件是否有.h后缀的区别2. 引用头文件时和""的区别

2010-10-02 09:37:00 900

原创 Nutch和Solr的集成方案

<br /><br />本方案中,Solr作为处理搜索结果的源和入口,有效的减轻对Nutch的搜索负担,让Nutch负责她最擅长的工作:抓取(crawling)和提取(extracting)内容。使用Solr作为搜索后端,换句话说,就是允许使用所有Solr Server的高级特性,诸如:查询拼写检查(spell-check),搜索提醒(suggestion),数据复制(data-replication),查询缓存等等。<br /> <br />Nutch和Solr的安装<br /> <br />首先下载我们

2010-06-24 19:22:00 8569 1

原创 Nutch常用命令详解

<br />Nutch采用了一种命令的方式进行工作,其命令可以是对局域网方式的单一命令也可以是对整个Web进行爬取的分步命令。主要的命令如下:<br /> <br />1. Crawl<br />Crawl是“org.apache.nutch.crawl.Crawl”的别称,它是一个完整的爬取和索引过程命令。<br />使用方法:<br />Shell代码<br />$bin/nutch crawl <urlDir> [-dir d] [-threads n] [-depth i] [-topN] <b

2010-06-24 19:20:00 1510

原创 Nutch主流程代码阅读笔记整理(三)

<br /><br />四、Nutch 每条索引记录的字段说明<br /><br />url: 作为唯一标标识值,由BasicIndexingFilter类产生。 <br /><br />segment: 由Indexer类产生。Nutch抓回来的页面内容放在segments目录,lucene只会索引,不会store原文内容,因此在查询时要以 segment与url作为外键,由FetchedSegments类根据hitsDetail从segments目录获得content。 <br /><br />boos

2010-06-24 19:18:00 1439 1

原创 Nutch主流程代码阅读笔记整理(二)

<br /><br />三、主要类和方法分析<br /> org.apache.nutch.crawl.Injector:<br />1,注入url.txt<br />2,url标准化<br />3,拦截url,进行正则校验(regex-urlfilter.txt)<br />4,对符URL标准的url进行map对构造,在构造过程中给CrawlDatum初始化得分,分数可影响urlhost的搜索排序,和采集优先级!<br />5,reduce只做一件事,判断url是不是在crawldb中已经存在,如果存

2010-06-24 19:17:00 1509

原创 Nutch主流程代码阅读笔记整理(一)

<br />Nutch 的Crawler和Searcher两部分被尽是分开,其主要目的是为了使两个部分可以布地配置在硬件平台上,例如Crawler和Searcher分别被放置在两个主机上,这样可以极大的提高灵活性和性能。<br /> <br />一、总体流程介绍<br /> <br />爬行过程在Introduction to Nutch, Part 1 Crawling 里已有详细说明,或许直接看Crawl类来理解爬行的过程。<br />这里有一幅更直观的图:<br /> <br /><br /> <br

2010-06-24 19:15:00 1807

原创 Nutch插件机制详解(三)

Nutch 是一个非常出色的开源搜索框架,它的插件架构更加是它的一个技术亮点,通过此架构,可以保证 Nutch方便的被灵活的扩展而不用修改原来的代码,通过配置文件可以简单方便的控制加载或者不加载哪些插件,而且这些都不需要额外的容器支持。这些都是我们在系统架构设计的时候可以学习和参考的有益经验。

2010-06-24 01:06:00 1847

原创 Nutch插件机制详解(二)

<br />三、插件定义方法 如下:<br />Xml代码 <plugin id="urlfilter-suffix" 插件ID name="Suffix URL Filter" 插件名称 version="1.0.0" 插件版本 provider-name="nutch.org"> 插件提供者的ID <runtime> <library name="urlfilter-suffix.jar"> 依赖的JAR包

2010-06-24 01:03:00 1587

原创 Nutch插件机制详解(一)

Nutch系统架构的一个亮点就是插件,借鉴这个架构我们可以设计出自己的灵活的系统架构,下面就来解析Nutch的插件系统是怎么回事。

2010-06-24 00:55:00 1387

原创 Eclipse中编译nutch-1.0配置详解

<br /><br />nutch-1.0如果不修改代码,导入进去是有两处错误的,下面是自己配置成功地方法。 配置cygwin的环境变量,这一步很重要,如果没有配置的话,后面就会出现"Failed to get the current user's information" 或者 'Login failed: Cannot run program "bash"'的错误。 新建一个工程,随便取个名字,选择"Create project from existing sourc

2010-06-24 00:01:00 2421 1

原创 Nutch安装配置详细指南(Windows环境)

一、搜索引擎的原理简介1.一个抓网络页面程序 把www中的各网站的内容抓到本地 2.一个文件解析工具 把抓下来的html、doc等源文件处理为更精确的格式文本 3.一个全文检索、分词、数据挖掘,解析文本,把数据抓到结构化数据库中 可以采取工具软件,未必要自己写。数据库可以是文件数据库。4.开发一个搜索页面,从数据库里查询关键字 对查询关键字,进行一些逻辑处理。然后返回名称和url到页面。二、Lucene和Nutch简介

2010-06-23 23:58:00 8125 3

转载 聚集索引和非聚集索引 - 实例分析

        汉语字典的正文本身就是一个聚集索引。比如,我们要查“安”字,就会很自然地翻开字典的前几页,因为“安”的拼音是“an”,而按照拼音排序汉字的字典是以英文字母“a”开头并以“z”结尾的,那么“安”字就自然地排在字典的前部。如果您翻完了所有以“a”开头的部分仍然找不到这个字,那么就说明您的字典中没有这个字;同样的,如果查“张”字,那您也会将您的字典翻到最后部分,因为“张”的拼音是“z

2010-04-20 18:24:00 869 1

转载 聚集索引和非聚集索引 - 概念阐述

 聚集索引  聚集索引确定表中数据的物理顺序。聚集索引类似于电话簿,后者按姓氏排列数据。由于聚集索引规定数据在表中的物理存储顺序,因此一个表只能包含一个聚集索引。但该索引可以包含多个列(组合索引),就像电话簿按姓氏和名字进行组织一样。  聚集索引对于那些经常要搜索范围值的列特别有效。使用聚集索引找到包含第一个值的行后,便可以确保包含后续索引值的行在物理相邻。例如,如果应用程序执

2010-04-20 18:22:00 806

原创 The Privates of Silicon Valley

The revolution came when we weren’t looking. It happened in a garage. In a dorm room. In countless hours of effort, imagining and intrigue. Apple cofounder Steve Jobs and Microsoft cofounder Bill Gate

2010-03-28 15:47:00 815

转载 Doug Cutting Interview

Friday, May 28, 2004Doug Cutting Interview Doug Cutting is primary developer of the Lucene and Nutch open source search projects. He has worked in the search technology field for nearly two de

2010-03-26 20:06:00 1188

原创 开始无限期崇拜Doug Cutting哥

最近开始研究搜索引擎和分布式系统,准备弄下来Apache的Lucene、Nutch和Hadoop这三宝学习膜拜,在网上查了半天,意外发现原来这三宝都源自Doug哥之手,真乃是神人啊。印证了冰哥的一句话,优秀的系统往往都是出自个人的杰作,而不是组织和政府的联合开发;技术的发展往往是由个人的创意来引领的。不知道在我们国家这种制度下,什么时候才能出个像Doug哥一样的绝世高手,难啊!也许现在

2010-03-26 13:42:00 2897 1

原创 又是一年春节时

大雪纷飞,冰天雪地,又到了过年的时候。一年了,风风雨雨,坎坷不断,这一年自己经历了很多,有得有失,年终之时,值得好好总结总结了。第一次着手做详细的年终总结,也督促自己以后每年都能坚持这个习惯。为了让自己能好好回顾度过的岁岁年年,这个方法挺好,我喜欢!

2010-02-10 21:29:00 789

原创 GDI+ Vs GDI

一、GDI  GDI是位于应用程序与不同硬件之间的中间层,这种结构让程序员从直接处理不同硬件的工作中解放出来,把硬件间的差异交给了GDI处理。GDI通过将应用程序与不同输出设备特性相隔离,使Windows应用程序能够毫无障碍地在Windows支持的任何图形输出设备上运行。例如,我们可以在不改变程序的前提下,让能在Epson点式打印机上工作的程序也能在激光打印机上工作。它把windows系统中的图形

2009-10-12 21:52:00 876

原创 开发人员的十种必备工具

每个开发人员现在应该下载的十种必备工具 发布日期: 7/20/2004 | 更新日期: 7/20/2004本文自发布以来已经增加了新信息。请参阅下面的编辑更新。本文讨论:•用于编写单元测试的 NUnit•用于创建代码文档资料的 NDoc•用于生成解决方案的 NAnt•用于生成代码

2007-10-25 16:42:00 917

原创 ERP words

A>>---------------------------------------------------------------ABC Classification--ABC分类法对于库存的所有物料,按照全年货币价值从大到小排序,然后划分为三大类,分别称为A类、B类和C类。A类物料价值最高,受到高度重视,处于中间的B类物料受重视程度稍差,而C类物料价值低,仅进行例行控制管理。ABC分类法的

2007-10-25 16:34:00 943

原创 Google 笔试题

1.单项选择题1.  下面一段代码的输出是[  ]void fn( int* b){    (*b)++;}int main(){    int a=7;    fn(&a);coutreturn 0;}A.0     B.7    C.8    D.undefined2.  定义int i,j,*p=&i; 那么下面哪条语句可以完成i=j的赋值[  ]A.i=*p;     B. *p=*&

2007-10-23 20:41:00 1436

原创 在Visual Studio 2005里,用ActiveSync来同步模拟器(Windows Mobile 5.0 For Smartphone)

一、前期环境搭建    1、Windows Mobile5.0模拟器安装步骤以及下载地址,如下:http://news.csdn.net/news/newstopic/22/22102.shtml    2、模拟器的安装与设置参看:Windows Mobile 5.0 模拟器     BTW:如果是Visual Studio 2005  RC 或者是Prosessional等正式版本的话,就不要装

2007-09-04 21:32:00 1188

ole db教程

比较详细的OLE DB教程,全中文版

2007-11-22

Beginning JavaServer Pagespart1

Beginning JavaServer Pages全书实例源代码part3

2007-11-22

Beginning JavaServer Pagespart2

Beginning JavaServer Pages全书实例源代码part2

2007-11-22

Beginning JavaServer Pages

Beginning JavaServer Pages全书实例源码 part1

2007-11-22

Struts In Action by fx2002

Struts In Action by fx2002.rar

2007-11-02

C++ FAQs 2nd

C++常见问题解答(第二版)

2007-11-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除