- 博客(1)
- 资源 (1)
- 收藏
- 关注
转载 Nutch-2.2.1学习之一Nutch简介
Nutch起源于ApacheLucene项目,已经是一个高度可扩展和可伸缩的开源网络爬虫软件项目,并且实现了多元化,包括两个版本的代码库,即: 1. Nutch1.x版本:一个成熟的产品化的爬虫。1.x版本依赖于Apache Hadoop的数据结构,并使用了细粒度配置。Hadoop对于批处理提供了很强大的功能。 2. Nutch2.x的版本:一个新兴的、直接
2014-07-28 14:12:04 191
如何用selenium封装post参数提交示例
selenium自定义封装支持类似httpclient 的post提交方式,并获取返回值,对于获取异步请求中返回的json对象值很有用。
2018-05-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人