自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

转载 Hadoop 参考(持续积累。。。)

一、开发环境,基于2.6.0Ubuntu14.04下hadoop-2.6.0单机配置和伪分布式配置hadoop2.6.0的eclipse插件编译和设置Hadoop2.5 Eclipse插件制作、连接集群视频、及hadoop-eclipse-plugin-2.5.0插件下载 hadoop2.6-eclipse插件链接:http://pan.baidu.com/s/1bn8Nm

2015-04-19 15:19:46 234

原创 公众号开发初体验

最近有空玩了玩公众号,个人感觉公众号的生态控制的很不错,有闭有开,通过api接口可以让服务方接入较丰富的功能。虽然生态好,但各种限制也让人蛋碎,有意思的接口和玩法都要先做认证。  先来理解一下怎么接入吧。申请到公众号后,还需要做开发者认证,这个不难点点,按部就班。在开发者模式下需要配置你与微信对接的消息处理服务。微信会将开放的请求都转发到这个服务地址上。这个服务地址上GET和POST请求分别完

2015-03-24 11:20:27 327

原创 nutch的一些基础整理

一、关于配置文件:nutch-default.xml:爬虫的默认配置。在${nutch_home}/conf目录。nutch-site.xml:理论上是nutch-default.xml的覆盖。core-default.xml, hdfs-default.xml, mapred-default.xml:用于配置 Hadoop,与 hadoop-core-xxx.jar 相关。m

2015-03-22 18:18:01 419

原创 nutch脚本

刚看完crawl脚本大致理解nutch的执行过程后,回过头来看看nutch脚本都能干些什么。

2015-03-22 15:07:58 328

原创 如何开始NUTCH

1、下载2、编译3、运行3.1  注入种子$ bin/nutch inject Usage: InjectorJob [-crawlId ] 3.2 爬去$ bin/crawl Missing seedDir : crawl 3.3 拆看爬去结果$hbase shell$scan 'crawlId_webpage'

2015-03-21 11:26:40 450

翻译 TG2.1的生成i18n语言文件及默认语言的配置

TG2.1的生成i18n语言文件及默认语言的配置

2011-05-15 12:05:00 537

原创 mongoDB学习笔记3--python下使用

把常用的方式写出来了,比较简单,一看就明白了.........#!/usr/bin/env python#coding=utf-8from pymongo import Connectionimport datetimeclass MongoDBTest: def __init__(self): self.ConnectionToDB() def ConnectionToDB(self): print "Connection to db svr" se

2010-06-15 15:39:00 987

原创 mongoDB学习笔记2--安全认证

Mongodb默认启动是不带认证的,也没有账号,只要连接上服务就可以查询。启用安全认证的MongoDB服务:mongod.exe --auth--dbpath c:/data/db说明:运行—auth参数时,必须通过认证才可以查询数据。如果没有加—auth参数,即使配置了安全认证用户,也不需要认证谁都可以查询。配置安全认证用户:运行bin/mongo.exe> use admin> db.addUser("a", "1")认证:> db.auth("a", "1")查询已添加的用户:db.system.us

2010-06-15 15:26:00 1287

原创 mongoDB学习笔记1--安装

简单来讲,当然是在windows下试验比较好.所以先下载一个新版本吧http://www.mongodb.org/display/DOCS/Downloads第一次使用方式:这种安装是个相当简单的活,几下几步骤:1.创建数据库存储,例如:c:/data/db2.解压下载的.zip包到任意,最好是不包含中文或空格的目录3.在命令行下转到mongodb的目录4.执行bin/mongod run --dbpath c:/data/db到这一步已经完成了,如果要了解详细的启动参数可以在命令行输入“bin/mongo

2010-06-13 10:49:00 532

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除