自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 资源 (15)
  • 收藏
  • 关注

原创 nginx http 411 length required问题

问题:http post访问nginx报 411 异常解决方法:修改nginx.conf文件,http模块添加参数:chunked_transfer_encoding on;

2015-10-09 17:06:58 4981

原创 java.io.IOException: No FileSystem for scheme: hdfs

问题:NN配置成HA后,通过API读过集群各节点状态时,发生如下的异常!java.io.IOException: No FileSystem for scheme: hdfs没有获取到DFS!!!解决方案:待。。。

2013-11-21 14:26:43 6545

原创 hive java.io.IOException: Cannot initialize Cluster

环境:cdh4,hive-0.10问题:启动hive,报 java.io.IOException: Cannot initialize Cluster,Please check your configuration for mapreduce.framework.name and the correspond server addresses.解决:修改$HIVE_HOME/conf/hi

2013-11-12 15:54:52 4344

原创 Exception in BPOfferService for Block pool BP

集群:cdh4 问题:启动集群后,发现datanode日志,报Exception in BPOfferService for Block pool BP.解决:hdfs-site.xml修改属性dfs.datanode.data.dir,配置它的值为多个目录(逗号分隔),这个可能与属性dfs.datanode.failed.volumes.tolerated有关。

2013-11-11 15:02:45 2518

原创 Missing Hive Builtins Jar: /data/hive-0.11.0/lib/hive-builtins-*.jar

问题:编译hive-0.11,执行hive报这个错,发现$HIVE_HOME/lib下面没有hive-builtins-*.jar。待解:

2013-11-09 10:24:11 1571

原创 nagiosgraph nan

问题:nagiosgraph图形显示 nan,无具体数字。看日志无问题,且其它的lt

2013-10-14 17:17:27 1146

原创 hive lzo 乱码问题

测试集群配置lzo,无问题。生产环境上通过hive查询数据时,出现乱码(多出几行),应该是在解压时出现了其它的字符,通过lzop解压无问题。解决方案:待....

2013-10-11 10:03:42 2032 1

原创 mysql rank

问题:取各网站pv top 10记录。解决:rank如下:select site_id,pv_count,rankfrom (select A.site_id,A.pv_count,if(@site=site_id,@curRank := @curRank+1,@curRank := 1) as rank,@site := site_idfrom (select site_

2013-09-10 11:33:56 1277

原创 hive-0.11错误

安装hive-0.11,执行ql,报如下错误:2013-08-09 10:23:08,854 ERROR metastore.RetryingHMSHandler (RetryingHMSHandler.java:invoke(134)) - NoSuchObjectException(message:partition values=[2013-08-03])        at org

2013-08-09 10:27:10 2646 1

原创 编译hive错误

编译hive时,出现了以下异常: You probably access the destination server through a proxy server that is not well configured!原因:可能是网络配置原因,无法访问目标网站,解决方法:待定!!!

2013-07-25 17:29:37 3106 5

原创 FAILED: Error in semantic analysis: No matching method for class org.apache.hadoop.hive.ql.udf.GetEx

hive 自定义UDAF报FAILED: Error in semantic analysis: No matching method for class org.apache.hadoop.hive.ql.udf.GetExitPageUDAF with (string, string, bigint). Possible choices:写了很多udf,udaf,居然遇到这样的

2013-07-24 11:33:53 10910 1

原创 ssh 调用 hadoop问题

Error occurred during initialization of VMjava.lang.OutOfMemoryError: unable to create new native threadat java.lang.Thread.start0(Native Method)at java.lang.Thread.start(Thread.java:640)at ja

2013-05-17 15:28:58 913 1

原创 Main class [org.apache.oozie.action.hadoop.HiveMain], exit code [10]

oozie执行hiveql,发生这样的异常!Main class [org.apache.oozie.action.hadoop.HiveMain], exit code [10]

2013-05-03 16:49:00 3067 2

原创 如何构建一套数据计算与报表相结合的系统?

做一套这样的系统:1.各类数据可以灵活定义,描述2.各类数据可以以多种方式导入系统3.对各类数据可以方便的形成计算任务,进行任务调度管理4.计算结果可以方便地形成图表 各位大神,您有何高见!

2013-04-29 19:29:52 860 2

原创 java.sql.SQLException: Field 'IS_STOREDASSUBDIRECTORIES' doesn't have a default value

今天在添加表分区遇到如下的异常:ALTER TABLE s_search_log ADD IF NOT EXISTS PARTITION (day_id =20130428, PLAT_TYPE=3) LOCATION '/data/stg/s_search_log/20130428/3/';异常:FAILED: Error in metadata: javax.jdo.JDODa

2013-04-29 11:32:16 2466 1

原创 hive表乱码问题

1.导入到hdfs的文件是gbk编码2.创建hive的外表部,引用gbk编码文件.hive数据utf-8编码。3.cli查询出中文为乱码由于数据入hive表中已为乱码,此时再进行转码已无效。

2013-04-10 09:58:42 4224

原创 stop-hbase.sh no zookeeper to stop because no pid file /tmp/hbase-hadoop-zookeeper.pid

关闭hbase时,发现这样的提示:no zookeeper to stop because no pid file /tmp/hbase-hadoop-zookeeper.pid原因:无法找到zk.pid文件,可能是由于放到/tmp造成

2013-03-14 17:47:38 12555 5

原创 restlet例子介绍

一篇关于restlet例子的文档,写的不错。http://www.docin.com/p-401845817.html

2013-03-06 18:15:33 884

原创 专利文章搜索

http://search.patentstar.com.cn很不错的一个关于专利文章搜索方面的网站。

2013-02-06 10:20:46 689

原创 datanode无法启动

datanode无法启动,datanode.log报如下异常:2013-01-17 15:56:59,188 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: org.apache.hadoop.ipc.RemoteException: java.io.IOException: java.lang.IndexOutOfBoundsEx

2013-02-05 13:27:43 1262 1

原创 hive Timestamp类型慎用

java.lang.RuntimeException: org.apache.hadoop.hive.ql.metadata.HiveException: Error evaluating regexp_replace(_col3, ':| |-', '') at org.apache.hadoop.hive.ql.exec.ExecReducer.reduce(ExecReducer.java

2013-01-10 08:52:42 10908 1

原创 hive sort by|order by

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+SortBy

2012-12-27 10:18:22 655

原创 hive left outer join on注意点

注意:A left outer join B on (..),如果A表中有日期分区,要将日期条件放到where中,B表中的日期分区放到on条件中。昨天将两个表中日期分区都放到on中,出现错误结果。

2012-12-25 13:05:13 907

原创 hive reduce任务太多问题

最近有几个处理大数据的计算,占用reduce为999,直接占满slot,导致其它任务无法够取资源。现在尝试修改         hive.exec.reducers.max        27        max number of reducers will be used. If the one                   specified in the c

2012-12-19 09:28:49 813

转载 HowManyMapsAndReduces

http://wiki.apache.org/hadoop/HowManyMapsAndReduces

2012-12-06 16:24:45 489

原创 su: cannot set user id: Resource temporarily unavailable

昨天晚上在namenode节点上执行start-balancer.sh,今天早上su - hadoop用户报这样的问题!!!jps -l 看到start-balancer.sh仍然在执行,直接杀掉该进程即可或是stop-balancer.sh。这个进程怎么占用这么多资源,没有想到!同时注意一点就是:不要所有的节点都运行该进程。只要namenode节点运行该进程即可!!!

2012-12-06 08:45:22 1393

原创 hadoop rackawareness实现

由于集群扩大,新机器安装在另一台机架上,所以需要配置机架感知。机器感知没有使用默认脚本实现,而是采用直接配置topology.node.switch.mapping.impl,实现类是java类。以下是在测试集群中的实现。public class JavaTestBasedMapping implements DNSToSwitchMapping { //key:ip value:ra

2012-11-21 16:51:47 522

原创 hive MapJoin优化

https://cwiki.apache.org/confluence/display/Hive/MapJoinOptimization不错!

2012-11-16 12:03:00 645

原创 hivesql错误1:java.lang.Throwable: Child Error, status:255

java.lang.Throwable: Child Error at org.apache.hadoop.mapred.TaskRunner.run(TaskRunner.java:271)Caused by: java.io.IOException: Task process exit with nonzero status of 255. at org.apache.hadoop.ma

2012-10-27 18:26:14 2215 2

原创 java.lang.IllegalArgumentException: Timestamp format must be yyyy-mm-dd hh:mm:ss[.fffffffff]

执行hsql :select user_id, prod_id, size(sw_prod) as item_cntfrom i_order_prod_log lateral view explode(sw_prod) prodTable as prod_id;发生下面的错误:java.lang.RuntimeException: org.apache.hadoop.h

2012-10-17 17:07:57 8762

原创 hive自定义函数注意异常捕获

在hive sql中如果有自定义的函数,注意捕获异常,否则hiveserver进程会被干掉。

2012-10-10 12:54:51 2004

原创 写hive RowNumUDF注意点

写了一个hive的UDF函数 rownum,用于记录行号,后发现一个问题,就是rownum有重复。原因在于产生的多个map都会调用rownum,解决的方法要求你的hive sql中必须有sort by,不过这也意味着数据是在单内机器上排序。

2012-10-10 09:09:34 1742

原创 hadoop DataNode无法连接NameNode问题,注意/etc/hosts内容

早上检查任务执行情况,发现相关存储任务失败,检查hadoop相关状态(hadoop dfsadmin -report)发现数据节点一个也没有识别。检查数据节点日志hadoop-hadoop-datanode.log发现有2012-10-09 09:18:25,661 INFO org.apache.hadoop.ipc.RPC: Server at host137/192.168.6.13

2012-10-09 09:52:25 1371

presto可视化yanagishima-20版本-JDK8

1、基本信息 (1)presto可视化界面。 (2)yanagishima v20.0编译。 (3)JDK8 2、可用免费

2022-06-29

R in Action

那些年我们一起学过的R!

2016-06-07

自定义hive函数

自定义 hive udf udaf 有url解析,获取网站主域名,根据ip获取区域码,有rownum,列聚合以及一些业务实现udf。

2013-07-24

apche hive0.8.1安装配置 doc

此文档用于说明hive0.8.1的安装过程以及其中需要的注意事项。

2012-07-13

apache hadoop1.0.3配置说明 doc

本文档用于说明hadoop1.0.3安装配置的步骤 以及其中需要注意的事项

2012-07-13

The+Data+Warehouse+ETL+Toolkit中文版.pdf

关于建设数据仓库ETL很好的一本书 读过几遍,非常有用!

2012-02-21

BI维度模型(IBM红皮书).pdf

BI 维度模型 IBM红皮书 维表建设规范 事实表建设规范 BI架构 做BI值得参考!

2012-02-21

java版实现飞鸽传书

自己动手写了一个飞鸽传书,基本功能都可以用.

2010-04-28

清华大学 数据结构讲义

清华大学 数据结构讲义 很不错啊 考研的朋友可以下载 现在缺分,所以分高了点,哈哈

2009-03-20

Effective Java 第二版(英文)

Effective Java 第二版(英文) 不错的一本书。

2009-02-02

数据结构与算法分析(java english)

数据结构与算法分析(java english),写的不错

2009-01-06

jfreechart_developer_guide

jfreechart_developer_guide 比较详细地介绍了JFreeChart的框架,带一些例子说明,有助理解。

2009-01-04

jfreechart api

jfreechart api java doc 大家可以方便查找各个类

2008-12-27

apache ant1.7

apache ant1.7 安装包 windows

2008-11-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除