自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 资源 (2)
  • 收藏
  • 关注

原创 shell中出现“/bin/bash^M: bad interpreter: No such file or directory”

服务器系统: centos7问题描述:在执行shell脚本时出现错误:/bin/bash^M: bad interpreter: No such file or directory解决办法:进入该脚本输入“:set ff=unix”执行,即可解决该问题。

2020-08-27 16:31:59 164

原创 anaconda CondaHTTPError: HTTP 404 NOT FOUND for url

问题:用anaconda创建python虚拟环境 ,报了以下错误解决方法:conda config --remove-key channelsconda config --append channels conda-forge --append channels bioconda --append channels defaults使用上述命令可解决该问题。...

2019-10-14 11:47:04 939

原创 数仓基于表级别的数据血缘分析

1.背景:数据血缘分析在日常的处理过程中非常重要,其分为应用级别、表级别和字段级别三种。在数据处理过程中,需要知道目标表的字段是来源于哪张原始表。对于简单的hsql来说我们很容易可以知道目标表的来源,但是复杂的hsql,想得到原始表不就那么方便了。故需要一个方法来便捷的导到目标表和来源表。2.hive源码中有名为NodeProcessor的接口,可以通过实现该接口来获取表级别的数据血缘分析。...

2019-09-30 11:07:44 3204

原创 spark hive2hbase

18/12/13 16:06:28 INFO TaskSetManager: Starting task 4.3 in stage 2.0 (TID 26, hadoop02, executor 1, partition 4, NODE_LOCAL, 4632 bytes)18/12/13 16:08:07 WARN TaskSetManager: Lost task 2.1 in stage ...

2019-09-18 09:32:03 102

原创 hive任务报错数组下标越界异常

1.问题描述:运行了长时间的任务,报了以下错误:2.无法复现该错误,待以后补充,仅以此作为个人笔记。

2019-09-18 09:28:49 1676 2

原创 hive分区表创建不成功

在创建hive分区表时,desc 该表时,分区不存在;重现执行了创表语句后,分区还是不存在;由此,想到了之前hive的元数据表中,删除了一行数据,是关于分区的记录;重新创建了该库该表,分区则存在...

2018-12-25 16:22:31 1013

原创 hive创建表字段说明是乱码

cdh的hive创建表后,表中的字段说明为乱码;查看了元数据库后,发现了元数据库的的编码集不是utf-8;在元数据库中,执行:alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8alter table TABLE_PARAMS modify column PARAM_VALUE...

2018-12-24 13:55:48 615

原创 hiveload数据到表中,查询出来全部为null

lload数据成功后,查询出数据均为null。查看创表语句后,文件格式如下:修改后的语句的如下:重新load后,查询结果如下:至此,问题已解决。...

2018-12-19 16:41:12 2703

原创 Azkaban集成hive2hbase的过程脚本报错解决过程(位置问题)

上面的信息是azkaban的报错日志;这是hive2hbase的工程结构;通过一番排查后得知,azkaban的里面的路径信息,都是以run.job为基准的相对路径。将azkaban工程打成zip包后的工程代码结构如下:上传到azkaban中运行正常,至此,此次错误已解决完毕。...

2018-12-18 14:29:28 344

原创 用spark将hive数据导入到hbase中

Log Type: stderrLog Upload Time: Thu Dec 13 14:59:19 +0800 2018Log Length: 2873SLF4J: Class path contains multiple SLF4J bindings.SLF4J: Found binding in [jar:file:/data/yarn/nm/usercache/hado...

2018-12-13 15:16:39 1310

原创 hiveshell命令错误

2018-07-09 18:01:12 407

原创 hbase aip使用mapReduce将处理过的数据存入hbase数据出错

错误如图1-1:图1-1核心代码如图1-2,图1-3,图1-4所示:图1-2图1-3图1-4产生该错误的原因是使用了错误的列簇,修改后的代码和效果分别是图1-5和图1-6:图1-5图1-6...

2018-06-21 15:52:19 142

原创 ssm整合

mapper包里面的.xml名称必须和接口名一致

2018-06-19 11:03:21 106

原创 java api连接hbase问题

在window环境变量的用户环境变量中,添加如下图的配置,点击确定。重启elipese即可上hadoop

2018-06-15 17:24:05 458

sqoop免费版

在sqoop的安装过程中,配置文件没问题的情乱下,依然会出错。此压缩包可完美解决该问题。

2018-09-13

大数据挖掘工具

Mahout 提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。

2018-05-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除