自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 DATAX类型转换错误, 无法将[\\N] 转换为[LONG]

如上,数据同步时发现脏数据,报类型转换错误,无法将[\\N] 转换为[LONG],原因是hive中的null值datax无法转为LONG,只需一步,指定空值格式即可。

2023-11-27 20:00:35 517

原创 datax优化

DATAX

2023-11-27 19:48:38 616

原创 datax空文件报文件类型错误

part-000**文件,job在做partiton时由于分桶函数不够完善,或者数据倾斜较严重,而开发没有足够的经验对其做出处理,导致某些reduce没有分到任何数据成为空桶,最终生成一个part-000**的空文件。方案1、在HDFS路径后加/*,会自动扫描所有文件,并跳过空文件,"path":"/user/hive/warehouse/dv_report.db/table/dt=${yyyymmdd}/*"检查hdfs文件,发现存在大小为0的文件,如下。空文件一般为第一个文件,如。

2023-11-27 15:51:29 437

原创 HIVE建表

HIVE建表语句:CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name   [(col_name data_type [COMMENT col_comment], ...)]   [COMMENT table_comment]   [PARTITIONED BY (col_name data_type [COMMENT col_comment]...

2017-07-10 14:05:28 827

原创 CPU-bound(计算密集型) 和I/O-bound(I/O密集型)

I/O密集型(I/O-bound)       大部分时间花在读/写 I/O (硬盘/内存)上的进程,我们称之为读/写 I/O (硬盘/内存)。      例如对静态网页的访问,简单的表查询。计算密集型 (CPU-bound)       在多重程序系统中,大部份时间用来做计算、逻辑判断等CPU动作的程序称之CPU bound。      例如一个计算圆周率至小数点一千位以

2017-06-22 11:00:25 742

原创 git 出现.swp不可见文件

.swp文件是如何生成的?正常情况:当你打开一个文件时,vi会自动生成一个.swp文件,文件名为[filename.**].swp,如果你正常退出,.swp文件会自动删除。非正常情况:1、当用多个程序编辑同一个文件                        2、非常规退出(如:当你强行关闭vi时,比如电源突然断掉或者使用了Ctrl+Z,vi便会自动生成一个.swp文件,当你下次编辑

2017-05-05 12:09:13 2997

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除