自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(46)
  • 资源 (1)
  • 收藏
  • 关注

原创 cdh 当某个服务磁盘满了,无法启动cloudera-scm-agent或cloudera-scm-server

问题描述:一开始不知道是磁盘慢了,于是想重启下一下 cloudera-scm-agent start。提示磁盘满了。于是清理磁盘后,在重启,就发现,报错!无法重启!!!!报个错误也是莫名其妙,重来没遇到过!就几个字。。。。感觉是乱码一样。问题分析:shell debug:sh -x cloudera-scm-agentcat /opt/cloudera-manager/cm-5.8.0/r...

2019-01-17 16:21:15 6260

原创 cdh oozie修改时区

  

2019-01-17 16:12:29 539

原创 livy:scalaClient.submit使用scala api跑wordcount时,看着一切正常,但是spark程序没跑没有跑

问题分析:livy 的java API调用行得通,scala API调不通 ,而且一切日志比对正常,就是不报错,但是就是不跑!scala代码参考:import java.io.{File, FileNotFoundException}import java.net.URIimport org.apache.livy.LivyClientBuilderimport org.apac...

2019-01-17 16:07:02 783

原创 实时处理程消费kafka异常:ERROR kafka.server.ReplicaManager

问题描述:实时处理程序:streaming消费kafka一段时间后,报错:ERROR kafka.server.ReplicaManager: [Replica Manager on Broker 105]: Error processing fetch operation on partition [TOPICXXXX,1] offset 57479118java.lang.Illegal...

2019-01-17 15:53:33 3624

原创 idea连接coding无法提交无法更新问题:Fetch failed: Authentication failed for

如果提交时出现问题:提示没有反应,没有可提交的文件或报错:Fetch failed: Authentication failed for 'https://git.coding.net/u/aaa/p/projectxxx/'解决方法:idea配置:file----setting----version control添加:path to git executable :你的gi...

2019-01-11 14:14:34 4566

原创 大数据开发过程中遇到问题总结(持续更新中)

问题一:idea调试flume源码时,明明异常信息打印了,在出现异常信息之前大哥断点调试,死活都进不去????debug的时候断点进不去,查看flume源码?把所有断点都清空了,并把maven也clean啦。。。。。然后就可以了!坑啊问题二:cdh集群重启时,出现如下错误!No parameter name specified for argument of type [long]Ca...

2018-12-28 14:26:57 1785

原创 phoenix 创建索引

需求:phoenix查询很慢的时候需要创建索引问题:CREATE INDEX iupt ON webmagic_n.ENVIRONMENTAL_STATION_DATA2(update_time DESC) ;错误:Error: ERROR 1029 (42Y88): Mutable secondary indexes must have the hbase.regionser...

2018-12-28 14:20:16 2482

原创 phoeni:java.lang.IllegalStateException: Expected single, aggregated KeyValue from coprocessor......

问题描述:select count(1) from webmagic_n.CASE_EMERGENCY ;报错了!phoenix通过创建视图对hbase中的表进行操作时,将hbase中的表删除,但保留phoenix的视图,然后重新创建hbase表并导入数据,然后使用phoenix执行sql:select count(1) from “XXXX”;时报错:java.lang.Illega...

2018-12-28 14:16:11 337

原创 cdh搭建完毕后oozie配置org.apache.oozie.action.ActionExecutorException以及时区问题

异常信息:org.apache.oozie.action.ActionExecutorException: AUTH_FAILED: Not able to perform operation [ssh -o PasswordAuthentication=no -o KbdInteractiveDevices=no -o StrictHostKeyChecking=no -o ConnectT...

2018-12-28 14:12:24 1235

原创 Mysql sql 拼接Sqoop和Phoenix语句

需求描述:       需要从myslq导入数据到大数据平台hbase,但是由于有100多张表,如果一个表一个表导入的话,工作量大。如果写代码的话,需要的时间也比较多。是否可以直接通过sql语句批量生成sqoop语句呢??        此外,除了数据接入过来之外,还需要做的就是查询,通过phoenix查询,需要创建视图,怎么通过mysql sql语句自动生成创建视图的语句呢? 需...

2018-12-21 14:48:00 648

原创 大数据压力测试工具HiBench

需求描述:需要测试cdh集群的组件的性能和稳定性。压力测试工具选型:HiBenchHiBench测试工具说明:HiBench是一套基准测试套件,用于帮助我们评估不同的大数据框架性能指标(包括处理速度、吞吐等)的负载指标,可以评估Hadoop、Spark和流式负载等源码下载:wget https://github.com/intel-hadoop/HiBench/archive/Hi...

2018-12-20 09:58:54 4040

原创 Centos7自动启动keepalived无效问题排查

问题描述: centos自动启动keepalived?怎么就不会自动重启呢?都试了很多次啦呀。这么简单有些不给面子。实现方式:调用封装的脚本:vi /etc/rc.d/rc.localnohup sh /root/restartkeepalived.sh > /root/restart.out 2>&1 &封装一个脚本:vi /root/rest...

2018-12-20 09:28:34 2575

原创 CDH 配置Mysql高可用:主从和keepalived

问题描述:配置CDH 配置Mysql高可用,并实现和cdh无缝对接。主从和keepalived配置步骤:网上很多,这里就不多赘述了! 配置常用命令:查询mysql连接使用的是那台服务器:show variables like "%hostname%";service keepalived restartservice mysqld restartservice mysq...

2018-12-19 10:02:24 980

原创 squirrel 连接phoenix,当配置了支持事物后无法连接问题

问题描述:异常信息:isNamespaceMappingEnabled异常 问题分析:而工具squirrel没有地方可以修改配置,导致客户端报错了。连接phoenix有胖客户端和瘦客户端方式,使用瘦客户端方式连接可以解决!无需客户端配置如下选项。由于配置phoenix事物时,需要配置phoenix.schema.isNamespaceMappingEnabled选项vi hba...

2018-12-19 09:46:43 1559 1

原创 cdh oozie 无法启动问题Could not load service classes, Cannot create PoolableConnectionFactory

问题描述:在安装cdh元数据myslq高可用时,使用的是myslq主主复制+keepalived实现。期间发现切换时,出现如下异常信息!花了很长时间寻找问题的原因。因为切换的时候,使用本机命令行是可以连接的,但是夸服务器就无法连接,没有去这方面的尝试,后来使用navicate无法连接后,就推测是mysql高可用切换的问题导致的。问题分析:如果不重启keepalived,是无法实现切换和连接...

2018-12-19 09:27:05 1127

原创 Phoenix事物和安装部署:CDH5.12.1和phoenix4.8结合

Phoenix安装部署和事物支持配置遇到的问题:本人在cdh5.12集群上部署phoenix,并让其支持事物的经验总结!!过程遇到几个比较关键的问题,希望对你们有所帮助1)准备安装包: 编译完成的包:phoenix-4.9.0-cdh5.9.1.tar.gz2)部署:解压:tar -zxvf phoenix-4.9.0-cdh5.9.1.tar.gz把解压出的文件放到hbase的lib包目录下:并...

2018-05-29 15:31:00 1669 2

原创 VWMare如何让自己的多台大数据cdh集群虚拟机连接外网

问题描述:VWMare如何让自己的redhat虚拟机连接外网,同时自己的pc电话可以访问自己的集群虚拟机!vmware版本号:11.0linux系统:redhat 6.5由于图形界面比较直观,打开图形界面:执行命令:init 5cdh集群主机名和ip地址:hostscdh1  172.31.0.135cdh2 172.31.0.136cdh3 172.31.0.137init命令说明:    1:...

2018-05-10 22:21:30 817

原创 MANIFEST.MF (系统找不到指定的路径。)问题解决方法

错误信息:E:\myworkspace_java\bos-parent\bos-web\target\m2e-wtp\web-resources\META-INF\MANIFEST.MF (系统找不到指定的路径。) pom.xml /bos-web line 1 Maven Configuration Problempom.xml文件第一行红叉叉报错!问题原因分析:maven更新或者clean p...

2018-05-10 20:10:23 4799

原创 夸服务器远程客户端访问hbase集群需要开通的防火墙

问题:hbase客户端访问hbase集群需要怎么申请开通防火墙?场景:夸服务器远程客户端访问hbase集群需要开通的防火墙和注意事项?答案:1)hbase集群的所有zookeeper服务器和端口,一般端口默认为21812)hbase集群的所有hmaster服务器和端口。3)hbase集群的所有regionserver服务器和端口注意事项:1)开通防火

2018-01-15 15:29:02 1459

原创 spark1.6升级spark2.1时候sparkstreaming程序问题总结2018

升级版本说明:从spark2.1的maven配置pom.xml中可以看出版本!!     org.apache.spark   spark-core_2.11   2.1.0    org.apache.spark  spark-sql_2.11  2.1.0       org.apache.spark   spark-

2018-01-02 20:25:16 1293

原创 JAVA代码如何设置SPARK的日志打印级别

问题场景:在使用spark sql 增加where条件过滤时,会出现打印很多的被过滤掉的记录(几十万条),导致跑spark sql 特别慢!var df2 = sqc.sql("SELECT * FROM T_COMMISIONRATEDEF WHERE T_INSURANCETYPE = '630' ORDER BY T_INSURANCETYPE DESC " )执行时,打印截

2017-12-19 15:20:35 2962 1

原创 Spark-Streaming获取applicationId即scala中获取appid

问题: Spark-Streaming获取applicationId即scala中获取appid 解决方法:通过SparkListener方法来获取appid,以便可以控制提交完成后的spark作业;获取代码如下参考:参考红色部分即可!import org.apache.spark.scheduler.SparkListenerApplicationStart继承spa

2017-07-16 22:56:20 4222

原创 cdh5-spark-submit程序日志查看最后指定行数

问题描述:通过以下命令把自己的jar程序:cache_amis.jar提交到spark集群:client模式命令如下:BASEDIR = /datafsPROVICE=beijingnohup /opt/cloudera/parcels/CDH/lib/spark/bin/spark-submit --class StartCBPS8  --master yarn --deploy

2017-06-21 21:59:13 2075

原创 eclipse ctrl+鼠标左键并点击类名不跳转到class类而是跳转到jar包设置

目标: eclipse ctrl+鼠标左键点击类名不跳转到class类而是跳转到jar包设置问题描述:刚一开始我点击【ctrl+鼠标左键】选择某个类名:com.apache.testClass  会自动跳转到类:test.jar中,但是不知道为何突然,每次点的时候    都跳转到了testClass.class里面来了,并且显示了代码,没有显示jar名称。    由于我需要找到一个

2017-06-19 22:38:38 16354

原创 python客户端访问impala环境配置和试验

python客户端访问impala环境配置和试验:使用python执行impala SQL步骤:1) 使用linux系统自带:Python 2.6.6Python 包路径环境变量设置:export PYTHONPATH=/usr/lib/python2.6/site-packages2) 下载impala客户端:bitarray-0.8.1.tar.gz impyla-

2017-03-01 17:26:38 2173

原创 linux服务器上cloudera:cdh5.8使用python连接hiveServer2

1、下载:Python-3.5.0.tar.xz  并上传到hiveServer2服务器:/software目录下2、解压: cd /softwaretar Jxvf Python-3.5.0.tar.xz  cd Python-3.5.0./configure --prefix=/usr/local/python3make && make install发现会报错

2017-02-28 16:53:44 2340

原创 linux 获取当前目录

linux shell 获取当前目录的方法:workdir=`dirname $0`workdir=`cd ${workdir} && pwd`echo $workdir #就是当前的目录

2017-01-19 17:32:13 613

原创 微信小程序开发

说明:win7下,微信小程序开发:微信小程序 简称 "CX"步骤:1) 环境安装:下载地址:https://mp.weixin.qq.com/debug/wxadoc/dev/devtools/download.html?t=201715下载后安装:wechat_web_devtools_0.12.130400_x64.exe 2)申请APPID也可以不申请,只是不能发布到

2017-01-10 07:50:50 1557

原创 sparkR安装:linux服务器编译源码安装

sparkR安装步骤:R3.3.0版本!!!!1) 下载:amplab-extras-SparkR-pkg-9694d8e.zip      放到服务器:/software        cd /software     unzip amplab-extras-SparkR-pkg-9694d8e.zip     cd /software/amplab-extras-Spa

2017-01-09 15:07:18 503

原创 linux 使用 ----如何让虚拟机上网(vmware)

linux 使用 ----如何让虚拟机上网(vmware)1)VMware 中选中我的计算机:RedHat6.5点击右键-----设置----网络适配器----网络连接:自定义:下拉选中VMnet8(NAT模式)2)控制面板\网络和 Internet\网络连接: 选择:VMware Network Adapter VMnet8----点击

2017-01-08 18:39:49 448

原创 redhat6.5安装R-3.3.2.tar.gz 源码build安装成功记录

redhat6 上编译安装R语言:版本:3.3.21) 下载:R-3.3.2.tar.gz(https://mirrors.tuna.tsinghua.edu.cn/CRAN/    点击:R-3.3.2.tar.gz 下载:最新版!)2)安装:解压:cd /softwaretar -zxvf R-3.3.2.tar.gzmkdir -p  /home/liyg

2017-01-08 10:23:45 14589 7

原创 sqoop merge

1)生成jar包:sqoop codegen --connect jdbc:oracle:thin:@ip:1521:orcl --username TJAMIS_LXF --password *****--table T03_POLICYPERDAY_TEST2)导入数据:sqoop import --connect jdbc:oracle:thin:@ip:orcl --usern

2017-01-06 16:49:46 957

原创 oracle导出txt文本数据的2中方法

1)数据导出方式1vi /testdata/data/liyg/export.sqlset echo offset feedback offset newpage noneset verify offset pagesize 0set term offset trims onset linesize 600set heading offset timin

2017-01-04 17:32:04 2803

原创 spark graphx 图计算demo,结果展现

spark graphx 图计算官网实例练习:http://spark.apache.org/docs/latest/graphx-programming-guide.htmlimport org.apache.spark._import org.apache.spark.graphx._// To make some of the examples work we

2017-01-04 17:27:48 3345

原创 sqoop从oracle导入数据导hive表不支持的数据类型

sqoop从oracle导入数据导hive表不支持的数据类型:sqoop语句实例:sqoop  import-all-tables --connect jdbc:oracle:thin:@ip:1521:orcl  --username TJAMIS_LXF --password ******--hive-database TJAMIS_LXF  -m 1 --create-hive-

2017-01-04 17:23:43 4070 1

原创 使用plsql连接oracle一样,使用ClouderaImpalaODBC32.msi工具连接impala的方法!

想要使用plsql连接oracle一样,使用类似工具连接impala的方法:ClouderaImpalaODBC32.msi下载地址:http://www.cloudera.com/downloads/connectors/impala/odbc/2-5-36.html 1 ClouderaImpalaODBC32.msi 注意:不能使用64位的,否则后面使用SqlDbx.exe连

2016-12-29 16:38:52 2695

原创 java通过jdbc连接impala和pom.xml以及增查操作

pom.xml  xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">  4.0.0  com.insurance  hiveProj  0.0.1-SNAPSHOT  jar  hiveProj  h

2016-12-29 11:36:12 15252 4

原创 maven创建scala项目:spark-streaming项目使用

1)安装包下载apache-maven-3.3.9.ziparchetype-catalog.xml2)安装apache-maven-3.3.9.zip 解压到目录:D:\softinstall\apache-maven-3.3.9配置系统环境变量:MAVEN_HOME=D:\softinstall\apache-maven-3.3.9            

2016-12-27 16:00:31 849

原创 cdh5.8.3安装过程中问题解决方法Error loading MySQLdb和No portmap or rpcbind service

本人操作系统版本:redhat enterprise 6.7版本!问题1: 安装完毕cdh manager后,前台选择完毕服务后,测试cdh5 hue 数据库连接时候报错: 无法连接:查看后台日志报错: tail -f /opt/cm-5.8.3/log/cloudera-scm-server/cloudera-scm-server.logError loading MySQL

2016-12-15 15:23:18 3214 1

原创 cdh5.8.3安装完毕后,启动zookeeper一段时间后报错:节点选举受限制!Address already in use

查看zookeeper日志报错: ERROR org.apache.zookeeper.server.quorum.Leader: Couldn't bind to port 3181其中一台cdh1报错如下:2016-12-15 14:56:37,224 INFO org.apache.zookeeper.server.quorum.QuorumPeer: LEADING2016-1

2016-12-15 15:11:50 5155

永远都在最前面的笔记本工具

该工具只需,安装了jdk即可双击执行,双击后,该小工具会打开一个小记事本的窗口,这个小窗口会放在所有软件的最前面,非常方便的可以记录所有想法和灵感,工具小巧玲珑,非常实用

2018-10-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除