自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 资源 (18)
  • 收藏
  • 关注

原创 kettle9源码编译和调试

kettle源码版本:tag为pentaho-kettle-9.0.0.0-R1.导入到IDEA

2020-03-30 22:59:20 5733

原创 js课程表插件

这个课程表不是原创的,是基于别人的Timetables.js插件,进行了美化和功能完善,特别适用于手机端,如微信公众号、小程序、APP等中展示,兼容PC端。 效果图如下:github地址:https://github.com/mumuxix/schoolTimetable欢迎大家采用...

2020-03-25 17:23:44 2270 7

原创 Cloudera Manager API调用实例(JAVA版)

1、下载github上的api项目,含pom依赖关系https://github.com/cloudera/cm_api2、下载的api项目只是纯粹的api说明和工具类,没有调用实例,以maven格式导入到eclipse项目中3、增加调用实例类,如下import java.text.ParseException;import java.text.SimpleDateFormat...

2019-03-31 11:38:02 2621

原创 log4j的DailyRollingFileAppender每天产生一个日志文件,却不支持MaxBackupIndex

实验了好几次,又查了资料,才发现log4j的DailyRollingFileAppender每天产生一个日志文件,却不支持MaxBackupIndex,不能设置保留近几天的日志。

2018-09-29 10:06:24 2640

原创 kettle jar包冲突

 kettle中之前要写java脚本连接hbase,所以导入了很多依赖包。现在使用kettle中的hadoop文件转移控件报错,排查之后因为jar包冲突,冲突的jar包为hadoop-common-2.5.1.jar ...

2018-09-28 16:57:58 677

原创 简单shell脚本,与日志重定向输出

linux crontab定时任务:*/5 * * * * flock -xn /tmp/kettle_job_sjgz_server.lock -c '/bin/bash /opt/pdi-ce-6.1.0.1-196/kettle_job_sjgz_server.sh >> /opt/pdi-ce-6.1.0.1-196/kettle_job_sjgz_server.lo...

2018-09-28 15:07:16 4492

原创 解决tomcat日志中cataline.out过大问题(切换用log4j)

1、准备jar包和文件地址https://download.csdn.net/download/gongchengshiv/10691222里面包含:tomcat-juli.jar,tomcat-juli-adapters.jar,log4j-1.2.17.jar,log4j.properties四个文件2、将log4j.jar 和 tomcat-juli-adapters.jar放到...

2018-09-27 16:13:52 589

原创 maven中加入ojdbc6驱动包

把ojdbc6-11.2.0.3.jar 放入目录D:\apache-maven-3.5.3-bin\ojdbc中,cmd执行以下命令:mvn install:install-file -DgroupId=com.oracle -DartifactId=ojdbc6 -Dversion=11.2.0.3 -Dpackaging=jar -Dfile=D:\apache-maven-3.5.3-bi...

2018-03-15 10:51:16 1279

原创 让linux程序后台执行(后台程序管理利器supervisior管理Flume进程)

场景:需要让flume稳定的在linux后台执行以下是离线安装supervisor的方法:一、安装supervisor所依赖的python包1、安装easy_install下载地址:http://pypi.python.org/packages/source/s/setuptools/setuptools-0.6c11.tar.gz#md5=7df2a529a074f613b509

2017-12-04 10:34:44 2237

原创 linux让flume在后台运行

1.使用nohup+命令+&nohup可以让命令忽略hangup(hup)的影响,在后台一直执行。&是在xshell上也不输出内容,保持在后台执行

2017-11-24 11:21:20 5783

原创 hive读取与flume写入hdfs文件冲突

前提:用flume采集数据,sink配置hdfs输出,然后用hive时时查询计算,定期转存数据到历史表。1、问题一:hive查询时与flume滚动文件冲突hive查询时包含flume的历史文件(后缀tmp文件),当flume把临时文件滚动成正式文件时,会删掉临时文件,生成正式文件,此时hive查询处理时会报错:file not fond解决思路:由于hive查询时不会查询以.和_开头的

2017-11-23 17:19:08 1123

原创 认识kettle

工作中使用kettle作为数据抽取、转换、清洗、计算、导出工具。1、kettle是pentaho公司的BI产品中的一个小小组件,叫数据集成data integration工具。公司竟然用kettle完成全部的数据工作:采集、清洗、计算、导出。2、

2017-11-21 21:50:07 322

原创 认识syslog

通过做采集防火墙和AC的日志信息,接触到了syslog这个词,之前一直有点模糊,只知道设备能往我的flume上推送日志信息的用法,对于syslog的意思不大懂。今天又上网查了一下,说的syslog意思有点深奥,跟我的使用经验和理解,简单归纳对syslog的认识:1、syslog是Linux系统的一个自带进程,提供有api供其他应用程序写入Linux日志文件2、syslog有大致的格式,

2017-11-21 21:07:10 311

原创 被cloudera quickstart vm坑了一把

基于没有服务器,只有个人4G内存笔记本一台,想试一把hadoop环境,操作一下真实环境学习。研究了cloudera官网提供了一个快速学习的环境安装包:cloudera quickstartvm。安装虚拟机时没有说明需要最小内存,虚拟机启动正常,当打开cdh express精简版时竟然说至少8G内存,我累个去,早不说,等装完了启动时才提示,我也是醉了。。。。。。。坑啊。。。。。

2017-11-18 22:58:47 4426 1

原创 shell操作hbase

环境:已经搭建好cdh环境操作步骤:1、使用Xshell工具连接到hbase所在服务器2、输入hbase shell命令进入shell命令模式3、可以操作hbase了,比如输入list,会展示hbase中所有的表

2017-10-10 11:38:01 813

原创 ehcarts省份热力图实例

省份热力图如下:var geoCoordMap = { "郑州":[113.65,34.76]};var convertData = function (data) { var res = []; for (var i = 0; i < data.length; i++) { var geoCoord = geoCoordMap[data[

2017-09-01 16:53:48 8814 3

原创 怎么让echarts柱状图同一个系列每个柱状颜色都不同

option = { xAxis : [ { type : 'category', data : ['Mon', 'Tue', 'Wed'], axisTick: { alignWithLabel: true } } ],

2017-09-01 16:26:14 5638

原创 爬虫开始

爬虫程序写了一段时间了,不进行记录容易忘记,现在就有点模糊了。用了才去学,用过了就忘了。用python语言写的爬虫,基于scrapy框架,部署在了scrapyd服务器中,设置了linux定时执行。爬取了开放的信息、并解析出想要获取的信息。尝试成功了登录后爬取,没有尝试成功使用动态ip代理实例。爬取海投网的时候频率过高被警告了,以后需要注意请求频率。

2017-08-29 17:45:23 256

原创 基于scrapy的智联职位爬取

1、项目截图2、setting.py项目配置文件# -*- coding: utf-8 -*-# Scrapy settings for zhaopin_zhilian project## For simplicity, this file contains only settings considered important or# commonly used. You

2017-08-29 17:05:41 2836 2

原创 基于echarts3的大屏展示

最近公司要做一个展厅大屏的监控页面,包括几种图表类型,柱状图、条形图、饼图、锥形图、中国地图、各省地图、仪表盘等。需求:以合适的图标展现指定的内容,要求实时监控。其中地图上要实时提现每个省的新增人数,点击某个省,弹出这个省的地图,实时展示每个市的新增人数及其他内容。整体高端大气上档次,给人实时监控的感觉。实时机制:由于需要实时展示,涉及定时刷新。为了看上去有实时的效果,做了伪实时的处理,把

2017-08-29 16:25:52 7836 3

原创 redis缓存数据库操作

1、设置redis缓存key的有效时间

2017-08-28 11:22:03 232

原创 测试ip是否可用(ip代理时)

import telnetlibtry:    telnetlib.Telnet('192.168.112.95', port='680', timeout=20)except:    print('connect failed')else:    print('success')

2017-08-21 17:58:34 3284 1

原创 爬虫整体结构

1、开发语言是python2、使用开源爬虫框架scrapy3、使用scrapy对应的服务器scrapyd4、使用crontab定时机制

2017-08-21 17:06:43 518

原创 设置linux定时任务

1、输入命令crontab -e2、添加要定时执行的命令3、保存退出,大功告成

2017-08-21 14:05:31 214

原创 把scrapyd设置为系统后台服务和启动项

一、设置为系统后台服务1、新建文件/etc/init.d/scrapyd,名称为scrapyd#!/bin/bashPORT=6800HOME="/var/scrapyd"BIN="/usr/local/bin/scrapyd" pid=`netstat -lnopt | grep :$PORT | awk '/python/{gsub(/\/python/,"",$7);pri

2017-08-21 13:56:30 2516 3

原创 linux安装scrapy出错'x86_64-Linux-gnu-gcc' failed with exit status 1

出错内容:'x86_64-linux-gnu-gcc' failed with exit status 1解决办法:sudo apt-get build-dep python-lxmlsudo pip install lxml --upgradesudo apt-get install build-essential libssl-dev libffi-dev python

2017-08-17 15:27:39 367

原创 scrapy框架笔记

1、xpaht返回的节点也可以再次进行xpaht解析:zw_table = response.xpath('//table[@class="newlist"]')        gsmc=zw_table[1].xpath('.//td[@class="gsmc"]//a[1]/node()').extract()2、获取节点内的html全部内容包含html变迁,用法: 

2017-08-11 10:19:48 203

原创 scrapy学习之一-基础

1、scrapy是python语言编写的爬虫框架,支持扩展,帮开发者完成了基础的搭建,开发者只需开发核心代码。至于爬取速率、cookie、线程数、间隔时间只需要配置即可。一定程度上方便了开发者。好像不支持分布式吧,也谈不上分布式,支持并发,默认并发请求16个。2、用scrapy主要写spider、item、pipe。

2017-08-10 19:55:20 280

原创 Python之安装部署

1、下载安装、部署步骤忘了,上上周做的事情。用的版本是3.5.22、用的开发工具是sublime,记得需要配置一些东西才能用

2017-08-07 09:13:57 255

kcbdemo.zip

js课程表插件,特别适用于手机端网页,页面仿照超级课程表APP页面。这是基于别人的Timetables.js插件,进行了美化和功能完善,特别适用于手机端,如微信公众号、小程序、APP等中展示,兼容PC端。

2020-03-25

sqlserver导出mysql.zip

sqlserver导出mysql工具,通过此工具可以把sqlserver里的数据导出mysql库格式的备份,已经自己测试过可用

2019-08-30

ODAC112x64位.zip

ODAC112x64位.zipODAC112x64位.zipODAC112x64位.zipODAC112x64位.zipODAC112x64位.zipODAC112x64位.zip

2019-08-21

ODAC安装及说明.zip

Oracle控件ODAC的下载安装及使用 安装环境:ODAC 9.3 for Delphi 7 编译及安装: 1、打开并编译安装Source\Delphi7\dac70.dpk 2、打开并编译安装Source\Delphi7\dacvcl70.dpk 3、打开并编译安装Source\Delphi7\dcldac70.dpk 4、打开并编译安装Source\Delphi7\odac70.dpk 5、打开并编译安装Source\Delphi7\odacvcl70.dpk 6、打开并编译安装Source\Delphi7\dclodac70.dpk 7、打开并编译安装Source\Delphi7\oraprov70.dpk 8、将D:\Program Files\Bo rland\ODAC 9.3\Source和D:\Program Files\Borland\ODAC 9.3\ODAC\Source\Delphi7 添加到"Search Path"中("D:\Program Files\Borland\ODAC 9.3\ODAC\"是我放置ODAC的路径,你要换成你自已的路径, 如果你不放置"C:\Program Files\Borland\BDS\4.0\ODAC\Source"则会出现"File not found: 'DBAccess.res'"的错误).

2019-08-20

java调用Cloudera Manager Api实例

Cloudera Manager API调用实例(JAVA版),已通过测试可用。Cloudera Manager API调用实例(JAVA版),已通过测试可用。

2019-03-31

tomcat-juli.jar,tomcat-juli-adapters.jar解决tomcat日志cataline.out过大问题

tomcat7配置log4j解决catalina.out日志过大问题,tomcat-juli.jar,tomcat-juli-adapters.jar解决tomcat日志cataline.out过大问题

2018-09-27

pdf转word,破解版,含注册码

PDF转word破解版(内含说明和注册码),有说明文档,亲自试过,可以,所以分享出来

2018-07-27

hadoop2.7中文文档

hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档hadoop2.7中文文档

2018-02-23

大数据架构商业之路:从业务需求到技术方案.黄申.机械工业出版社2016.05pdf

大数据架构商业之路:从业务需求到技术方案.黄申.机械工业出版社2016.05,高清pdf书籍

2017-10-30

Android编程权威指南 第3版 pdf和随书源代码

Android编程权威指南 第3版.pdf,高清。Android编程权威指南 第3版.pdf

2017-10-30

Android编程权威指南(第3版)随书源代码

Android编程权威指南(第3版)随书源代码,Android编程权威指南(第3版)随书源代码

2017-10-30

java连接hbase的jar包

java连接hbase的jar包,java连接hbase的jar包,java连接hbase的jar包,java连接hbase的jar包

2017-10-30

c3p0jar包下载、c3p0连接池

c3p0jar包下载、c3p0连接池c3p0jar包下载、c3p0连接池c3p0jar包下载、c3p0连接池

2017-10-27

hive jdbc依赖的jar包

hive_jdbc,经过测试可以连接的。有需要的可以下载看下。hive_jdbc,经过测试可以连接的。有需要的可以下载看下。

2017-09-27

java连接hive依赖的jar包

java连接hive依赖的jar包,以jdbc方式连接hive,进行hive操作。java连接hive依赖的jar包,以jdbc方式连接hive,进行hive操作。

2017-09-27

echarts城市名和对应的经纬度

echarts各城市经纬度信息,可直接用在echarts中,包含全国各个城市的经度、维度信息echarts各城市经纬度信息,可直接用在echarts中,包含全国各个城市的经度、维度信息

2017-09-01

基于scrapy的爬虫小例子

基于scrapy的爬虫小例子,用python3编写,成功爬取指定网址网页内容基于scrapy的爬虫小例子,用python3编写,成功爬取指定网址网页内容

2017-08-29

基于scrapy的智联职位爬虫

基于scrapy的智联职位爬虫,使用python3.

2017-08-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除