自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (1)
  • 收藏
  • 关注

原创 linux挂载windows共享文件

最近自己的机器创建了几个虚拟机器,但是想将虚拟机器的测试文件都放到一个目录上面进行管理,所以采用了linux挂载windows共享文件。从网上查资料 步骤如下:第一步 创建windows的共享 ,共享出一个网络位置,如: E:\xiami  设置共享任何用户都可以访问第二步 root 进入linux  创建 /xiaomin_interface 目录mkdir /xiaomin_interface...

2018-02-08 17:57:06 321

转载 java urldecode笔记

package com.util;import java.io.UnsupportedEncodingException;/** * url转码、解码 * * @author zhuan  * @date 2015-3-17 下午04:09:35 */public class UrlUtil {    private final static Strin

2017-06-14 14:25:07 1205

原创 hive 换行符特殊字符规避

在研究hive的时候遇到一些问题,在oracle表中查询很正常,结果导入到hive中就很不理想。究其原因其实是因为hive是解析文本文件导致无法处理带分隔符或者回车符或者特殊字符,转义字符等等问题。因为oracle在存储数据的时候有自己的一套二进制流写入方法,对于特殊字符基本都支持。所以在这里我研究了采用sqoop和hive来兼容这种方法:第一步: 改造sqoop文件sqoop

2017-06-14 14:15:45 9069

原创 spark清洗离线数据

最近花了半个月时间研究了一哈scala 感觉可以做的东西还是蛮多了。目前工作清洗40多G的数据很费劲(采用oracle做很费事),所有研究了spark来清洗离线数据。废话不多说开始程序设计:首先我想到的是输入 这里采用HDFS文件。假设我们将oracle的数据采用json格式的形式并且采用urldecode方法转换文本(因为一些特殊字符常常会导致我们的json文件读取异常,所有我这里采用转

2017-06-14 09:33:06 9645

转载 oracle脚本参考

后续更新

2017-06-05 11:54:31 408

有关excel文件导入到SQL Server数据库的代码

有关excel文件导入到SQL Server数据库的代码

2010-06-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除