自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (3)
  • 收藏
  • 关注

原创 pyspark graphdataframes踩坑记

pyspark 使用graphdataframes踩坑记报错ModuleNotFoundError: No module named 'graphframes'接着报错java.lang.ClassNotFoundException: org.graphframes.GraphFramePythonAPI官方网链接无法下载graphframes-xxx.jar包如果运行时报错java.lang.ClassNotFoundException: com.typesafe.scalalogging.slf4j.L

2021-05-16 11:08:27 1464 2

转载 Flume构建日志采集系统

Flume构建日志采集系统

2019-06-28 13:54:56 228

转载 windows 部署 flume 1.7.0

[windows 部署 flume 1.7.0](https://blog.csdn.net/u012373815/article/details/62453731)

2019-06-27 16:45:51 141

转载 Kafka 及 PyKafka 的使用

Kafka 及 PyKafka 的使用

2019-06-27 16:39:47 2076

转载 python使用kafka

python使用kafka

2019-06-26 16:42:34 1097

转载 python使用kafka需要安装pykafka

https://www.cnblogs.com/hopelee/p/7285340.html

2019-06-25 16:38:38 4216

转载 CDH5.14.X安装Kafka过程(Kafka版本选择的过程)

CDH5.14.X安装Kafka过程(Kafka版本选择的过程)

2019-06-25 09:28:09 539

转载 spark sql读取映射hbase数据的hive外部表报错

[spark sql读取映射hbase数据的hive外部表报错](https://blog.csdn.net/lhxsir/article/details/81115264)

2019-06-19 22:44:40 450

原创 spark df写入parquet或hbase报错

1.cdh5.13.3.p0.611179/lib/spark2/python/pyspark/sql/types.py", line 1400, in verify_struct“length of fields (%d)” % (len(obj), len(verifiers))))ValueError: Length of object (1) does not match with l...

2019-06-15 21:54:19 845

转载 spark配置参数

https://blog.csdn.net/xianpanjia4616/article/details/80945660

2019-06-14 15:12:15 105

原创 pyspark通过thirft接口读写hbase

数据类型:hbase只支持字符串,而dataframe有许多的数据类型,如何进行类型转换?

2019-06-09 08:46:59 187

转载 在CDH中远程使用jupyter(与pyspark连接)

参考链接

2019-06-08 19:06:48 383

原创 pyspark连接hbase的三种方式

第一种方式通过thrift接口,这种方式是最简单的,但是访问速度慢,而且thrift接口socket是由超时的用Python操作HBase之HBase-Thrift通过happybase增强thrift接口安装happyhbase安装过程失败,尝试修正方法,centos7yum install python-devel安装happybase也失败了。看了只有使用原生的thrift接口...

2019-06-08 10:56:33 3396

原创 Markdown基本语法

花一点时间学习Markdown基本语法,把一些经验总结放到博客上,可以提高自己的开发的效率。简单的命令,就可以让自己看起来觉得清爽。几级标题就用几个#号,如:一级标题二级标题字体粗体,加两个星号斜体,加一个星号粗体加斜体,三个星号删除线条,两个波浪线粗体斜体粗体加斜体删除分割线代码段单行代码用波浪线小写int a多行代码int a int bint ...

2019-06-08 09:18:29 64

原创 python通过thrift接口操作Hbase

python通过thrift接口操作Hbase创建表创建表from thrift import Thriftfrom thrift.transport import TSocketfrom thrift.transport import TTransportfrom thrift.protocol import TBinaryProtocolfrom hbase import Hbas...

2019-06-08 08:47:12 493

graphdataframes jars.zip

使用python spark的图graph,需要用到graphdataframes相关的文件

2021-05-16

SPSS数据.zip

数据包含sav和excel,sav可以通过spss在线导出为excel格式,用于python,R等其他数据分析工具。

2019-05-23

数据库系统概论配套ppt

数据库系统概论配套的ppt数据库系统概论配套的ppt数据库系统概论配套的ppt数据库系统概论配套的ppt

2018-07-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除