自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 Failed to publish events kafka.common.FailedToSendMessageException: Failed to send messages after 3

flume监听数据发送给kafka的消费者,出现情况,kafka重复消费flume的数据,查看了flume的日志报错如下(org.apache.flume.sink.kafka.KafkaSink.process:145) - Failed to publish eventskafka.common.FailedToSendMessageException: Failed to send m...

2019-01-08 18:51:58 2368

原创 org.apache.spark.SparkException: ArrayBuffer(org.apache.spark.SparkException: Couldn't find leaders

org.apache.spark.SparkException: ArrayBuffer(org.apache.spark.SparkException: Couldn’t find leaders for Set([testTopic0,0])),本人新程序报错如下,由于我用的是虚拟机运行,同一个机器开启的多个broker,也就是config/server.propries文件,由于内存设置的比...

2019-01-03 17:31:58 1366

转载 Pyecharts 根据经纬度和量值的大小,画出散点图

      大家都知道python各种的好,但是呢在可视化方面还是有所欠缺的,而今天的主角pyecharts就很好的弥补了这一短板,今天先简单的介绍一下如何利用pyecharts使得我们的数据可视化效果更加好。小文汇总了一下,利用pyecharts我们可以作图的类型分别为:Bar(柱状图/条形图),Bar3D(3D 柱状图),B

2018-10-21 21:51:45 16291 8

转载 pyecharts详细配置绘制图表

Echarts 是百度开源的一个数据可视化 JS 库。主要用于数据可视化。 pyecharts 是一个用于生成 Echarts 图表的类库。实际上就是 Echarts 针对Python 的接口。安装pip install pyecharts图形初始化图表类初始化所接受的参数(所有类型的图表都一样)。title -> str 主标题文本...

2018-10-21 21:22:07 4546 3

原创 selenium爬去数据,能找到父元素,find_elements_by_xpath不能找到下面的子元素

1.先来看一份数据![在这里插入图片描述](https://img-blog.csdn.net/20181019160743971?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTY2NjA1MQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70) ...

2018-10-19 17:13:20 12317 3

转载 python 根据地址反求出经纬度

方法一:import requstimport jsondef getlnglat(address): ak = 'f30c9d52b003c2b3ac089e2672e18baf' url="http://restapi.amap.com/v3/geocode/geo?key=%s&address=%s"%(ak,address)data=requests.get(url) ...

2018-10-19 17:12:56 1812

转载 scrapy爬取某网站,设置cookies

为什么要伪装cookies在访问网站的时候,我们经常遇到有些页面必须用户登录才能访问。我们以前即使写的伪装了代理ip,设置了头信息,但是运行次数多了还是会被封。由于本节只是单纯的想保持一下登陆状态,所以就不写复杂的获取页面了原理一般情况下,网站通过存放在客户端的一个被称作cookie的小文件来存放用户的登陆信息。在浏览器访问网站的时候,会把这个小文件发往服务器,然后...

2018-10-11 23:20:17 2949 1

原创 scrapy 提取多层嵌套标签下的所有文本

怎样才能一次性提取多层嵌套标签的所有文本,详细如下:假如页面如下:<p id='test'>hello<b>world!</b></p>我要的提取结果是:world!(假设world是很多标签组合的文本)这里就需要注意text()的使用了:首先设置sel = Selector(text=doc, type='html')如果text(...

2018-10-10 19:39:42 2542

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除