自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (1)
  • 收藏
  • 关注

原创 掘金15W沸点简单分析(二)

一、数据预处理与入库获取到了原始数据之后,下一步就是清洗入库。1.1 数据模型因为是简单分析,所以只获取话题、用户、消息三块内容。具体如下:class Pins(object): """ 沸点 """ msg_id = None # 沸点ID topic_id = None # 话题ID topic_title = None # 话题名称 user_id = None # 用户ID user_name = None #

2020-09-21 11:05:55 94

原创 掘金15W沸点简单分析(一)

数据分析之数据采集(仅Web爬虫相关)。本文继续从爬虫入手。不过这次使用的是Python。一、另一种方式的爬虫爬虫通常是:①得到目标网页URL;②发起HTTP请求得到网页数据;③使用各种方式解析网页得到想要的数据;通常,在第②步,是不会去执行页面中的JS代码的。有些网站,会使用Ajax异步加载一些数据,然后再渲染到页面上的;或者使用JS对页面Dom做一些修改。这样都会导致第②步请求的页面中缺少、甚至是没有目标数据。这就需在获取到网页数据后,执行页面中的JS代码了。最早是使用phantomjs+s.

2020-09-21 11:04:46 431

原创 基于Spring Boot + Dubbo的全链路日志追踪(二)

一、概要紧接上一篇,完成分析之后,就要具体的实现了。service-a: 实现dubbo服务。service-b: 实现web服务,并调用service-a实现的服务。二、实现2.1 日志采集及存储本例直接使用【阿里云·日志服务】进行数据存储和检索,使用Aliyun Log Logback Appender进行日志收集及上传。其实就是阿里自己实现了一个Logback Appender...

2019-08-10 12:14:25 1116

原创 基于Spring Boot + Dubbo的全链路日志追踪(一)

一、 概要当前公司后端整体架构为:Spring Boot + Dubbo。由于早期项目进度等原因,对日志这块没有统一的规范,基本上是每个项目自己管自己的日志。这也对后面的问题排查带来了很大的困难,特别是那些需要同时或者多级调用Dubbo的服务场景,排查起来更加的困难。现在需要实现从请求开始,到请求结束的全程日志跟踪。需求很简单,实现思路也不难,只需要全局添加一个traceId即可。当然只有日...

2019-05-28 09:50:35 489 1

ppt演示文稿转换成word文档

小巧的软件,将ppt中的文字提取出来。大小仅有76Kb。

2011-02-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除