自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 boss反爬算法--------2020/12/17

仅限用于学习!所以不贴图了, 纯文字记录boss动态加密,但是算法还是一样的,zp_token通过基本的断点进去,可以看到一个大数组,一个string的去尾的拓展,还有一个数组的倒置。把解密函数b扣出来,可以知道通过简单地转化就可以得到原来的字符。 最后生成的149位字符串,由 4位字符串 + ‘b’+ 144 位字符串组成, 其中4位字符串,是直接在大数组里面,需要找到对应的index, 144位字符串通过 boss自定义的函数_b64_encode 传递106位数组转化而来, 所以...

2020-12-17 16:47:36 440

原创 boss反爬算法------2021.9.24

最近又更新了次,记录下,老样子搜索zp_token打断点进入调试阶段,js已经跟之前不一样了,H这次的版本更新主要是控制流平坦化更麻烦了,看了下流程, 开头还是定了拓展属性push-p 之类的,无伤大雅,看还是可以看的,对于这个流程,看完之后,直接定位到生成最后的zp_token阶段, 跟之前的版本可能有点不一样,主要是数组的位数变了, 为啥变了, 从我上篇文章可以看到,17位的随机数组,已经改成16位了, 然后的话,也不能算完全随机吧,具体没测,不知道检测与否,104位数组的加密,之前有个转化字符串的过程

2021-09-24 11:57:53 429

原创 自我学习爬虫的一些???

写的不好, 请多担待爬虫从最基础的请求网页库 urllib开始, 然后延续到requests库,伪造下浏览器的头部,然后通过你会的各式各样的解析库(lxml, scrapy的Selector, pyquery, bs4....), 就已经可以简单的抓取一些网页的静态数据,每个网站对其数据有着不同的看法,也就导致了会有对数据加密的问题首先的话,一个时间段频繁的访问网站,会导致ip封锁的...

2019-11-27 14:53:30 5874

原创 抖音数字加密

今天看了一下抖音的数字加密,和美团的数字加密其实没多大区别,一个svg(美团),一个woff(抖音),抖音的字体文件就这https://s3.bytecdn.cn/ies/resource/falcon/douyin_falcon/static/font/iconfont_9eb9a50.woff,从使用以来,它好像不想换了,不像美团经常换(需要匹配css里面的属性),抖音这个数字加密还是太垃圾了...

2019-03-15 17:56:16 2254 1

原创 python爬虫:大众点评商家信息 9012 10/23

昨天看了下这个网站,了解了下,挺好玩的,今天写了代码,运行的话,没太大问题,主要的问题,就是大众点评的验证码问题,以及其汉字svg的问题,对于大众点评,相信很多人都想要其数据,说说抓取思路吧,搜索后的网页,大致是这样的http://www.dianping.com/guangzhou/ch10/g110,对于其店铺的信息,都是svg图截图的数据,大家多刷新几次就可以在开发者工具中发现css中的几个...

2018-12-26 17:32:13 865

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除