自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 每平每屋模型组件采集策略研究

该站点JS代码存在混淆加密,函数名都为随机数字或字母,且一些关键方法是通过函数回调机制调用的sign值为32位的字符串,容易误导破解方向,误以为MD5加密方式关键词搜索结果较多的时候,可以通过前端事件监听方面入手缩小关键词分布的JS范围,减轻分析量httpshttpshttpshttpshttpshttpshttps。...

2022-07-18 17:22:57 364 1

原创 自动化测试

import win32apiimport win32guiimport win32confrom pykeyboard import PyKeyboardimport timeimport pyperclipdef copyPast(key_word): k = PyKeyboard() pyperclip.copy(key_word) time.sleep(2) k.press_key(k.control_key) k.tap_key('v').

2021-07-01 17:51:48 93

原创 PDF解析

import pdfplumberimport reimport osimport pandas as pdimport openpyxl as xlfrom docx import Documentclass parseFile(): def __init__(self): self.chapter_regex = [ r'问题[一二三四五六七八九十]+:\s*(.*?)?\s+', r'\s+\d+\.\s*(.*.

2021-06-30 22:45:41 95

原创 PDF解析

import pdfplumberimport pandas as pdimport redef getQueAndAnw(textBlock): print(textBlock) resultList = [] queLi = [] anwLi = [] textStr = ''.join(textBlock) print(textStr) # preList = re.split(r'?\s+\n|\n\s+\n', textStr).

2021-06-25 17:56:38 108

原创 hudongyi

# -*- coding: utf-8 -*-import sysimport requestsimport randomimport jsonimport jsonpathimport timeimport datetimefrom random import randintfrom lxml import etreeheaders = { "Accept": "application/json, text/javascript, */*; q=0.01", "Ac.

2021-06-22 08:02:52 157

原创 企业年报数据抓取

# -*- coding: utf-8 -*-import sysimport requestsimport jsonimport jsonpathimport refrom readTxt import readTxtreload(sys)sys.setdefaultencoding('utf-8')class getAnnualReport(): def __init__(self): self.headers = { "Host.

2021-06-18 16:40:41 450

原创 互动易数据爬取demo

# -*- coding: utf-8 -*-import sysimport requestsimport randomimport jsonimport jsonpathimport timefrom random import randintreload(sys)sys.setdefaultencoding('utf-8')from selenium import webdriverfrom lxml import etreeheaders = { "Accep.

2021-06-15 20:00:51 1166 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除