- 博客(7)
- 收藏
- 关注
原创 每平每屋模型组件采集策略研究
该站点JS代码存在混淆加密,函数名都为随机数字或字母,且一些关键方法是通过函数回调机制调用的sign值为32位的字符串,容易误导破解方向,误以为MD5加密方式关键词搜索结果较多的时候,可以通过前端事件监听方面入手缩小关键词分布的JS范围,减轻分析量httpshttpshttpshttpshttpshttpshttps。...
2022-07-18 17:22:57 364 1
原创 自动化测试
import win32apiimport win32guiimport win32confrom pykeyboard import PyKeyboardimport timeimport pyperclipdef copyPast(key_word): k = PyKeyboard() pyperclip.copy(key_word) time.sleep(2) k.press_key(k.control_key) k.tap_key('v').
2021-07-01 17:51:48 93
原创 PDF解析
import pdfplumberimport reimport osimport pandas as pdimport openpyxl as xlfrom docx import Documentclass parseFile(): def __init__(self): self.chapter_regex = [ r'问题[一二三四五六七八九十]+:\s*(.*?)?\s+', r'\s+\d+\.\s*(.*.
2021-06-30 22:45:41 95
原创 PDF解析
import pdfplumberimport pandas as pdimport redef getQueAndAnw(textBlock): print(textBlock) resultList = [] queLi = [] anwLi = [] textStr = ''.join(textBlock) print(textStr) # preList = re.split(r'?\s+\n|\n\s+\n', textStr).
2021-06-25 17:56:38 108
原创 hudongyi
# -*- coding: utf-8 -*-import sysimport requestsimport randomimport jsonimport jsonpathimport timeimport datetimefrom random import randintfrom lxml import etreeheaders = { "Accept": "application/json, text/javascript, */*; q=0.01", "Ac.
2021-06-22 08:02:52 157
原创 企业年报数据抓取
# -*- coding: utf-8 -*-import sysimport requestsimport jsonimport jsonpathimport refrom readTxt import readTxtreload(sys)sys.setdefaultencoding('utf-8')class getAnnualReport(): def __init__(self): self.headers = { "Host.
2021-06-18 16:40:41 450
原创 互动易数据爬取demo
# -*- coding: utf-8 -*-import sysimport requestsimport randomimport jsonimport jsonpathimport timefrom random import randintreload(sys)sys.setdefaultencoding('utf-8')from selenium import webdriverfrom lxml import etreeheaders = { "Accep.
2021-06-15 20:00:51 1166 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人