- 博客(900)
- 资源 (94)
- 收藏
- 关注
原创 基于pandarallel的Pandas并行操作
Pandarallel提供了一种简便的方式来并行操作Pandas,并且支持进度条显示,支持Windows和Linux。
2024-04-18 20:30:00 37
原创 Flask基于flask_login实现登录、验证码
flask_login 是一个 Flask 扩展,用于在 Flask web 应用中实现用户会话管理。它允许你跟踪哪些用户已经登录,并管理他们的登录状态。flask_login 提供了用户认证的基础结构,但具体的用户验证(如用户名和密码检查)和存储(如数据库)需要你自行实现。以下是 flask_login 的一些主要特性和功能:用户登录和注销:提供用户登录和注销的接口。用户认证:通过装饰器(如 @login_required)确保只有已登录的用户才能访问特定的视图或路由。
2024-04-11 23:45:00 416
原创 利用Python实现可视化交互界面:Dash
Dash是一个低代码数据框架,用Python实现可视化交互界面,不用写Javascript,开源,支持回调、HTML组件等功能。
2024-04-11 21:00:00 522
原创 Ollama利用嵌入模型实现RAG应用
Ollama支持embedding models嵌入模型,从而支持RAG(retrieval augmented generation)应用,结合文本提示词,检索到文档或相关数据。嵌入模型是通过训练生成向量嵌入,这是一长串数字数组,代表文本序列的关联关系。Ollama的嵌入模型有三种:mxbai-embed-large、nomic-embed-text 、all-minilm。
2024-04-11 19:00:00 756 1
原创 Python字符串模糊匹配:thefuzz
在查询数据时,字符串匹配经常用到模糊匹配,这时就要用到模糊匹配算法,如Levenshtein Distance 算法,计算编辑距离,这里Python的thefuzz包实现了模糊匹配功能。
2024-04-07 16:33:08 160
原创 Pandas读取mysql报错:UserWarning: pandas only supports SQLAlchemy connectable (engine/connection)
Pandas连接mysql用到了read_sql()方法,参数con必须是可以被连接的。以前con直接是,能正常读取数据,最近测试不行了,报下面的错误,就改为以下三种方式了,测试可用。
2024-04-02 10:06:57 35
原创 基于textdistance计算文本相似度
textdistance是Python的第三方库,用于计算文本之间的相似度或距离。它提供了30+个算法,简单易用。
2024-03-08 19:45:00 312
原创 基于textrank4zh实现文本提取关键词、关键短语、摘要
TextRank算法可以用来从文本中提取关键词和摘要(重要的句子)。TextRank4ZH是针对中文文本的TextRank算法的python算法实现。
2024-03-08 18:20:07 440
原创 基于similarities的文本语义相似度计算和文本匹配搜索
similarities 实现了多种相似度计算、匹配搜索算法,支持文本、图像,python3开发。
2024-03-07 21:00:00 1801
原创 Gensim实现文本相似度/匹配/查重
Gensim是基于Python语言的自然语言处理库,用来主题建模、文本相似度等文本处理任务。Gensim的工作流程包括:分词、生成词典、向量化、模型训练等。
2024-03-07 19:00:00 366
原创 Python操作Word表格对齐、单元格对齐
通过Table的alignment可以设置表格居左对齐、居中对齐、居右对齐。通过Cell的vertical_alignment可以设置垂直位置。通过单元格里段落的alignment可以设置文本的左右对齐方式。
2024-02-06 19:00:00 1324
原创 python将Word页面纸张方向设置为横向
通过python-docx的章节属性,就可以更改纸张方向、纸张尺寸。更改纸张方向,分两步,第一步是设置section的orientation属性为LANDSCAPE,第二步是设置section的宽高互换。
2024-02-06 14:00:00 1225
原创 Pandas求百分比:单列、多列、格式化
先用sum()求出一列的总和,然后用两种方法分别求出百分比。一种是直接除,另一种用apply,应用到每一列。另外还用到了format来格式化,带上百分号。
2024-02-06 07:45:00 133
原创 pandas绘制饼图:百分比、定制标签、关闭图例、支持中文
使用plot来绘图,kind指定绘图类型是饼图,y轴是size,y轴标签是空,legend图例关闭,标题是饼图。使用plt.pie方法来绘制饼图,其中labels用来设置标签,autopct格式化,这里显示了百分比。
2024-01-30 19:00:00 143
原创 Pandas展开数据
使用 Pandas 的 explode 函数来展开 ‘data’ 列中的嵌套列表。原始 DataFrame 中,每一行包含一个列表,使用 explode 后,这些列表会被展开,使得每一行中的每个元素都成为单独的一行。然后,打印处理后的 DataFrame。
2024-01-29 21:00:00 60
原创 Pandas实现列表个数统计并转换为字典
Pandas实现列表个数统计并转换为字典,首先把列表转换成Series对象,然后调用Series的value_counts方法,用来统计每个元素的个数,最后调用to_dict方法,把Series对象转换为字典。
2024-01-29 20:45:00 116
原创 Win7 和 Win Server 2008 安装Anaconda报错:Failed to extract packages
在Python官网来看,Python 3.8.18之后,就不再支持Windows7。对应Anaconda的版本就是anaconda3-2021.05。
2024-01-26 19:00:00 432
原创 Pandas设置图像宽高、分辨率、背景色、显示中文、增加子区域、图题、坐标名称、网格线
figure方法可以设置绘图对象的长、宽、分辨率及背景颜色等。
2024-01-26 08:00:00 613
原创 Pandas数据可视化:折线图、条形图、直方图、箱形图、核密度图、面截图、饼图、散点图、六边形图
plot()方法可以绘制图形,常见参数如下:(1)x:用来设置所绘制图形的x轴数据。(2)y:用来设置所绘制图形的y轴数据。(3)kind:用来设置所绘制图形的样式,默认为:line(折线图)、bar(垂直条形图)、barh(横向柱状图,即横向条形图)、hist(直方图)、box(箱形图)、kde(核密度估计图)、density(同 kde)、area(面积图)、pie(饼图)、scatter(散点图)、hexbin(六边形箱体图,即六边形图)。
2024-01-26 07:00:00 114
原创 基于matplotlib封装的可视化库Seaborn:设置风格样式、设置环境
seaborn是一个基于matplotlib进行高级封装的可视化库,相比之下,绘制图表更为集成化、绘图风格具有更高的定制性。
2024-01-25 08:00:00 394
原创 基于python的网页自动化工具:DrissionPage
DrissionPage 是一个基于 python 的网页自动化工具。它既能控制浏览器,也能收发数据包,还能把两者合而为一。可兼顾浏览器自动化的便利性和 requests 的高效率。它功能强大,内置无数人性化设计和便捷功能。它的语法简洁而优雅,代码量少,对新手友好。
2024-01-24 08:00:00 761
原创 Pandas DataFrame重命名索引 index 键和值
Pandas的索引是一个很重要的概念,Series和DataFrame都有索引,索引对象有很多方法和变量,这里列举了修改索引键值的几个例子。
2024-01-01 00:15:10 517
原创 aardio网页组件:webPageOperation
webPageOperation是webview得初步封装,用来网页填表、操作网页。可操作web.form、web.view、web.view2等浏览器组件。
2023-12-13 22:00:00 323
原创 抓包工具:Sunny网络中间件
支持 获取/修改 HTTP/HTTPS/WS/WSS/TCP/TLS-TCP/UDP 发送及返回数据。可用于HTTP/HTTPS/WS/WSS/TCP/UDP网络分析 为二次开发量身制作。支持 对 HTTP/HTTPS/WS/WSS/TCP/TLS-TCP 链接重定向。Sunny网络中间件 和 Fiddler 类似。是可跨平台的网络分析组件。支持 对 HTTP/HTTPS/WS/WSS 指定连接使用指定代理。支持 WS/WSS/TCP/TLS-TCP/UDP 主动发送数据。
2023-12-13 07:42:03 1987
原创 PyTorch实现逻辑回归
构建逻辑回归参数w = torch.tensor([1.,],requires_grad=True) # 随机初始化wb = torch.zeros((1),requires_grad=True) # 使用0初始化b这里使用了平方损失函数来估算模型准确度。
2023-12-09 22:28:03 397
原创 Initializing libiomp5md.dll, but found libiomp5md.dll already initialized.
按照提示,设置KMP_DUPLICATE_LIB_OK环境变量为True。
2023-12-09 21:57:20 110
原创 pandas read_sql报错:AttributeError: ‘OptionEngine‘ object has no attribute ‘execute‘
pandas不兼容问题sqlalchemy 2.0以上版本。
2023-12-04 23:45:00 246
原创 Python concurrent.futures实现多进程多线程编程
Python的concurrent.futures模块可以很方便的实现多进程、多线程运行,减少了多进程带来的的同步和共享数据问题。Executor是一个抽象类,表示一个可执行的上下文。Future则代表一个将要执行的任务,并提供了一些方法来获取任务的状态和结果。ThreadPoolExecutor是Executor的一个具体实现类,它使用线程池来执行任务。
2023-12-02 23:45:00 206
原创 Flask、Pandas实现文件下载
Flask实现文件下载可以用send_file函数,接收BytesIO比特流对象,也可以重命名下载文件,是否可以作为附件下载。注意:output比特流要初始化指针到开头。
2023-12-02 21:20:37 142
原创 pandas美化表格并导出到Excel
Dataframe.style可以美化Pandas样式。导出样式到Excel的功能只有openpyxl渲染引擎支持。
2023-12-02 21:11:57 263
原创 Pandas在Excel同一个sheet里插入多个Dataframe和行
Pandas默认的to_excel是直接把完成的Datafrme写入一个sheet里,这并不能满足我们在一个sheet里插入多个Dataframe或多行的需求。为了实现插入多行或多Dataframe的目的,我们需要新建一个ExcelWriter对象,然后依次插入数据。这里我们以插入2个Dataframe和三行单元格为例。
2023-12-02 20:11:28 365
原创 pandas.get_dummies函数:把离散信息转换成onehot矩阵
pandas.get_dummies函数用来把可以分类信息转换成0和1矩阵。
2023-12-02 13:45:00 229
原创 Pandas 获取年、季度、月第一天、最后一天,加一秒、加一天、午夜时间
标准化(午夜时间)本月初下个月初月底减去一秒加一天年第一天年最后一天参考pandas.Timestamp.htmlpandas.Series.dt.normalizepandas.tseries.offsets.MonthEnd.htmlpandas.tseries.offsets.MonthBegin.html
2023-11-24 21:00:00 642
安卓 RE文件浏览器,Root Explorer PRO Apk 4.10.3
2022-11-22
x64dbg-snapshot-2022-10-18-22-09
2022-10-28
ChromeDriver-92.0.4515.107.zip
2021-08-12
ChromeDriver-87.0.4280.88.rar
2020-12-14
带exp的pwn测试文件
2020-09-12
TraceMe.exe year.exe.rar
2020-09-12
flag.rar图片逆向排序
2020-09-09
coconut_tree.zip
2020-08-30
chromedriver_2.46.zip
2020-06-29
chromedriver_84.0.4147.30.zip
2020-06-29
Magisk-v20.4+MagiskManager-v7.5.0+Magisk-uninstaller-20200323.zip
2020-06-18
阿里巴巴新版Java开发手册.rar
2020-04-29
poppler-0.68.0_x86.7z
2019-10-25
quamotion-webdriver.0.123.3.win7-x64.zip
2019-08-15
selenium-server-standalone-3.141.59
2019-01-08
mozilla firfox geckodriver v0.23.0 火狐 webdriver
2018-11-20
ChromeDriver v2.44
2018-11-20
APK反编译工具apktool-dex2jar-luyten-jd-gui
2018-10-17
ChromeDriver 2.39 win32
2018-05-31
强化学习在阿里的技术演进与业务创新
2018-02-06
TensorFlow机器学习实战指南中英双语版-epub和pdf格式
2018-01-31
Reinforcement Learning An Introduction Second edition
2017-12-14
SVG精髓(第2版) (图灵程序设计丛书) 英文版
2017-10-26
Linear Algebra and Its Applications 5th Edition (David C. Lay)全书9-10章及所有答案
2017-10-25
网络安全思维导图
2017-09-19
《Windows程序设计》第五版 源码
2017-09-11
hanlp-portable-1.3.2.jar
2017-04-18
emmet PythonScript 打包压缩文件
2017-03-20
simplehtmldom
2014-05-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人