万里鹏程转瞬至-CSDN博客

原创将gdip-yolo集成到yolov9模型项目中（支持预训练的yolov9模型）

YOLOv9意味着实时目标检测的重大进步，引入了可编程梯度信息（PGI）和通用高效层聚合网络（GELAN）等开创性技术。该模型在效率、准确性和适应性方面取得了显著改进，在MS COCO数据集上建立了新的基准。YOLOv9项目由一个独立的开源团队开发，建立在Ultralytics YOLOv5提供的强大代码库的基础上，展示了人工智能研究社区的合作精神。yolov9模型在coco数据集的效果如下所示。

2024-04-18 21:43:09 43

原创将gidp模块、ipam集成到ultralytics项目中实现支持预训练权重的gidp-yolov8、ipam-yolov8

gdip-yolo与ia-seg都是一种将图像自适应模块插入模型前面，从而提升模型在特定数据下检测能力的网络结构。gdip-yolo提出了gdip模块，可以应用到大雾数据与低亮度数据（夜晚环境），然后用于目标检测训练；ia-seg将ia-yolo中的代码修改了一下修车了ipam模块，应用到低亮度数据（夜晚环境），然后用于语义分割训练。我们可以抽取gdip模块与ipam模块，完全嵌入到ultralytics项目中，以支持ultralytics项目中的任意模型，目前已经验证支持yolov8n-gdip.yaml

2024-04-17 22:51:23 101 2

原创模型剪枝中的预训练权重真的有用么？重新思考模型剪枝的价值

过度参数化是深度神经网络中一个被广泛存在的情况，这导致了高计算成本和高推理内存占用。在低资源环境下，网络剪枝被广泛用于降低深度模型的推理成本。典型的网络剪枝过程包括三个阶段： 1)训练一个大型的、过参数化的模型（有时有预训练后的模型），2)根据一定的标准对训练后的大型模型进行剪枝，3)对剪枝后的模型进行微调，以恢复失去的性能。网络剪枝方法的一个主要分支是个体权重剪枝（非结构化剪枝），该方法基于权重对结果的贡献进行剪枝（如L1、L2范数等）。然而，这些。

2024-04-14 10:57:48 1011

原创 pytorch 45 使用自己的数据对groundingdino进行微调

Grounding DINO是一种基于transformer的视觉语言检测方法，它可以根据文字描述检测指定目标。它是在DINO的基础上，增加了多个阶段的视觉语言模态融合，包括特征增强器、语言指导的查询选择模块和跨模态解码器。它可以实现最先进的对象检测器的性能，消除了对NMS等手工模块的依赖。然而在应用到业务数据上还是有所不足，故而需要对Grounding DINO进行微调。本博文基于Grounding-Dino-FineTuning项目实现对自己yolo数据的微调

2024-04-12 21:16:57 128 2

原创使用自己训练的superpoint与superglue模型进行图像配准

基于官方团队发布的预训练模型，使用SuperPoint与SuperGlue实现图像配准，可以参考基于官方团队发布的代码训练自己的模型，可以参考进行实现，训练出的模型不能直接参考上述博客进行部署，为此发布使用代码。本博文实现基于进行改进。

2024-04-04 20:50:22 1013 2

原创提取gdip-yolo与ia-seg中的图像自适应模块进行图像去雾与亮度增强

gdip-yolo与ia-seg都是一种将图像自适应模块插入模型前面，从而提升模型在特定数据下检测能力的网络结构。gdip-yolo提出了gdip模块，可以应用到大雾数据与低亮度数据（夜晚环境），然后用于目标检测训练；ia-seg将ia-yolo中的代码修改了一下修车了ipam模块，应用到低亮度数据（夜晚环境），然后用于语义分割训练。这两个项目都发布了预训练模型，我们可以抽取预训练模型中的图像自适应模块进行数据增强。

2024-03-29 22:41:47 160

原创 LangSAM项目优化，将SAM修改为MoblieSAM，提速5~10倍

Language Segment-Anything 是一个开源项目，它结合了实例分割和文本提示的强大功能，为图像中的特定对象生成蒙版。它建立在最近发布的 Meta 模型、segment-anything 和 GroundingDINO 检测模型之上，是一款易于使用且有效的对象检测和图像分割工具。然而在整个流程中，GroundingDINO 通常耗时0.6s作用，segment-anything 通常耗时5-8s左右。

2024-03-28 22:14:36 351

原创 python工具方法 48 基于视觉大模型生成目标检测数据集

核心代码如下所示，只是将text_prompt 赋值为"street lamp"，将png_path中的特征名称改成"_street lamp_ng.png"生成的mask效果如下所示，billboards（广告牌）生成的mask与signs（标签）生成的mask基本相近，这是由于二者在形态特征上过度相似所导致的。核心代码如下所示，只是将text_prompt 赋值为"billboards"，将png_path中的特征名称改成"_billboards_ng.png"

2024-03-27 22:07:15 111

原创基于yolo-world与mobile_sam实现类似lang-segment-anything

lang-segment-anything基于segment-anything 和 GroundingDINO 实现基于语言分割出任意对象，但是segment-anything 模型与GroundingDINO 都是运算量比较大的模型。

2024-03-24 09:17:46 558

原创 lang-segment-anything使用介绍

Language Segment-Anything 是一个开源项目，它结合了实例分割和文本提示的强大功能，为图像中的特定对象生成蒙版。它建立在最近发布的 Meta 模型、segment-anything 和 GroundingDINO 检测模型之上，是一款易于使用且有效的对象检测和图像分割工具。基于GroundingDINO 实现Zero-shot text-to-bbox方法。使用 Lightning AI 应用程序平台轻松部署。可自定义的文本提示，用于精确的对象分割。

2024-03-19 21:35:34 1091 2

原创将FastSAM中的TextPrompt迁移到MobileSAM中

SAM提到了text prompt，但其代码中没有发布实现方式，MobileSAM也没有实现text prompt，而FastSAM以一种巧妙的方式实现了text prompt。这主要因为，在现有成熟的训练体系下加入Prompt机制是比较复杂的，MobileSAM基于解耦蒸馏绕过Prompt的训练（`使用sam原始的prompt的`），而FastSAM将Prompt看作一种结果稀疏化的方法（`对于位置类prompt，采用逻辑操作进行mask选择；对于text的prompt，基于clip对实例切片进行余弦

2024-03-17 15:12:48 303

原创如何实现sam（Segment Anything Model）|fastsam模型

通过本博文的查阅与分析，实现fastsam是较为简便的，且fastsam的性能可以随着全景实例分割模型的发展而进一步提升，同时也说明了fastsam中prompt的实现。而在sam中，各种实现较为生涩难懂，主要说明sam的模型结构，基本原理，数据生成范式。sam的亮点在于基于少量的语义分割标签，迭代出了一个1.1B 标签超大型数据集，其不断扩展标注数据量的思想是值得学习的；而在fastsam中则是对SAT重新定义得出SAT，基于对全景实例分割模型的后处理实现了类似sam的性能。

2024-03-13 22:48:16 1124

原创 python工具方法 47 基于paddleseg将目标检测数据升级为语义分割数据

在进行项目研究时，通常需要搜集开源数据集。但是所能搜集到的数据集通常会存在形式上的差异，比如我想要的是语义分割数据，而搜集到的数据集却是目标检测数据；在这种情况下所搜集的数据就完成没有利用价值了么？不，其还存在价值，我们可以通过模型训练对数据标签的标注粒度进行优化。本博文基于paddleseg实现将烟火目标检测数据优化为烟火分割数据。具体效果如下所示：原始的目标检测数据变成了标注更为精准的语义分割数据。关于数据迭代中，在那一轮终止，又或者如果决断伪标签与原始真标签的差异并没有深入（

2024-03-10 20:53:36 220

原创将gdip-yolo集成到yolov8项目中（核心思路可以应用到yolov9的集成）

本博文通过gdip-yolo论文的深入分析发现，其论文中最为关键的gdip-yolo与gdip-regularizer，为此先在yolov8项目中实现gdip-yolov8，后续时间会考虑将gdip-regularizer集成对最新的目标检测算法。发现gdip-yolov8模型无法导出为onnx模型，这是因为gdip-yolo模块中使用了vgg16作为视觉编码器，然后vgg16中包含了adaptive_avg_pool2d无法被onnx算子所支持（需要自己固定图像输入尺寸，然后修改为avg_pool2d）

2024-03-06 22:28:46 285 7

原创 python工具方法 46 随机生成mask图像用于变化检测训练与图像修复训练

在进行变化检测训练中通常需要数据对进行标注，这是一件成本比较高的工作；同时，在进行图像修复训练中也需要随机生成mask。为此整理代码随机生成mask和变化图像。

2024-02-22 14:49:26 125

原创使用AOT-GAN-for-Inpainting训练自己的数据集

AOT-GAN-for-Inpainting是一个开源的图像修复项目，其对 Places2 数据集的效果表明，该模型在 FID 方面明显优于最先进的模型，相对改进了 1.8%。一项包括 365 多名受试者的用户研究进一步验证了 AOT-GAN 的优越性。其开源的模型在logo去除、面部修复和物体移除上取得良好效果。我们可以使用 AOT-GAN-for-Inpainting项目训练自己的数据集。AOT-GAN-for-Inpainting的解读可以参考。

2024-02-22 14:09:52 257

原创将ia-seg中的ipam模块集成到yolov8中实现ia-yolov8（支持预训练的yolov8模型，兼容原来的用法）

具体操作为，在ultralytics\nn\tasks.py中的第237行（ia-yolo项目的使用代码如下所示，通过设置环境变量original_yolo来控制项目使用原始yolo还是ia-yolo进行训练、通过enhanceType参数控制是用ia-yolo或gidp-yolo（关于gidp-yolo的使用后续发布博文）。将ia-seg中ipam的相关代码抽取出来，并新增部分代码，形成以下代码，保存为ia_ultralytics\engine\IPAM.py，这里的主要目的是构造IA_Model类。

2024-02-20 23:35:20 281 1

原创 win10下wsl2使用记录（系统迁移到D盘、配置国内源、安装conda环境、配置pip源、安装pytorch-gpu环境、安装paddle-gpu环境）

步骤二：将·/usr/local/cuda/targets/x86_64-linux/lib/添加到系统环境变量中。这个可以在/etc/profile文件中增加环境变量，将/usr/local/cuda/bin添加到path中，具体操作如下所示。在使用nvcc命令时，可能也会存在报错。，找到其路径为·/usr/local/cuda/targets/x86_64-linux/lib/

2024-02-17 10:00:03 1822 1

原创 python工具方法 45 基于ffmpeg以面向对象多线程的方式实现实时推流

RtspServer类用于实现视频推流，其子线程中run函数一直在拉取数据进行推流（由rate参数控制推流结果的分辨率），add_frame函数由主线程（外部线程）调用。使用vlc 打开rtsp://127.0.0.1:554/input，可以实现视频流播放。其基本操作就是，安装视频流推流服务器，ffmpeg，准备好要推流的视频。使用opencv拉流的代码极为简单，具体如下所示。

2024-02-16 12:03:08 614

原创 3060ti显卡+cuda12.1+win10编译安装生成fastdeploy的c++与python库

在cuda12中，调用官方发布的fastdeploy会出现报错，故此自行编译fastdeploy库。官网编译教程：https://github.com/PaddlePaddle/FastDeploy/blob/develop/docs/cn/build_and_install/gpu.md可选编译选项。

2024-02-08 00:03:29 245

原创 FastDeploy项目简介，使用其进行（图像分类、目标检测、语义分割、文本检测|orc部署）

FastDeploy是一款全场景、易用灵活、极致高效的AI推理部署工具，支持云边端部署。提供超过 🔥160+ Text，Vision， Speech和跨模态模型📦开箱即用的部署体验，并实现🔚端到端的推理性能优化。包括物体检测、字符识别（OCR）、人脸、人像扣图、多目标跟踪系统、NLP、Stable Diffusion文图生成、TTS 等几十种任务场景，满足开发者多场景、多硬件、多平台的产业部署需求。

2024-01-25 22:51:16 1458 1

原创 pytorch 44 不修改源码在yolov8中使用odconv动态卷积

这里仅修改对YOLOv8的使用方式，不修改任何源码即可将odconv使用到最新的yolov8n模型上，实现了对私有数据集下的巨大性能提升（尤其是对于类别不平衡的少样本数据）。ODCONV是Intel提出的一种极差即用的动态卷积，在小模型上涨点效果较为明显（在大模型上涨点效果略微退化），可被用于轻量化模型的性能优化。常见的轻量化模型有NanoDet、PicoDet和yolo-tiny系列模型等。

2024-01-20 22:15:00 299

原创 gdip-yolo项目解读：gdip模块 |mdgip模块 |GDIP regularizer模块的使用分析|生成带雾图像|生成低亮度图片

gdip-yolo是2022年提出了一个端到端的图像自适应目标检测框架，其论文中的效果展示了良好的图像增强效果。其提出了gdip模块 |mdgip模块 |GDIP regularizer模块等模块，并表明这是效果提升的关键。为此对gdip-yolo的项目进行深入分析。通过对gdip-yolo项目的分析，终于明白了为什么gdip-yolo与ia-yolo的数据存在差异其数据增强比例不一样。

2024-01-20 10:21:08 1340 2

原创论文解读：gdip-yolo | Gated Differentiable Image Processing for Object-Detection in Adverse Conditions

论文地址：https://arxiv.org/abs/2209.14922项目地址：https://github.com/Gatedip/GDIP-Yolo在恶劣的天气和照明条件下检测物体对于自动驾驶汽车的安全和持续运行至关重要，而且仍然是一个未解决的问题。我们提出了一个门控可微图像处理（GDIP）块，这是一个领域不可知的网络架构，它可以插入现有的目标检测网络（例如，Yolo），并端到端训练不利条件的图像，如在雾和低光照下捕获的图像。我们提出的GDIP块通过下游目标检测损失直接增强图像。

2024-01-17 22:36:26 1319

原创导出zoedepth的onnx模型并基于gradio实现在线部署

将C:\Users\Administrator.cache\torch\hub\intel-isl_MiDaS_master\midas\backbones\utils.py中的代码修改为以下形式。需要注意的是，原来在zoedepth\models\zoedepth\zoedepth_v1.py中输出的结构是dict，但是在转换为onnx模型后，被转换为tensor了。将zoedepth\models\base_models\midas.py 中的get_size函数修改为以下内容，也就是。

2024-01-16 22:19:18 510

原创 AOT-GAN + onnx部署 + gradio 实现在线图像修复

运行环境说明，其依赖： torch + python-opencv + onnxruntime + gradio + numpy + einops。

2024-01-14 12:46:44 273 2

原创论文阅读：Feature Refinement to Improve High Resolution Image Inpainting

发表时间：2022年6月29日解决了在高分辨率下工作的神经网络的非绘制质量的下降问题。inpainting网络往往无法在分辨率高于其训练集的情况下生成全局相干结构。这部分归因于接受域，尽管图像分辨率保持静态。虽然在绘制之前缩小图像会产生相干的结构，但它本质上缺乏更高分辨率的细节。为了充分利用这两个世界，我们通过最小化推理时的多尺度一致性损失来优化网络的中间特征图。这种运行时优化改进了的绘制结果，并建立了一种新的高分辨率的绘制状态。

2024-01-13 10:55:42 1342

原创 AOT-GAN-for-Inpainting项目解读|使用AOT-GAN进行图像修复

当前的图像修复方法可能会在高分辨率图像（例如 512x512）中产生扭曲的结构和模糊的纹理。这些挑战主要来自：（1）来自较远区域的图像内容推理，（2）对大缺失区域的细粒度纹理合成。为了克服这两个挑战，提出了一种增强的基于GAN的模型，称为（AOT-GAN），用于高分辨率图像修复。具体来说，为了增强上下文推理，AOT-GAN-for-Inpainting通过堆叠所提出的 AOT 块的多层来构建 AOT-GAN 的生成器。

2024-01-12 22:39:26 1793 6

原创使用rembg库提取图像前景（移除图像背景），并构建web应用

在传统图像处理中，前景是无法被直接提取出来，都是通过将前景图像的灰度与梯度特征不断进行增强，使得其与背景呈现显著性差异；在深度学习图像处理领域中，图像内容可以被定义为前景与背景两部分，其中感兴趣图形的被定义为前景，不感兴趣区域的背景。如在目标检测中，被框出来的目标则被定义为前景。如果要使用u2net_human_seg、u2net_cloth_seg、u2netp等模型进行前景提取，也可以自行下载。处理本地文件夹，命令如下所示，./image为要处理的图片目录，image_out为处理结果的存放目录。

2024-01-10 21:40:12 1413

原创在ultralytics中实现obb检测，官方团队做了哪些修改？

在最新的在ultralytics中，官方团队已经提供了obb检测功能，并发布了相应的预训练模型，其具体使用可以参考。在ultralytics\nn\modules\head.py中，实现了OBB head，用于在网络head中新增预测值用于进行角度预测，可见其是通过cv4 进行角度特征提取，最终预测一个角度值（ne ），`非csl、kdl的方式进行预测，其预测的角度范围为[-pi/4, 3pi/4]`

2024-01-08 00:45:00 1736

原创实现目标检测中的数据格式自由（labelme json、voc、coco、yolo格式的相互转换）

在进行目标检测任务中，存在labelme json、voc、coco、yolo等格式。labelme json是由anylabeling、labelme等软件生成的标注格式、voc是通用目标检测框（mmdetection、paddledetection）所支持的格式，coco是通用目标检测框（mmdetection、paddledetection）所支持的格式，yolo格式是yolo系列项目中所支持的格式。在进行实际项目中，通常不会局限于一个检测框架，故而数据格式也不会局限于一种。

2024-01-07 22:00:59 1954

原创再次认识ultralytics项目（大目标检测、小目标检测、yolov8-ghost、旋转目标检测、自动标注）

是一款前沿、最先进（SOTA）的模型，基于先前 YOLO 版本的成功，引入了新功能和改进，进一步提升性能和灵活性。YOLOv8 设计快速、准确且易于使用，使其成为各种物体检测与跟踪、实例分割、图像分类和姿态估计任务的绝佳选择。随着其官方团队对ultralytics项目的不断完善，其所支持的功能在不断扩展，为此重新对ultralytics项目进行深入分析。

2024-01-07 14:45:00 1827 1

原创使用pytorch-superpoint与pytorch-superglue项目实现训练自己的数据集

superpoint与superglue的组合可以实现基于深度学习的图像配准，官方发布的superpoint与superglue模型均基于coco数据训练，与业务中的实际数据或许存在差距，为此实现基于开源的pytorch-superpoint与pytorch-superglue项目实现训练自己的数据集。然而，在训练pytorch-superpoint有诸多细节需要优化，特此整理成技术文档。本文档描述了实验pytorch-superpoint与pytorch-superglue项目训练自己的图像配准模型。

2024-01-07 00:15:00 2544 15

原创将yolov8的检测框从正框修改为旋转框需要做那些修改？

将yolov8项目修改为yolov8_obb项目需要修改模型结构（增加角度预测）、dataloader（使其支持dota格式数据）、修改TaskAlignedAssigner（使其支持带角度的bbox）、修改loss（新增对角度的训练）、修改metric（将hbb指标titile修改为obb）、修改绘图代码（使其能绘制旋转框）。目前yolov8官方团队已经发布了支持obb的检测，博主于8个月前所实现的obb没有任何战略价值。为此分享博主过往将将yolov8项目修改为正框模型的操作过程。从正框模型到旋转框模型

2024-01-06 14:05:01 1132

原创在win10上cuda12+tensorrt8.6+vs2019环境下编译paddle2.6生成python包与c++推理库

paddle infer官方目前没有发布基于cuda12的c++库，为此参考实现cuda12的编译安装，不料博主才边缘好自己的paddle2.6，paddle官方已经发布了cuda12.0的paddle2.6框架。但安装官网教程进行编译是有很多bug需要解决的，故此分享一下经验。

2024-01-04 16:27:44 1269 2

原创基于gradio快速部署自己的深度学习模型（目标检测、图像分类、语义分割模型）

gradio是一款基于python的算法快速部署工具，本博文主要介绍使用gradio部署目标检测、图像分类、语义分割模型的部署。相比于flask，使用gradio不需要自己构造前端代码，只需要将后端接口写好即可。此外，基于gradio实现的项目，可以托管到huggingface。

2023-12-26 22:14:41 1167 2

原创 paddle 57 基于paddle_infer以面向对象方式2行代码部署目标检测模型、图像分类模型、语义分割模型

为方便模型部署测试，这里分享基于paddle infer的python版本部署目标检测模型、图像分类模型、语义分割模型。目前仅是基于paddle python的部署代码，各位可以轻松的将其改造为paddle c++部署代码。

2023-12-26 20:30:03 216

原创在win10上cuda12.1+tensorrt8.6+vs2019环境下编译onnxruntime1.17（在3060显卡上对yolov8s fp32部署fps达到142.8）

onnxruntime官方在cuda12出来一年后都没有发布支持cuda12的onnxruntime版本，故此博主在win10上cuda12.1+tensorrt8.6+vs2019环境下自行编译onnxruntime-gpu 1.17版本，可以生成python包与c++库。当在cuda12环境上运行onnxruntime-gpu时总会出现以下报错使用博主编译的库后，基于python对yolov8s以fp32进行部署，含nsm推理为11ms，不含预计为7ms，fps可达142.8。进行下载。

2023-12-25 22:15:27 2111 7

原创 paddle 56 将图像分类模型嵌入到目标检测中并实现端到端的部署（用图像分类模型进行目标检测切片分类）

目标检测在功能上一直是涵盖了图像分类的，其包含目标切片检测，目标切片分类。由于某些原因，需要将目标检测的功能退化为检测，忽略其切片分类，使用外部的分类模型。然而这样操作会使得其与原始的部署代码不兼容，为此博主实现将图像分类模型嵌入到目标检测中，并实现端到端的部署。这里以ppyoloe模型为改造案例，关于图像分类模型可以使用任意PaddleClas支持的模型。关于构造PaddleClas模型可以查阅。

2023-12-24 14:51:13 1314

原创修改ROPNet项目训练实现训练自己的数据集

一种新的深度学习模型，该模型利用具有区别特征的代表性重叠点进行配准，将部分到部分配准转换为部分完全配准。基于pointnet输出的特征设计了一个上下文引导模块，使用一个编码器来提取全局特征来预测点重叠得分。为了更好地找到有代表性的重叠点，使用提取的全局特征进行粗对齐。然后，引入一种变压器来丰富点特征，并基于点重叠得分和特征匹配去除非代表性点。在部分到完全的模式下建立相似度矩阵，最后采用加权支持向量差来估计变换矩阵。在订阅本专栏后，需要博主修改后的源码和修改教程可以私聊博主。

2023-12-24 12:45:38 169

win10下用vs2019编译好的curl 64位库版本7.84.0

在win10用cmake3.22与vs2019编译好的curl库，版本号为7.84.0（当下最新版，支持SLL）。库文件已经整理成了lib、include的结构,其中还内置curl.exe. curl是一个利用URL语法在命令行下工作的文件传输工具，支持很多种http请求操作，详情可以参考Linux curl命令最全详解_Angel_CG的博客-CSDN博客_curl命令。curl现在在linux与win10都是有内置的，在命令行中可以直接使用curl指令。

2022-06-28

python释放cuda缓存库

博主自行实现的动态链接库，通过python导入后可以实现释放显存，与ai框架无关。支持pytorch、tensorflow、onnxruntime等cuda运行环境。调用dll.reset_cuda()即可释放显存

2022-06-21

windows下GDAL322的库

从GDAL322安装包中抽取出的库，避免了的安装和下载多个包的过程。包含lib、bin、include三个目录。将lib的路径添加到系统环境变量中就算是配置好了GDAL322。

2022-06-10

基于paddle2实现对paddlehub中的静态图的训练

基于paddle2实现了对paddlehub2中的静态图的训练，可以使用paddle.vision.transforms实现训练模型时的数据增强。避免了paddlehub1.x下无法在训练过程中增强数据的缺陷。基于此，还可以实现对paddlehub内置模型的知识蒸馏。如果想免费试用，请浏览https://blog.csdn.net/a486259/article/details/123191622，复制代码保存为文件即可。

2022-02-28

paddle.hub迁移学习-图像分类案例

基于paddle2.0内置的hub库所实现的迁移学习代码，包含4个文件，分别涉及模型、数据、训练和测试。该代码具体的使用方式请参考https://blog.csdn.net/a486259/article/details/123140942

2022-02-25

opencv4.5.3+opencv-contrib+CUDA

参考知乎教程https://zhuanlan.zhihu.com/p/354838274所实现的opencv4.5.3+opencv_contrib+CUDA11.1，在win10下用vs2019编译，显卡为3060，CUDA_ARCH_BIN设置为7.0;7.5;8.0;8.6。

2022-02-18

flowers数据集.rar

处理好的flowers17数据集，包含训练集、验证集和测试集，和相应的数据集分类代码。

2021-11-27

RDPWrap-v1.6.2.zip

用于开启win10家庭版的远程桌面，其中包含各个版本的ini文件

2021-07-22

目标检测数据扩充增强工具

用于目标检测的数据增强工具，通过读取voc格式的数据可以对图像和相应的box进行缩放、平移、镜像、旋转、resize和更改颜色空间。通过对扩充方法的随机组合，可以将一个带标注的图像扩充成100幅。资源使用方面有问题请查看https://blog.csdn.net/a486259/article/details/121644786

2021-06-15

labelme-4.5.7.exe

已打包好的最新版labelme-4.5.7，可以单独运行无需配置python环境。可以绘制多边形、圆形、线与点。因为不会压缩，所以文件大小有270m

2021-03-25

图像批处理方法-图像空白裁剪、灰度化、缩放

按照目录对图像进行灰度化、缩放(比例默认为1/3)、空白处裁剪(裁剪掉图片多余的空白) =图像周边空白裁剪：按行和列统计图像四周的空白率，空白率过高的行和列将被裁剪掉（方法中设置为0.8，以灰度值大于0,9表示空白像素，可以按需更改）

2020-10-04

python工具方法 HristoryAvery

python工具方法 HristoryAvery方法在时序预测上的实现与使用，包含fit、predict、split_data三个方法。split_data用于划分数据集

2020-10-04

keras库文件，在loss和metrics库文件中添加rmse方法

在keras的loss库中添加rmse方法，成功使模型能正常使用rmse方法。在metrics.py文件上添加rmse方法后可以使用model.compile(loss='mse'，weighted_metrics=['rmse'])方法，可以在其他loss的条件下观测rmse的变化

2020-08-20

Wood Species Dataset-all.zip

Wood Species Dataset数据集有12种木材8千多个图像组成，其中有三种软木树种和九种阔叶树种，图像分为3类，分别是每种木材的横切面图片、弦切面图片和径切面图片。使用数据集时请务必按数据作者要求引用文献

2020-07-15

ILSpy反编译与ConfuserEx混淆工具.zip

通用的代码混淆工具ConfuserEx和代码反编译工具ILSpy，适用于windows桌面exe软件。

2020-05-29

手写数字字母数据集[0-9,a-z,A-Z]

预处理过的EnglishHnd手写数字字母数据集，文件名已经改成数字、字母（限于windows10下不区分大小写，大写字母的都是双字母，如AA，BB），尺寸被裁剪缩放到28*28，与minist数据集完美兼容。

2019-04-10

minist手写数字数据集（含代码）

minist手写数字数据集（含代码，案例有softmax分类、knn分类和神经网络分类），代码简洁易懂，可以当做练手资料

2018-11-28

cryptoJs加密解密工具

cryptoJs加密解密工具，并集成EncryptAes、DecryptAes两个方法，require(util.js)即可用。参数以json方式传递

2018-07-20

自己训练的superpoint与superglue模型

使用自己训练的superpoint与superglue模型进行图像配准（https://hpg123.blog.csdn.net/article/details/137381647）博客中对应的模型与图片。放置对SuperGluePretrainedNetwork目录下，替换掉对应的文件即可使用

2024-04-12

使用FastDeploy 进行（图像分类、目标检测、语义分割、文本检测-orc）python部署

本资源整理了（图像分类、目标检测、语义分割、文本检测|orc）的FastDeploy-python部署案例，里面包含模型与对应的数据，下载资源后，安装FastDeploy即可使用。 FastDeploy是一款全场景、易用灵活、极致高效的AI推理部署工具，支持云边端部署。提供超过 160+ Text，Vision， Speech和跨模态模型开箱即用的部署体验，并实现端到端的推理性能优化。包括物体检测、字符识别（OCR）、人脸、人像扣图、多目标跟踪系统、NLP、Stable Diffusion文图生成、TTS 等几十种任务场景，满足开发者多场景、多硬件、多平台的产业部署需求。

2024-01-25

AOT-GAN-for-Inpainting项目中pt模型转化的onnx模型

AOT-GAN-for-Inpainting是一个开源的图像修复项目，其对 Places2 数据集的效果表明，我们的模型在 FID 方面明显优于最先进的模型，相对改进了 1.8%。一项包括 365 多名受试者的用户研究进一步验证了 AOT-GAN 的优越性。我们进一步评估了所提出的AOT-GAN在实际应用中的应用，例如，logo去除、面部修复和物体移除。结果表明，我们的模型在现实的广泛数据数据中取得了良好的效果。在论文中表述了一共在3个数据集上进行训练，但仅发布了两个预训练模型，关于logo移除的模型或许设计商业因素未公开。本资源包含 CELEBA-HQ 与 Places2 两个数据集的onnx模型 https://hpg123.blog.csdn.net/article/details/135561206

2024-01-13

paddle-infer模型（包含ppyoloe-m、resnet50、segformerb1）

paddle_infer模型（包含ppyoloe_m_plus、resnet50、segformerb1的预训练模型），属于https://hpg123.blog.csdn.net/article/details/135229800中的模型、数据部分。含imagenet1000.txt类别信息，object365.txt类别信息

2023-12-26

win10上cuda12.1+tensorrt8.6+vs2019环境下编译onnxruntime1.17

onnxruntime官方在cuda12出来一年后都没有发布支持cuda12的onnxruntime版本，故此博主在win10上cuda12.1+tensorrt8.6+vs2019+py38环境下自行编译onnxruntime-gpu 1.17版本。本资源包，有onnxruntime_gpu-1.17.0-cp38-cp38-win_amd64.whl文件可以用于python的安装使用，还包含include、lib、bin文件支持c++编程使用。

2023-12-25

使用ROPNet项目在modelnet40数据集上训练的模型

具体包括：min_loss.pth、min_rot_error.pth两个模型文件https://github.com/zhulf0804/ROPNet项目提供了一个配准效果良好的点云模型，但是并没有发布预训练模型。故此，博主基于项目作者公布的代码，使用默认参数进行训练，约训练了450个epoch（完整epoch为600个）。所得到的模型精度与论文有轻微差异，但仍然能保证领先的精度。训练loss： Loss: 0.1087, Error R: 2.2862, Error t: 0.0218, anisotropic R(mse, mae): 2.6079, 1.1766, anisotropic t(mse, mae): 0.0224, 0.0103 测试效果： Error R error: 1.6421 Error t error: 0.0171 anisotropic mse R error: 1.9071 anisotropic mae R error: 0.8711 anisotropic mse t error : 0.0177 anisotropic mae t err

2023-12-03

16位tif影像转jpg软件（win10可用，无任何依赖）

16位tif影像转jpg软件（win10可用，无任何依赖），对于16位tif影像转jpg，实现了3种转换函数，分别为normalization_img、min_max_normalization_img、cut_normalization_img。其中cut_normalization_img函数可以滤除掉tiff影像中的异常值，可以在格式转换时增强图像效果的稳定性。软件由exe文件和ui文件组成，可以按照个人需求修改ui界面设计，修改后保存即可生效，无需更新软件。同时也支持对jpg、png、bmp图像进行上述操作。支持将图片拖入软件界面，也支持通过按钮选择图片。软件具体实现介绍可以参考：https://hpg123.blog.csdn.net/article/details/131603554

2023-07-07

基于pyqt5所实现的16U tiff影像转8U影像软件源码

现在大部分图像软件都支持tiff影像的浏览，但都是仅限于8位的影像，对应CV16U类型的tiff影像并不支持（这需要专业的gis软件才可进行操作）。为了便捷操作，故此基于pyqt5+opencv实现16位tif影像转jpg的软件。由于博主还是不太喜欢将ui文件转换为py文件再去构建界面，直接加载ui文件构建界面可以节省一个中间步骤，且这可以在软件发布后直接修改ui文件达到快速更新软件的效果。将16U的数据转换为8U有两种最简单的方式，即为归一化，具体如normalization_img函数代码所示，先将数据的值域压缩到0 ~ 1，然后再调整到 0 ~ 255。这种转换可能会存在某种问题，例如数据的整体值偏高，这样转化后就看不到差异了，故此又设计了min_max_normalization_img函数。先将数据的最小值调整为0，然后再进行归一化。对于某些特殊的行业数据，可能存在较多的噪声，其最大值和最小值并不能真实反映数据的情况（可能为传感器故障），从而需要对数据值域的频率进行统计，找到噪声的阈值（最大值阈值、最小值阈值），将大于最大值阈值的数值修改为最大值阈值，将小于最小值阈值

2023-07-07

pyqt5的基本使用demo

对应的代码讲解在：https://hpg123.blog.csdn.net/article/details/131564563?spm=1001.2014.3001.5502，博文记录了pyqt5使用记录涉及pyqt界面控件的基本介绍，使用designer设计界面ui，并将其转化为py代码。关于界面主要实现radioButton的互斥选中事件、comboBox的选中事件（依据list添加item）、pushButton的单击事件、槽函数自动绑定、图片的拖入显示。代码下载后，安装好qt环境既可使用，包含原始的ui文件，可以按照个人需求修改代码实现。

2023-07-06

ARM架构下ubuntu18.04编译好的opencv3.4.15（开箱即用）

ARM架构下ubuntu18.04编译好的opencv3.4.15（python版为通过编译），内置CMakeLists.txt模板文件，可以通过cmake的 find_package(OpenCV REQUIRED)直接配置opencv库。编译时的系统信息如下： root@HelperBox:~# uname -a Linux HelperBox1.t507 4.9.170 #42 SMP PREEMPT Sat Nov 5 18:40:25 CST 2022 aarch64 aarch64 aarch64 GNU/Linux root@HelperBox:~# lsb_release -a No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 18.04.4 LTS Release: 18.04 Codename: bionic

2023-07-02

基于c++实现的文件加密解密代码

基于c++实现的文件加密解密代码，支持将二进制文件读取为char数组，然后根据自定义code对数据进行局部取反操作、局部倒序操作、局部滑动操作。取反操作：将数据进行取反；解密操作也是取反操作；以单个char为操作单元倒序操作：将数组的顺序进行翻转；解密操作也是倒序操作；以char数组为操作单元滑动操作：将数组首位相连，进行一定的转动；解密操作也是滑动操作；以char数组为操作单元；以头文件的方式实现，除标准std库外，不依赖任何第三方库；include到个人项目中即可使用。

2023-04-08

C++下web框架corw的完全使用手册（实现中文支持）

corw是一个开源、轻量化的c++web库，在使用上与python的flask是类似的。本文档为corw的完整使用文档，含项目配置(基于cmakelist)、路由绑定、返回数据(json、文本、response对象、静态资源、模板文件)、接口请求处理(REST请求，url参数绑定、json请求、GET参数和POST参数)和各种高级操作（Cookie操作、Session操作、文件上传操作、文件下载操作、websocket操作、自定义loghandler）。此外，还对各类参数请求、结果返回过程中对中文的支持（如get参数、post参数、url参数、json结果中中文参数的正确解读）

2023-02-20

2023-02-14

win10下vs2019编译的opencv470+opencv-contrib（python pyd文件、c++包和编译缓存）

win10下vs2019编译的opencv470+opencv_contrib，包含opencv python版本的pyd文件和自行编译opencv470的.cache文件，各位可以下载.cache文件自己编译opencv470。所编译的opencv470中的lib和dll不是一个单独的文件，博主使用lib.exe将所有的lib文件合并为了opencv_world470.lib（链接器附加依赖性只需要opencv_world470.lib一个即可），但是dll文件没有合并（dll文件路径添加到环境变量path中即可）

2022-12-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

win10下用vs2019编译好的curl 64位库 版本7.84.0