开始学AI-CSDN博客

原创【矩池云】YOLOv3~YOLOv5训练红外小目标数据集

YOLO系列算法，红外小目标检测，从数据集处理到完整实现

2023-05-31 13:58:51 2749 10

原创无人机图像语义分割数据集（aeroscapes数据集）使用方法

数据集介绍aeroscapes数据集下载链接AeroScapes 航空语义分割基准包括使用商用无人机在 5 到 50 米的高度范围内捕获的图像。该数据集提供 3269 张 720p 图像和 11 个类别的真实掩码。数据加载dataloder写法（基于pytorch）由于该数据集提供了掩码图，因此不需要进行掩码图转换。下载完成后，文件结构如下：ImageSets文件夹：存放了两个txt文件，划分了训练集和验证集。JPEGImages文件夹：存放了RGB图像。SegmentationClass

2021-11-22 17:20:09 20156 11

原创无人机语义分割数据集（Semantic Drone Dataset）使用方法

数据集介绍Semantic Drone Dataset数据集下载地址该语义无人机数据集专注于城市场景的语义理解，以提高无人机自主飞行和着陆程序的安全性。该图像描绘了在距地面 5 至 30 米的高度从最低点（鸟瞰）视角拍摄的 20 多座房屋。高分辨率相机用于获取尺寸为 6000x4000px (24Mpx) 的图像。训练集包含 400 张公开可用的图像，测试集包含 200 张私有图像。该语义分割数据集包括20个种类：树、草、其他植被、污垢、碎石岩石、水、铺砌面积、水池、人狗、车、自行车、屋顶、墙

2021-11-21 22:21:09 4887 6

原创【VSCode调试技巧】Pytorch分布式训练调试

2、配置launch.josn文件，按照正确的参数顺序，填入args参数，注意区分位置参数和可选参数，debug文件前面的参数是分布式训练的参数，后面为该文件所需的参数。这个顺序和命令行执行的顺序一致，所以可参考命令行的顺序。1、找到控制分布式训练的启动脚本，在自己的虚拟环境的/lib/python3.9/site-packages/torch/distributed/launch.py中。最近遇到个头疼的问题，对于单机多卡的训练脚本，不知道如何使用VSCode进行Debug。

2024-04-24 15:02:41 114

原创【图像拼接精读】Parallax-Tolerant Unsupervised Deep Image Stitching

这些方法主要依赖于越来越复杂的几何特征（如点、线、边缘等）来提高性能。但是，这些手工制作的特征通常只适用于具有充足几何结构的特定自然场景。这意味着，当场景缺乏明显的几何特征或纹理时，这些方法的效果可能会大大降低。

2024-01-29 11:17:06 1189

原创最小二乘法

来源：

2023-10-30 16:45:19 146

原创 DMNet复现(二)之模型篇：Density map guided object detection in aerial image

以前用Swin Transformer Tiny训练了40epoch的，官方用的Faster RCNN，这里先用Swin Transformer Tiny进行测试。

2023-09-19 18:25:51 460

原创 DMNet复现(一)之数据准备篇：Density map guided object detection in aerial image

DMNet论文复现（一）：数据准备

2023-09-18 14:29:31 747 13

原创【MMDetection】bug记录

以下命令可以打印出配置文件所有信息，如打印configs\yolox\yolox_s_8xb8-300e_coco.py。

2023-09-08 14:08:46 667

原创 linux常会用到的命令

复制文件时排除某个文件夹，如从源路径中排除data。搜索含有指定字符的进程信息，如radar。删除指定后缀的文件，如png。

2023-08-23 13:42:06 194

原创关于Transformer中的位置编码

在图像处理中，位置编码的引入与自然语言处理中的方法有所不同，但基本的原理是相似的：为模型提供空间位置信息。例如，对于一个给定的位置，其与其他位置的相对位置编码将表示它们之间的距离或关系。绝对位置编码是为序列中的每个位置分配一个固定的编码，这个编码表示该位置在整个序列中的确切位置。与位置编码不同，位置嵌入是在模型训练过程中学习的，而不是预先定义的。在某些应用中，可能需要同时使用多种方法来捕获位置信息，例如，结合绝对位置编码和相对位置编码。为图像中的每个像素或区域分配一个固定的编码，表示其在图像中的绝对位置。

2023-08-18 14:23:32 1305

原创目标检测之3维合成

现在有一系列的图片，图片之间可以按照z轴方向进行排列。图片经过了目标检测，输出了一列写的检测框，现在的需求是将检测框按类别进行合成，以在3维上生成检测结果。思路：将图片按照z轴方向排列，以z轴索引作为检测框的z值。等同于输入为（x, y, w, h, z, class_id），可以计算得到每个检测框的中心点来标定这个框（x_center, y_center, z, class_id）。然后可以通过聚类算法在4维空间上进行聚类，最后取出聚类出的每一类的点的xyz的最大值与最小值和class_id来生成

2023-07-28 10:47:55 711

原创 [MMDetection]绘制PR图

[MMDetection]绘制PR图

2023-07-11 10:42:01 1150

原创 [MMDetection]生成测试集预测的test.bbox.json文件

将里面的路径全部换为自己的路径，最重要的是将以下注释取消掉，特别注意以下两个参数。困扰了大半天的问题，终于解决了。

2023-07-10 17:46:00 1819 3

原创 [MMDetection]测试模型

python tools/test.py config文件路径权重文件路径 --show-dir 文件保存路径。同时绘制分类损失和回归损失，同时还可以指定--out losses.pdf，将结果保存为PDF文档。loss数据一般保存在训练文件夹的vis_data中的scalars.json文件中，如以下路径。python tools/test.py config文件路径权重文件路径 --show。python tools/test.py config文件路径权重文件路径。

2023-07-10 17:15:16 729

原创 [探地雷达]预处理

由于在探测过程中存在热漂移、电子元器件的不稳定、电缆长度的不同以及天线距地表的空隙间距的变化，这都会导致最初到达的地表回波在时间轴上产生“偏移”。这将会影响该记录剖面图中地表的位置，影响到后续散射信号对应的时序，所以在正式处理前，需要对多道数据进行起始时间的校正，统一调整使其与地表位置相匹配，以获得一个统一的时间零点。因此，在数据接收处理阶段，需要对波形进行校正，确保每道数据的 A-scan 值的平均值接近于零。接下来，将该道的每个数据点减去其均值，从而得到去除直流分量后的数据。

2023-07-10 09:54:06 1233 3

原创 [MMDetection]VOC数据格式转为COCO数据格式

[MMDetection]VOC数据格式转为COCO数据格式

2023-07-08 15:15:39 784

原创 [MMDetection]COCO数据集可视化验证

[MMDetection]COCO数据集可视化验证

2023-07-08 14:45:19 540 1

原创 windows11、Rtx3060Ti安装mmdetection

下载 C++套件生成工具，安装以下工具。安装cuda、torch等。安装mmdetection。安装mmengine。

2023-07-05 17:59:36 168

原创 [探地雷达]利用Faster RCNN对B-SCAN探地雷达数据进行目标检测

由于真实雷达图像较少，作者采用了GPR工具箱，使用不同配置，合成了部分模拟雷达图。然后采用Cifar-10数据（灰度图）对Faster RCNN进行预训练，再采用真实和合成数据进行微调。论文地址。

2023-07-03 10:15:03 1638 1

原创 Windows11 anaconda配置pytorch环境

生成 .condarc 文件，位于C:\Users\Admin\。在虚拟环境中安装pytorch、torchvision、cuda。

2023-06-28 17:04:21 492

原创使用thop库分析模型的参数量、运算量、帧率

GFLOPs FLOPs 是浮点运算次数，可以用来衡量算法/模型复杂度GFLOPs。为十亿（1e9）次的浮点运算。Latency 网络前向传播的时间，1 ms=1e-3 s，10.5ms=0.0105s。FPS 每秒传输帧数，FPS=1/Latency，1/0.0105=95.2。Parameters 参数量，指模型含有多少参数。测试模型参数量和Flops。

2023-06-12 22:40:22 1152

原创【矩池云】DeepLabV3Plus网络，预测无人机遥感语义分割数据集

编码器特征首先以因子4进行双线性上采样，然后与来自网络主干的具有相同空间分辨率的对应低级特征进行级联[73]（例如，在ResNet-101中跨步之前的Conv 2 [25]）。1. 在图像分类中，下采样倍率是32，语义分割中，下采样倍率一般为16或8，对于语义分割的任务，比如可以在ResNet中，通过移除最后一个（或两个）块中的步幅并相应地应用atrous卷积（例如，对于输出stride= 8，我们将空洞卷积率= 2和空洞卷积率= 4分别应用于最后两个块）解决办法：将错误语句换为以下语句。

2023-05-11 20:58:50 1263 17

原创压缩命令-排除某些文件进行压缩

需求：zip打包某个目录但是要排除目录下某个文件或者某个目录。-x参数后加要排除的文件或目录的完整路径。

2023-05-11 16:13:57 1275 1

原创【矩池云】FusionGan环境搭建

目的是让，If将逐渐包含可见光图像Iv中越来越多的细节信息，如果在训练阶段期间，一旦生成器GθG生成样本（即，如果）不能被鉴别器DθD区分，则期望的融合图像If，说明包含了足够多的细节信息。其中a和B分别表示融合图像If和可见光图像Iv的标签，DθD（Iv）和DθD（If）分别表示可见光图像和融合图像的分类结果。Lcontent的第一项旨在保持融合图像If中的红外图像Ir的热辐射信息，Lcontent的第二项旨在保持可见图像Iv中包含的梯度信息，并且ξ是控制两项之间的折衷的正参数。

2023-05-10 21:47:25 942 3

原创刷题笔记8| 344.反转字符串, 541. 反转字符串II, 剑指Offer 05.替换空格

在遍历字符串的过程中，只要让 i += (2 * k)，i 每次移动 2 * k 就可以了，然后判断是否需要有反转的区间。给定一个字符串 s 和一个整数 k，从字符串开头算起，每计数至 2k 个字符，就反转这 2k 字符中的前 k 个字符。不要给另外的数组分配额外的空间，你必须原地修改输入数组、使用 O(1) 的额外空间解决这一问题。如果剩余字符小于 2k 但大于或等于 k 个，则反转前 k 个字符，其余字符保持原样。创建一个新字符串s1，每当遍历到字符串s中的空格时，就添加%20，否则添加原字母。

2023-05-07 11:58:56 474

原创 Python 读取josn文件，显示image的bbox

首先解析json文件，选出对应字段信息。利用opencv工具进行画框和写出文字。

2023-03-19 22:28:28 446

原创 Python读取txt文本数据，写进excel中

Python读取txt文本数据，写进excel中

2023-03-19 01:56:16 4893 3

原创中钞科信算法岗面经

1 笔试，笔试内容包括深度学习，图像处理，opencv，优化理论2 初面问题1 你对我们公司了解吗问题2 传统图像处理和深度学习图像处理区别问题3 卷积的公式问题4 画出sigmoid和ReLU的图形问题5 均值滤波和中值滤波介绍，区别问题6 椒盐噪声用什么方法处理，从数学角度解释问题7 介绍BP神经网络，包括哪些层问题8 相对于Bp神经网络，深度卷积神经网络为什么可以做到更深问题9 介绍发的论文问题10 是否接受出差问题11 全连接层和1*1卷积的区别问

2023-03-15 13:34:59 322