AI追随者-CSDN博客

原创 YOLOv9来啦！YOLO目标检测全新工作！性能表现SOTA！在各个方面都大大超过了RT-DETR、YOLOv8等

今天的深度学习方法侧重于如何设计最合适的目标函数，使模型的预测结果最接近实际情况。同时，必须设计一种适当的架构，该架构可以促进获取足够的信息用于预测。现有的方法忽略了一个事实，即当输入数据经过逐层特征提取和空间变换时，会丢失大量信息。本文将深入研究数据通过深度网络传输时数据丢失的重要问题，即信息瓶颈和可逆函数。我们提出了可编程梯度信息（PGI）的概念，以应对深度网络实现多个目标所需的各种变化。PGI可以为目标任务提供完整的输入信息来计算目标函数，从而获得可靠的梯度信息来更新网络权重。

2024-02-22 13:56:22 15293 18

原创 ADA-YOLO：YOLOv8+注意力+Adaptive Head，mAP提升3%

生物医学图像分析中的目标检测和定位至关重要，尤其是在血液学领域，检测和识别血细胞对于诊断和治疗决策至关重要。虽然基于注意力的方法在各个领域中目标检测方面取得了显著的进展，但由于医学影像数据集的独特挑战，其在医学目标检测中的应用受到了限制。为了解决这个问题，作者提出了一种名为ADA-YOLO的轻量级但有效的医学目标检测方法，该方法将注意力机制与YOLOv8架构相结合。作者提出的这种方法通过自适应头模块利用动态特征定位和并行回归进行计算机视觉任务。

2024-01-16 23:00:21 1619 2

原创优化改进YOLOv5算法之Deformable Attention，有效提升检测效果，秒杀SE、CBAM和CA等注意力机制

对于 Attention 中的多个端口来说，首先将这些端口分为一定的组，比如 24 个端口 6 组，那么每组的 4 个端口将共享同一种位置偏差，使用的预测维度即分配给这 4 个端口的维度，不同组预测的位置偏差将不一样。最后还会加上一个相对位置插入，正常情况下这个位置矩阵大小为 �(2�−1)×(2�−1) ，但是考虑到存在处于任意位置的偏差，这个位置矩阵依然会做一个连续的差值 (Relative Displacements) 真尴尬我不知道这个英文我理没理解对......

2024-01-11 22:46:05 420

原创优化改进YOLOv5算法之Dilation-wise Residual(DWR)可扩张残差注意力模块，增强多尺度感受野特征，助力小目标检测

因此，在网络阶段4中，设置扩张率为1、3和5的扩张卷积的3个分支，而在阶段3中，放弃第三个分支以挤压感受野以避免有效计算。此外，由于卷积在更大的空间跨度上直接建立连接总是更困难，并且大跨度连接需要小跨度连接的帮助，因此在每个阶段，小的感受野总是很重要的。事实上，在第二步中，根据感受野的大小，可以在第一步中明智地学习所需的简明区域特征图，以反向匹配感受野。作者认为，确定合适的感受野大小对于提高特征提取的效率至关重要，并且在网络的不同阶段对感受野大小的要求是不同的。具体来说，所有特征图都是串联的。

2024-01-10 23:03:19 759

原创优化改进YOLOv8算法之AKConv（可改变核卷积），即插即用的卷积，效果秒杀DSConv

基于卷积运算的神经网络在深度学习领域取得了令人瞩目的成果，但标准卷积运算存在两个固有的缺陷。一方面，卷积运算仅限于局部窗口，无法捕获其他位置的信息，并且它的采样形状是固定的。另一方面，卷积核的大小固定为k×k，是一个固定的正方形，参数的数量往往随大小呈平方增长。很明显，不同数据集和不同位置的目标的形状和大小是不同的。

2024-01-09 22:18:12 3020 8

原创优化改进YOLOv5算法之AKConv（可改变核卷积），即插即用的卷积，效果秒杀DSConv

基于卷积运算的神经网络在深度学习领域取得了令人瞩目的成果，但标准卷积运算存在两个固有的缺陷。一方面，卷积运算仅限于局部窗口，无法捕获其他位置的信息，并且它的采样形状是固定的。另一方面，卷积核的大小固定为k×k，是一个固定的正方形，参数的数量往往随大小呈平方增长。很明显，不同数据集和不同位置的目标的形状和大小是不同的。

2024-01-08 22:55:51 1256

原创 YOLOv5+混合注意力机制再涨4.3%，Transformer混合设计依旧可以卷

在工业生产过程中，由于低效率、不统一的评估、高成本以及缺乏实时数据，传统的手动检测焊接缺陷不再被应用。为了解决表面贴装技术中焊接缺陷检测的低准确率、高误检率和计算成本问题，提出了一种新方法。该方法是一种专门针对焊接缺陷检测算法的混合注意力机制，通过增加准确度并降低计算成本来提高制造过程中的质量控制。混合注意力机制包括提出的增强多头自注意力机制和协调注意力机制，以增加注意力网络感知上下文信息的能力，并提高网络特征利用率。协调注意力机制增强了不同通道之间的连接，减少了位置信息损失。

2024-01-06 22:28:39 1430

原创目标检测损失函数：IoU、GIoU、DIoU、CIoU、EIoU、alpha IoU、SIoU、WIoU原理及Pytorch实现

IoU全称Intersection over Union，交并比。IoU是一种测量在特定数据集中检测相应物体准确度的一个标准。只要是在输出中得出一个预测范围(bounding boxes)的任务都可以用IoU来进行测量。IoU算法是使用最广泛的算法，大部分的检测算法都是使用的这个算法。在目标识别中，我们的预测框与实际框的某种比值就是IoU。1.2 IoU计算公式通过上述分析，当预测框和真实框不相交时IoU值为0，导致很大范围内损失函数没有梯度。针对这一问题，提出了GIoU作为损失函数。

2023-12-28 23:05:15 2229 2

原创 ASF-YOLO开源 | SSFF融合+TPE编码+CPAM注意力，精度提升！

作者提出了一种新颖的注意力尺度序列融合基于YOLO框架（ASF-YOLO），该框架结合了空间和尺度特征，以实现精确快速的细胞实例分割。在YOLO分割框架的基础上，作者采用了尺度序列特征融合（SSFF）模块来增强网络的多尺度信息提取能力，并采用三特征编码器（TPE）模块将不同尺度的特征图进行融合，以增加详细信息。作者进一步引入了一种通道和位置注意力机制，以将SSFF和TPE模块集成起来，专注于具有信息量大、位置相关的较小目标，以提高检测和分割性能。

2023-12-14 23:06:09 3048

原创优化改进YOLOv5算法之感受野注意力卷积运算（RFAConv），效果秒杀CBAM和CA等

但是，。在论文中，作者对空间注意力的有效性提出了一个新的观点，即。然而，由空间注意力生成的注意力图中包含的信息。因此，，如卷积块注意力模块（CBAM）和协调注意力（CA），只关注空间特征，并没有完全解决卷积核参数共享的问题。由RFA开发的（RFAConv）。作者在ImageNet-1k、COCO和VOC数据集上进行了一系列实验，以证明他们的方法的优越性。特别重要的是，

2023-11-14 23:07:06 1028

原创全新Inner-IoU损失函数！！！通过辅助边界框计算IoU有效提升检测效果

随着检测器的快速发展，边界框回归（BBR）损失函数不断进行更新和优化。然而，现有的 IoU 基于 BBR 仍然集中在通过添加新损失项来加速收敛，忽略了 IoU 损失项本身的局限性。尽管从理论上讲，IoU 损失可以有效地描述边界框回归的状态，但在实际应用中，它无法根据不同的检测器和检测任务进行自适应调整，且不具备较强的泛化能力。基于上述情况，作者首先分析了 BBR 模型，并得出结论：区分不同的回归样本以及使用不同尺度的辅助边界框计算损失可以有效加速边界框回归过程。

2023-11-10 23:45:00 1859 1

原创 YOLOv5-6.1源码详解之损失函数loss.py

如下图所示，人、大巴为检测目标，既要检测出所有人和大巴的位置，也要检测出包围人和大巴的最小矩形框，同时还要识别出哪个矩形框内是人，哪个矩形框内是大巴。

2023-11-09 23:42:27 1813 1

原创优化改进YOLOv5算法之添加DCNv3模块，有效提升目标检测效果

拿到文章之后先看了一眼在ImageNet1k上的结果，确实很高，超越了同等大小下的VAN、RepLKNet、ConvNext等先进的大核注意力CNN模型，同时也超过了Swin、DeiT3、CoAtNet等ViT模型。回顾自从Vision Transformer被提出之后，通过大量数据训练出的ViT大模型刷新了许多视觉任务的记录，这得益于ViT的MHSA机制能够建模长距离依赖，具有相当低的归纳偏置，从而能够在海量数据中学习到强大鲁棒的特征表达。

2023-11-05 23:35:28 1319 2

原创优化改进YOLOv5算法之添加MS-Block模块，有效提升目标检测效果(超详细)

本博客主要是参考YOLO-MS论文的创新点，在YOLOv5算法中引入MS-Block模块，利用不同尺度特征信息，以进一步提升目标检测效果。作者旨在为目标检测社区提供一种高效且性能卓越的目标检测器，称为YOLO-MS。核心设计基于一系列对不同Kernel-Size卷积如何影响不同尺度上目标检测性能的研究。研究结果是一种可以显著增强实时目标检测器多尺度特征表示的新策略。为了验证作者策略的有效性，作者构建了一个名为YOLO-MS的网络架构。

2023-11-02 22:37:45 940 1

原创优化改进YOLOv5算法：加入SPD-Conv模块，让小目标无处遁形——(超详细)

卷积神经网络(CNNs)在计算即使觉任务中如图像分类和目标检测等取得了显著的成功。然而，当图像分辨率较低或物体较小时，它们的性能会灾难性下降。这是由于现有CNN常见的设计体系结构中有缺陷，即使用卷积步长和/或池化层，这导致了细粒度信息的丢失和较低效的特征表示的学习。为此，我们提出了一个名为SPD-Conv的新的CNN构建块来代替每个卷积步长和每个池化层(因此完全消除了它们)。SPD-Conv由一个空间到深度(SPD)层和一个无卷积步长(Conv)层组成，可以应用于大多数CNN体系结构。

2023-10-30 23:12:49 976

原创优化改进YOLOv5算法：加入大核分离卷积注意力模块（ Large Separable Kernel Attention），实现暴力涨点同时显著减少计算复杂性和内存——(超详细)

论文：Large Separable Kernel Attention: Rethinking theLarge Kernel Attention Design in CNN具有大内核注意力（LKA）模块的视觉注意力网络（VAN）已被证明在一系列基于视觉的任务中提供了卓越的性能，超过了视觉转换器（ViTs）。然而，随着卷积核大小的增加，这些LKA模块中的深度卷积层导致计算和内存占用的二次增加。为了缓解这些问题，并允许在VAN的注意模块中使用超大卷积核，我们提出了一个大的可分离核注意模块族，称为LSKA。LS

2023-10-29 23:34:06 896 2

原创优化改进YOLOv5算法：加入ODConv+ConvNeXt提升小目标检测能力——(超详细)

为了提升无人机视角下目标检测效果，基于YOLOv5算法，在YOLOv5主干中实现了Omnidimensional Convolution（ODConv），以在不增加网络宽度和深度的情况下提高精度，还在YOLOv5骨干网中用ConvNeXt块替换了原始的C3块，以加快检测速度。

2023-10-26 22:55:15 896

原创 windows下安装Visual Studio + CMake+OpenCV + OpenCV contrib+TensorRT

最近在研究windows系统上部署安装目标检测算法，需要用到OpenCV软件，因为OpenCV可能是目前使用最广泛的开源图像处理工具了，尤其是在科研领域。于是，本篇博客主要详细记录一下如何在Windows 操作系统下，搭建Visual Studio 2022+OpenCV4.5.5+OpenCV contrib4.5.5的运行环境。安装Visual Studio比较简单，首先去Visual Studio官网下载安装包下载Community版本就可以了，其功能已经够用了。

2023-06-27 08:29:55 2361 1

原创优化改进YOLOv5算法之针对小目标检测优化YOLOv5_Face2(超详细)

本文主要参考YOLO-FaceV2这个文章，该文章为了解决人脸检测中小目标、遮挡等问题，在YOLOv5算法的基础提出了几点改进，且取得了比较不错的效果。

2023-06-17 23:27:35 2191

原创优化改进YOLOv5算法之添加Res2Net模块(超详细)

由于单独的Res2Net模块对于整体网络结构没有特定的要求，Res2Net模块的多尺度表示能力也和CNN的分层特征聚合模型彼此独立，所以可以很容易地将Res2Net模块集成到现有的其他优秀CNN模型中。模块内部的连接形式与残差网络（ResNet）类似，故命名为Res2Net。在本文中，研究人员在一个单个残差块内构造分层的残差类连接，为CNN提出了一种新的构建模块，即Res2Net——以更细粒度（granular level）表示多尺度特征，并增加每个网络层的感受野（receptive fields）范围。

2023-04-21 17:28:42 2493 2

原创优化改进YOLOv5算法之改进用于微小目标检测的Normalized Gaussian Wasserstein Distance模块(超详细)

改进YOLOv5系列:全新改进用于微小目标检测的 Normalized Gaussian Wasserstein Distance

2023-03-16 09:40:54 2403 1

原创优化改进YOLOv5算法之添加GIoU、DIoU、CIoU、EIoU、Wise-IoU模块(超详细)

IoU 的全称为交并比（Intersection over Union），通过这个名称我们大概可以猜到 IoU 的计算方法。IoU 计算的是 “预测的边框” 和 “真实的边框” 的交集和并集的比值。计算过程如下：其中，绿色面积代表预测框B与真实框A的交集；则显而易见，IOU的值越高也说明预测框与真实框重合程度越高，代表模型预测越准确，反之，IOU越低模型性能越差。

2023-03-10 09:56:49 5828 1

原创优化改进YOLOv5算法之Wise-IOU损失函数

边界框回归（BBR）的损失函数对于目标检测至关重要。它的良好定义将为模型带来显著的性能改进。大多数现有的工作假设训练数据中的样本是高质量的，并侧重于增强BBR损失的拟合能力。如果盲目地加强低质量样本的BBR，这将危及本地化性能。Focal EIoU v1被提出来解决这个问题，但由于其静态聚焦机制（FM），非单调FM的潜力没有被充分利用。基于这一思想，作者提出了一种基于IoU的损失，该损失具有动态非单调FM，名为Wise IoU（WIoU）。

2023-02-18 23:13:25 9376 1

原创 YOLOv8训练自己的数据集(超详细)

YOLOv8训练自己数据集的详细教程

2023-01-11 17:54:47 103165 92

原创 YOLOv8来啦 | 详细解读YOLOv8的改进模块！YOLOv5官方出品YOLOv8！

直接上YOLOv8的结构图吧，小伙伴们可以直接和YOLOv5进行对比，看看能找到或者猜到有什么不同的地方？YOLOv8网络结构图Backbone：使用的依旧是CSP的思想，不过YOLOv5中的C3模块被替换成了C2f模块，实现了进一步的轻量化，同时YOLOv8依旧使用了YOLOv5等架构中使用的SPPF模块；PAN-FPN。

2023-01-09 10:26:26 33653 13

原创优化改进YOLOv5算法之添加SE、CBAM、CA模块(超详细)

本文主要是在YOLOv5算法中加入SE、CBAM和CA注意力机制模块，通过实验验证对比，加入CBAM和CA注意力机制后的效果均有所提升

2023-01-04 22:28:56 8804 22

原创优化改进YOLOv5算法之添加RepVGG模块(超详细)

YOLOv5算法中添加RepVGG模块，并通过实验验证改进后的算法模型效果

2022-12-30 22:31:28 3815 7

原创 YOLOv5实战之输电线路绝缘子缺陷检测识别

本教程主要是利用YOLOv5算法实现对输电线路绝缘子缺陷进行检测识别。通过无人机搭载相机头云台对输电线路上的绝缘子进行数据采集，挑选出绝缘子上有故障的图片数据，共2000张左右图片，输电线路绝缘子缺陷数据集中的部分图片如下图所示。对收集到的2000张左右绝缘子缺陷数据集进行数据标注，标注了3种常见的绝缘子缺陷类型：insulator、damaged、Flashover，利用LabelImg标注软件对数据进行标注，对标注后的数据进行统计，3种缺陷的标签分布情况如下图所示。

2022-10-29 10:20:27 7914 57

原创卷积神经网络之深度可分离卷积（Depthwise Separable Convolution）

移动端设备的硬件性能限制了神经网络的规模。本文尝试解释一种被称为Depthwise Separable Convolution的卷积运算方式。它将传统卷积分解为Depthwise Convolution与Pointwise Convolution两部分，有效的减小了参数数量。卷积神经网络在图像处理中的地位已然毋庸置疑。卷积运算具备强大的特征提取能力、相比全连接又消耗更少的参数，应用在图像这样的二维结构数据中有着先天优势。

2022-10-15 13:45:56 1050

原创万字长文详解目标检测算法，超大超全(2022最新)

基于深度神经网络的目标检测器不断发展，并用于多种应用，每个应用都有自己的一组要求。安全关键型的应用程序需要高精度和可靠性，而低延迟的任务需要节约资源的神经网络结构。实时目标检测器在有高影响力的现实世界应用中是必不可少的，并不断有新方法提出，但它们过分强调精度和速度上的改进，而忽略了其他方面，如多功能性、鲁棒性、资源和能源效率。现有网络的参考基准不存在，新网络设计的标准评估指南也不存在，这导致比较模棱两可和不一致。

2022-09-16 16:39:48 12781 1

原创目标检测算法YOLOv1原理与实现

当我们谈起计算机视觉时，首先想到的就是图像分类，没错，图像分类是计算机视觉最基本的任务之一，但是在图像分类的基础上，还有更复杂和有意思的任务，如目标检测，物体定位，图像分割等，见图1所示。其中目标检测是一件比较实际的且具有挑战性的计算机视觉任务，其可以看成图像分类与定位的结合，给定一张图片，目标检测系统要能够识别出图片的目标并给出其位置，由于图片中目标数是不定的，不仅要检测出目标的位置且要给出目标所属类别，因此目标检测相比分类任务更复杂。

2022-09-01 23:09:05 1125

原创 YOLOv7训练自己的数据集(超详细)

YOLOv7训练自己的数据集(超详细)

2022-08-22 23:19:26 63539 69

原创 Meta Faster R-CNN：基于注意力特征对齐的小样本目标检测

论文标题：Meta Faster R-CNN: Towards Accurate Few-Shot Object Detection with Attentive Feature Alignment论文链接：https://arxiv.org/abs/2104.077191 出发点 & 创新点1.1 出发点以往的方法使用基于base类数据训练得到的 RPN 去生成 novel 类的候选框，这样做会错过一些新类的高 IoU 框，因为在 RPN 训练中，novel 类框被视为 ba

2022-03-29 10:38:35 6934

原创神经网络轻量化改进之CNN架构设计

卷积神经网络架构设计，又指backbone设计，主要是根据具体任务的数据集特点以及相关的评价指标来确定一个网络结构的输入图像分辨率，深度，每一层宽度，拓扑结构等细节。公开发表的论文大多都是基于ImageNet这种大型的公开数据集来进行的通用结构设计，早期只以其分类精度来证明设计的优劣，后来也慢慢开始对比参数量(Params)和计算量(FLOPs)，由于ImageNet的数据量十分巨大且丰富，所以通常在该数据集上获得很好精度的网络结构泛化到其他任务性能也都不会差。但在很多特定任务中，这种通用的结构虽然效果还可

2022-03-25 17:21:59 2593 1

原创 RCNN、Fast RCNN、Faster RCNN算法详细介绍

目标检测是深度学习的一个重要应用，就是在图片中要将里面的物体识别出来，并标出物体的位置，一般需要经过两个步骤：1、分类，识别物体是什么2、定位，找出物体在哪里除了对单个物体进行检测，还要能支持对多个物体进行检测，如下图所示：这个问题并不是那么容易解决，由于物体的尺寸变化范围很大、摆放角度多变、姿态不定，而且物体有很多种类别，可以在图片中出现多种物体、出现在任意位置。因此，目标检测是一个比较复杂的问题。最直接的方法便是构建一个深度神经网络，将图像和标注位置作为样本输入，然后经...

2022-03-22 09:37:13 8812

原创卷积神经网络(CNN)原理详解

这几年深度学习快速发展，在图像识别、语音识别、物体识别等各种场景上取得了巨大的成功，例如AlphaGo击败世界围棋冠军，iPhone X内置了人脸识别解锁功能等等，很多AI产品在世界上引起了很大的轰动。在这场深度学习革命中，卷积神经网络（Convolutional Neural Networks，简称CNN）是推动这一切爆发的主力，在目前人工智能的发展中有着非常重要的地位。【问题来了】那什么是卷积神经网络（CNN）呢？1、什么是神经网络？这里的神经网络，也指人工神经网络（Artificial..

2022-03-21 16:49:51 34954 16

原创 PyTorch 深度学习:60分钟快速入门

1 张量1.1 PyTorch是什么?pytorch是基于Python的科学计算包，服务于以下两种场景:作为NumPy的替代品，可以使用GPU的强大计算能力提供最大的灵活性和高速的深度学习研究平台1.2Tensors（张量）Tensors与Numpy中的 ndarrays类似，但是在PyTorch中 Tensors 可以使用GPU进行计算.from __future__ import print_functionimport torch创建一个 5x3 矩阵, 但是未初始.

2021-12-11 23:26:44 2684 1

原创注意力机制——Coordinate Attention

目录摘要1 介绍2 相关工作2.1 Mobile Network2.2 注意力机制3 Coordinate Attention3.1 Revisit SE Block3.1.1 Squeeze3.1.2 Excitation3.1.3 为什么SE Block不好？3.2 Coordinate Attention Block3.2.1 Coordinate信息嵌入3.2.2 Coordinate Attention生成4. 实验4.1 消融实验.

2021-12-08 13:41:21 42049 14

原创 python-RabbitMQ教程6—远程过程调用（RPC）

Remote procedure call (RPC)在第二个教程中，我们学习了如何使用工作队列(Work Queues)在多个工作人员之间分配耗时的任务。但是如果我们需要在远程计算机上运行一个函数并等待结果呢？嗯，那是另一回事了。这种模式通常称为远程过程调用或RPC。在本教程中，我们将使用RabbitMQ构建一个RPC系统：一个客户端和一个可扩展的RPC服务器。由于我们没有任何值得分配的耗时任务，我们将创建一个返回斐波那契数列的虚拟RPC服务。客户端界面为了说明如何使用RPC服务，我们将创

2021-12-01 09:28:37 758

原创 python-RabbitMQ教程5—主题交换机

在之前的教程中，我们改进了logging system。我们没有使用只能进行虚拟广播的fanoutexchange，而是使用direct exchange，并获得了选择性接收日志的可能性。虽然使用direct exchange改进了我们的系统，但它仍然有局限性——它不能基于多个标准进行路由。在我们的logging system中，我们可能不仅希望根据严重性订阅logs，还希望根据发出logs的源订阅logs。您可能从syslog工具中了解到这个概念，该工具根据严重性 (info/warn/crit...).

2021-12-01 09:09:15 1307

PCBDatasets.zip

空空如也