自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 问答 (1)
  • 收藏
  • 关注

原创 计算机视觉技巧合集(六)torchvision的transforms

对于图像分类任务,由于不需要标注真实框,在进行数据增强的过程中只需要对图像进行变换,标签保持原样,因此目标检测中使用的全部数据增强方法都可以直接用于图像分类任务,非常的方便。所以这一篇主要聊一聊PyTorch提供的各种数据增强方法。Pytorch官方提供的大多数数据增强方法都存放在torchvision.transforms这个python文件中,对源代码感兴趣的话可以直接打开这个文件。

2023-06-29 16:53:58 200 1

原创 计算机视觉技巧合集(五)完全版dataset类之目标检测篇

前2篇介绍了常用的数据增强方法,那么如何将这些方法用在dataset类中呢?这一篇将具体地实现一个使用数据增强的目标检测dataset类。这种定制的dataset类的设计思路一般是先分别读取出图像和标签,然后设计一个最简单的dataset类,可以完成输出单个样本的任务,最后将数据增强方法加入其中,并根据不同的数据增强方法的特征以及之间相互影响的关系,对多个数据增强方法排列组合,构成一个合理的数据增强流水线。这样做的话,我觉得应该是可以比较清晰地实现一个自己的dataset类。

2023-06-28 12:45:39 168 1

原创 计算机视觉技巧合集(四)数据增强之目标检测篇2

mixup方法首先会生成一个随机透明度,然后利用该透明度分别改变2张输入图像的透明度,最后将2张图像重叠起来得到新图像。​Figure3:mosaic处理后的图像,图像的高和宽分别是1280*1280。Figure4:mosaic和缩放处理后的图像,图像的高和宽分别是640*640。Figure1:cutout处理后的图像,图像的高和宽分别是375*500。Figure2:mixup处理后的图像,图像的高和宽分别是375*500。Figure5:mixup处理后的图像,图像的高和宽分别是640*640。

2023-06-21 16:50:06 198

原创 计算机视觉技巧合集(四)数据增强之目标检测篇1

数据增强方法是一种在训练过程中对原始数据进行变换和扩充的方法,通过对原始数据进行一系列变换,生成与原始数据有所差异的新样本,从而增加训练数据的多样性,可以有效提高模型的泛化能力,减轻过拟合的风险。在计算机视觉中,常用的数据增强方法包含以下几种:镜像翻转(Flip):水平或者垂直翻转图像。随机裁剪(Random Crop):从图像中随机裁剪出一个区域,以改变视角和目标位置。缩放(Scaling):对图像进行缩放变换,模拟不同尺度下的场景。

2023-06-16 19:21:38 529 2

原创 计算机视觉技巧合集(三)实现自己的dataset类

现在我们已经可以从磁盘中将数据读取出来,并获得一个图像路径列表和一个标签列表,那么如何将已读取出来的数据用于深度学习的训练呢?这里就需要用到Pytorch提供的torch.utils.data.Dataset类。Pytorch官方教程链接:https://pytorch.org/tutorials/beginner/basics/data_tutorial.html。

2023-06-14 11:53:58 232

原创 计算机视觉技巧合集(二)如何读取数据之目标检测篇-补充1

在VOC2012数据集的ImageSets\Main文件夹下,可以看到有很多已经划分好训练集、验证集和测试集的文本文件,当然我们也可以自己划分不同于官方的训练集、验证集和测试集,可以参考《计算机视觉技巧合集(一)如何读取数据》的划分方法,只需将划分好的图像名称按照VOC官方的保存形式保存在文本文件中即可。

2023-06-13 20:36:05 61 1

原创 计算机视觉技巧合集(二)如何读取数据之目标检测篇

目标检测任务使用的数据集标注格式主要分为2大类:VOC类型和COCO类型。大多数目标检测任务的数据集一般都会使用这2种类型中的其中一种。因此,本文主要讲解如何VOC类型和COCO类型的数据集中读取数据

2023-06-13 14:03:57 225 2

原创 计算机视觉技巧合集(一)如何读取数据集

在计算机视觉领域,数据的重要性不可忽视。数据是训练和提升视觉算法的关键基石,它们为计算机系统提供了对世界的认知能力。丰富、多样的数据集可以帮助计算机视觉模型学习视觉特征、识别对象和场景,并进行准确的预测。数据的质量和多样性直接影响了模型的性能和鲁棒性。因此,有效地获取、整理和利用数据是实现出色计算机视觉应用的关键要素。计算机视觉主要分为图像分类、目标检测和图像分割这3大类任务,任务不同,所使用的数据也不同,其读取方式也是不一样的。因此,本文将具体说明如何读取图像分类和目标检测任务的数据。

2023-06-12 12:38:00 650 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除