自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(138)
  • 收藏
  • 关注

原创 如何根据目标检测结果,根据原始xml快速分析某一类的问题

分析预测和xml

2022-11-07 14:35:48 383 1

原创 仿射变换实现letterbox形式的resize

仿射变换实现letterbox

2022-11-04 09:57:03 408

原创 目标检测中的数据增强,包括bbox的变换

目标检测数据扩充记录

2022-10-25 22:03:44 2708

原创 xml格式数据转coco数据

xml转coco&加载预训练权重

2022-10-18 15:36:31 1496

原创 目标检测中将xml数据集转换为txt,超简便

VOC格式的数据集转换为txt,便于yolov5训练

2022-10-13 10:35:00 3336 1

原创 ubuntu20.04配置cuda11.5记录

配置ubuntu下的深度学习环境踩坑记录

2022-09-15 14:40:31 897

原创 高版本pytorch运行低版本pytorch常见问题汇总记录

记录一下pytorch日常碰到的调试的bug

2022-09-13 16:52:12 2604

原创 Unbuntu系统 cannot move...Device or resource busy

记录ubuntu文件挂载过程

2022-09-07 16:24:03 2963

原创 多分类交叉熵函数计算过程(包含numpy和pytorch代码实现)

交叉熵损失函数的计算过程

2022-08-26 16:35:42 2482

原创 Pytorch中自定义一个dataset的&损失函数实现&保存图片的方式

定义一个Dataset类用于分类网络的训练,包含了dataloader相关的方法;以及常见的定义损失函数的方式

2022-08-19 17:04:57 1481

原创 cifar10数据集和mnist数据集的读取以及可视化

记录一下cifar10和mnist的读取方式,了解数据格式内容

2022-08-18 10:12:01 1859

原创 利用RepVGG训练一个cifar-10数据

快速使用repvgg训练分类网络

2022-08-13 17:16:50 1403 7

原创 pycharm如何避免出现pytest...

记录的pycharm小技巧

2022-08-06 15:54:47 267

原创 win10安装虚拟机Vmwarepro16+ubuntu16.04踩坑记录

安装虚拟机的路上,踩过的坑

2022-07-22 12:15:47 1474

原创 HoG(梯度直方图)原理及python实现

HoG特征的简单介绍

2022-07-01 11:26:44 4265 3

原创 部分配置安装教程

自己电脑上配置教程

2022-06-16 17:24:45 310

原创 pip永久设置清华镜像源&一键下载requirements.txt

添加pip镜像源的方法

2022-05-10 19:46:04 6300 2

原创 vs2017+opencv4.5.0+opencv_contrib-4.5.0+cmake编译

1.编译的目的不编译也能够直接使用OpenCV自带的库文件(见:永久配置opencv方法),可是假设是为了方便调试:1. 方便调试opencv源代码 。2.为了与某些库兼容编译用的工具Cmake,这是一个跨平台的安装编译工具。主要用于把OpenCV的源代码生成相应的VSproject2.下载软件opencv4.5.0opencv_contrib-4.5.0cmake-3.19.6-zip随便下载一个cmake编译器,这里选择的是zip后缀的,因为不用安装将opencv和contrib放

2022-01-01 14:45:06 2146 4

原创 xml文件中类别数&xml和jpg文件名不一致

文档目录问题描述几行程序搞定匹配最终结果问题描述jpeg的文件名如下截取的xml文件名如下如上所示,一些jpg中的图片,并没有相应的标注文件,这是不利于训练过程的。几行程序搞定匹配将匹配成功的xml和jpg保存到新的路径下import osimport shutil# 原始路径xml_path = r"F:\BaiduNetdiskDownload\VOCdevkit\VOC2007\Annotations"jpg_path = r"F:\BaiduNetdiskDownloa

2021-09-15 10:53:35 593

原创 vs2017永久配置opencv4.0.0环境

1.opencv4.0.0的安装和配置过程首先到官网下载目前最新版的opencv,网址是:opencv官网2.下载完就是安装,安装到自己的本地路径上,路径名尽量用英文名。安装完之后就如下图所示。3.配置环境变量。①打开桌面上的“此电脑”②在窗口中的空白处右键点击“属性”③点击左边的“高级系统设置”④点击下方的“环境变量”⑤在弹出的窗口中找到“系统变量”中的“Path”,双击该选项⑥在弹出的窗口中点击新建,根据你的本地路径进行配置。比如笔者的opencv路径是F,那么在此处笔者填入的路

2021-08-10 19:47:40 2024 6

转载 skimage.feature.graycomatrix用法详细介绍

图像处理库scikits-image已经支持计算灰度共生矩阵和提取GLCM的纹理属性contrast、dissimilarity、homogeneity、ASM、energy、correlation首先了解一下灰度共生矩阵是什么,下面介绍摘自百度百科。百度百科:灰度共生矩阵灰度共生矩阵,指的是一种通过研究灰度的空间相关特性来描述纹理的常用方法。1973年Haralick等人提出了用灰度共生矩阵来描述纹理特征。由于纹理是由灰度分布在空间位置上反复出现而形成的,因而在图像空间中相隔某距离的两像素之间会存在

2021-06-29 22:07:28 4636

原创 win7、win10查看gpu利用率

1.未添加环境变量1.打开cmd终端2.cd C:\Program Files\NVIDIA Corporation\NVSMI3.终端运行 nvidia-smi.exe2.添加了环境变量先把文件路径加入到环境变量中, 对PATH变量进行编辑,会进入到PATH的列表,再点击添加,将上面的路径填写进去,例如:终端直接输入nvidia-smi...

2021-04-29 18:24:04 2117

原创 输入字符串C++

对于string类:这个是输入2个字符串,换行结束#include<iostream>#include<vector>#include<string>using namespace std;int main(){ vector<string> arr; string mystr; int k = 2; while (k--) { getline(cin, mystr); arr.push_back(mystr); } fo

2021-04-18 20:36:37 94

原创 选择排序,冒泡排序,C++

1.不稳定序列5 8 5 2 9, 我们知道第一遍选择第1个元素5会和2交换,那么原序列中2个5的相对前后顺序就被破坏了2.时间复杂度O(n2)#include <iostream>using namespace std;int main(){ int arr[] = { 3,2,4,5,1,7 }; for (int i = 0; i < 6; i++) for (int j = i + 1; j < 6; j++) if (arr[j] <

2021-04-18 11:36:10 82

原创 键盘输入数字、字符到vector,程序

1.数字#include<iostream>#include<vector>using namespace std;int main(){ vector<int> arr; int m=0; cout << "输入的元素个数:" << endl; cin >> m; cout << "m=" << m << endl; int tmp=0; for (int i = 0; i

2021-04-17 22:39:44 1854

原创 快速排序C++,python

1.性质时间复杂度:O(nlogn) 最坏情况:O(n2)空间复杂度:O(logn)该排序算法不稳定排序算法稳定性的概念假定在待排序的记录序列中,存在多个具有相同的元素的(用下标表征其相对位置),若经过排序,这些元素的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的。总结一下就是:对于两个大小相同的元素,每次排序后其相对位置如果不改变(下标i不会跑到j后

2021-04-17 20:00:35 105

原创 ubuntu将pycharm添加到桌面

通常都需要通过终端打开,sh pycharm.sh网上的方法都太麻烦了菜单栏 'Tools'-> ’create desktop entry‘ 这样就能创建快捷方式注意: 桌面指的是 屏幕左下角到那个(9个点)找到pycharm图标 鼠标右键 添加到收藏夹okk...

2021-03-25 11:29:52 1434 1

原创 ubuntu18.04火狐浏览器无法输入中文(Win10+ubuntu)

fictx应该卸载掉1.彻底卸载fcitxsudo apt-get remove fcitx*sudo apt-get purge fcitx*2.设置 ——>输入法设置为IBUS3.注销重新登录

2021-03-25 11:18:33 2708 1

原创 win10+anaconda安装pycocotool

1.先从git上下载,压缩包解压到D:\Anaconda\Tools\cocoapi-master2. 进入cocoapi-master/PythonAPI文件夹,在此处打开Powershell窗口(shift+鼠标右键,就能看到了),运行命令:python setup.py build_ext --inplace3. 安装完成后,继续在Powershell窗口运行命令:python setup.py build_ext install...

2021-03-03 12:00:55 221

原创 mobilenet-v2预测单张图片注意要点

使用model预测单张图的时候,一定要unsqueeze(img, dim=0),这样才能增加一个fake batch dimensionclass_indice = json.load(json_file),目的是为了后面显示哪一类别,对应的名字model = MobileNetV2(num_classes=5),这里一定要写num_classes = 5 ,要不然,就采用默认值了…模型的预测结果output,是没有概率值的,只能自己使用softmax(),计算一下 。 argmax()返回的是自.

2021-03-02 20:29:00 524

原创 MobileNet-V2理解以及pytorch源码实现

1.原理和创新点整个网络中,主要有以下两种sequence。当s=1 , 同时 k=k撇, 也就是输入channel = 输出channel 时候,需要加一个shortcut中间的3x3conv,采用的是群组卷积的特例, DepthWise Conv,此时 gropus = hidden_channel论文中提出,当维度较低时,应该采用线性激活函数,高维时,采用ReLU6激活函数。丢失信息较少针对网络的参数表格,主要有以下几点:当一个sequence重复多次时( 即n&gt

2021-03-02 19:53:01 1748 2

原创 dataloaders中使用items()以及tqdm,加载预训练参数

1.查看dataloader类型train_dataset.class_to_idx 从字面上来看,就是类别对应的索引os.path.abspath(os.path.join(os.getcwd(), "../"))从当前的目录,跳到上一层目录(绝对路径)data_root = os.path.abspath(os.path.join(os.getcwd(), "../")) # get data root pathimage_path = os.path.join(data_root, "

2021-03-02 16:33:19 1792

原创 在图片分类和目标检测中创建train/val/test

1.在一个文件夹划分train、val本来只有一个flower_photos文件夹经过处理后,出现了train、val文件夹并且train和val文件夹如下对目录下的文件名随机采样,生成列表 eval_index = random.sample(images, k=int(num*split_rate))得到路径名后,copyeval_index = random.sample(images, k=int(num*split_rate))for index, image in enum

2021-03-02 11:33:53 1431 2

原创 Dataloader读取文件夹图片,创建字典,train和val

1.创建transform的字典1.输入为PIL的图像(array也行),转换为Tensor (0—255的[H,W,C] —> 0~1 的 [C,H,W])2. compose将多个变换组合起来3.data_transforms = { 'train': transforms.Compose([ transforms.RandomResizedCrop(input_size), transforms.RandomHorizontalFlip(),

2021-03-02 11:14:27 1370

原创 读取xml文件中的信息到txt文本中

1.代码import xml.etree.ElementTree as ETimport os"""r''要加上的"""source = r'D:\pycharm\pytorch相关\labelImg-master\ori_xlm' # 文件夹路径dir = os.listdir(source)dir为一个列表查看dir中的第二个元素(index=1)作为一个N叉树可以查看其叶子节点里面出现了多个’obejct’节点因为源xml文件框了好几个不同的对象查看xml文件里面的

2021-02-23 11:44:53 721 1

转载 window10 下如何使用git获得github上的项目 详解

1.安装git2.在cmd命令行中使用git通过切换盘符等操作将目录指定到自己想要保存的位置,此时我的当前文件夹为空到github上找到自己想要下载的内容,然后点击右边的绿色按钮:不要直接点击Download ZIP,因为有时候这样直接下载是空的!!!要点击下面箭头所示的链接(远程代码仓库地址),然后回到我们的cmd命令行中将2中得到的远程代码仓库地址的链接粘贴到cmd命令行中,通过git clone + 远程代码仓库地址的链接 命令下载,点击回车,如下所示,之后就会看到之前空的文件夹里就

2021-02-22 20:06:41 147

原创 批量修改图片文件名

1.import osi=1for filename in os.listdir('logo/'): newname = str(i) + ".jpg" os.rename('logo/'+filename, 'logo/2020_'+newname) i += 12.最后一个反斜杠很重要一般自己都不会写’/’而且只能是这个,尴尬》。。。’\’ 这个会报错path = 'D:\pycharm\pytorch相关\labelImg-master\ori_image\

2021-02-22 11:07:03 187

原创 LabelImage安装以及打包exe教程,win10+anaconda3,

labelImg安装简介

2021-02-21 14:46:04 1574

原创 np.argmax和torch.max

1.arg就是argument,自变量的意思argmax(f) 返回函数f的值取最大值时自变量的值np.argmax(a)取回对应的索引index(从下标0开始)2.多个维度1.np.argmax()a = np.array([[1, 5, 5, 2], [9, 6, 2, 8], [3, 7, 9, 1]])np.argmax(a,axis=0)结果:array([1, 2, 2, 1], dtype=int64)很明

2021-02-20 10:49:17 733

原创 ROI Pooling原理

1.ROI简介1.ROI是经过最后Conv层后feature map的一个矩形框2.每个ROI由(r,c,h,w)组成。r,c指的是左上角的坐标;h,w指的是宽和高ROI Pooling 把一个h x w 大小的格子划分为H x W个格子,因而每个格子的大小为(h/H, w/W)注意,无法整除的话就会出现取地板除,对应的取ceiling 对每个格子分别做max pooling2.Examplefeature map:8x8,一个ROI,输出:为2*2(这里所谓的输入输出都是针对l

2021-02-19 23:56:58 1190

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除