自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 资源 (1)
  • 收藏
  • 关注

转载 vgg16中 nn.Sequential(*list(vgg.classifier._modules.values())[:-1])

原博:https://blog.csdn.net/a1103688841/article/details/89383215先总结一下,self.RCNN_base = nn.Sequential(*list(vgg.features._modules.values())[:-1]),详解如下:vgg是已经构建好的vgg模型。vgg.features是取出vgg16网络中的features大层...

2019-07-25 10:19:21 4058

原创 YOLT论文笔记+Transform_DOTA论文笔记

又开始读YOLT论文,本来是想直接实践的,但由于数据集过大,而且也确实不了解整个流程,所以重新看论文,把重要的几个工作点记录下来。3 YOU ONLY LOOK TWICE网络设计部分+预处理后处理3.1 网络结构this new architecture is optimized for small, densely packed objects3.2 测试过程At test tim...

2019-07-09 09:00:23 991

原创 阅读论文DOTA和RoITransformer_DOTA

通过阅读这两篇论文,可以大致了解遥感图像目标检测领域所存在的问题,以及目前所采用的解决方法有哪些。由于遥感图像天生的特点:the huge variation in the scale, orientation and shape of the object instances:目标尺寸、方向、形状的变化大小而稠密的物体4DOTA介绍由于重力原因,传统目标检测数据集中的目标通常...

2019-07-01 21:41:31 2439

转载 CVPR2019目标检测汇总

原博:https://mp.weixin.qq.com/s/7Ez9KrX-O1fLNt55MgI7RQ二阶段算法1.提出了一种新的边界框回归损失,同时学习边界框变换和定位差异卡耐基梅隆大学、旷视Bounding Box Regression with Uncertainty for Accurate Object DetectionYihui He, Chenchen Zhu, Jia...

2019-07-01 17:00:23 6138

转载 python-defaultdict

参见https://www.jb51.net/article/149880.htmPython中可以使用collections中的defaultdict类实现创建进行统一初始化的字典。这里总结两种常用一点的初始化方式,分别是初始化为list和int。初始化为list示范代码:#!/usr/bin/python from collections import defaultdict ...

2019-06-27 18:31:53 166

转载 软连接

参见博客:https://biyutong.iteye.com/blog/1445699实例:ln -s /home/gamestat /gamestatlinux下的软链接类似于windows下的快捷方式ln -s a b 中的 a 就是源文件,b是链接文件名,其作用是当进入b目录,实际上是链接进入了a目录如上面的示例,当我们执行命令 cd /gamestat/的时候 实际上...

2019-06-27 10:03:20 119

原创 彻底搞懂YOLO

YOLO训练和检测均是在一个单独网络中进行。训练:网络结构:使用1x1和3x3的卷积来代替GoogleNet中原来的Inception模块,使用ImageNet数据集预先训练好GoogleNet。再加入一些新的卷积层,参数是随机初始化的。输出tensor的值是没有任何意义的,我们通过训练,人为规定某个维度的值表示什么。我们规定如下:其中训练样本的x,y,w,h都是已知的,Pr(Obj...

2019-06-12 19:03:59 727

原创 YOLT论文代码映射

今天下午看了看论文,大致明白了网络结构,具体还要看代码。开始分析代码:1.首先分析yolt2.py文件此文件中除了main函数,总共有16个子函数,应该是调来调去。先看main函数,依次调用6个函数:(1)init_args():专门用于接收和设置参数,往往需要被设置的参数会根据接收的参数来设置。这些参数一般都是路径或者配置参数等等。如:项目路径为 --yolt_dir一般会根据接收...

2019-06-06 00:05:43 1453 6

原创 评价四指标

We use four metrics (i.e., precision §, recall ®, F1-score (F1) and mean intersection over union (Mean IoU))。其中P、R、F1-score计算公式如下所示:其中TP(true positive)表示本来就是正例,也被预测为正例的个数,FP(false positive)表示本来是负例,...

2019-06-05 14:36:02 376

原创 DetNet数据集代码部分

通过入口文件trainval_net.py找到数据集相关部分,发现首先通过输入参数args.dataset确定参数args.imdb_name、args_imdbval_name、args.set_cfgs,之后会对这些参数进行处理。处理过程如下:imdb, roidb, ratio_list, ratio_index = combined_roidb(args.imdb_name)train...

2019-06-04 14:27:57 487

转载 遥感图像数据集简介之二

参考链接:https://blog.csdn.net/hongxingabc/article/details/78833485航空遥感图像具有特殊性:1.尺度多样性:航空遥感图像从几百米到近万米的拍摄高度都有,且地面目标即使是同类目标也大小不一,如港口的轮船大的有300多米,小的也只有数十米;2.视角特殊性:航空遥感图像的视角基本都是高空俯视,但常规数据集大部分还是地面水平视角,所以同一目...

2019-05-30 18:29:48 4215

原创 Detnet论文代码映射

首先前四层仍是resnet50的前四层,其中第三层的第一个block会将feature map下采样2倍,第四层的第一个block会将feature map下采样2倍。代码实现如下所示:class Bottleneck(nn.Module): expansion = 4 def __init__(self, inplanes, planes, stride=1, downsam...

2019-05-30 10:18:33 246

原创 彻底搞懂ResNet50

待续

2019-05-30 09:02:16 138665 10

原创 RFB-Net论文代码映射

Vgg网络代码实现如下: layers = [] # i=3,说明图像是3通道 in_channels = i # cfg:[64, 64, 'M', 128, 128, 'M', 256, 256, 256, 'C', 512, 512, 512, 'M', # 512, 512, 512] for v in cfg: ...

2019-05-28 23:33:29 1010

原创 Python Numpy Tutorial

翻译自:http://cs231n.github.io/python-numpy-tutorial/NumpyNumpy是python科学计算的一个核心库。它提供了高性能多维数据对象以及操作这些数组的工具。Arraysnumpy数据是一个相同数据类型的值网格,用一个非负整数的元组来索引。rank:维数shape:是一个整数元组,元素表示每一维的大小我们可以用python的lists初...

2019-05-28 22:52:44 273

原创 彻底搞懂SSD网络结构

还是得从下图说起,之前一直没实际搞清楚。SSD的网络结构流程如下图所示:tensorflow代码如下: with tf.variable_scope(scope, 'ssd_300_vgg', [inputs], reuse=reuse): # Original VGG-16 blocks. net = slim.repeat(inputs, 2, ...

2019-05-27 22:15:52 43903 6

原创 彻底搞懂VGGNet-16

VGGNet-16在整体上可以划分为8个部分(8段),前5段为卷积网络,后3段为全连网络。首先创建第一段卷积网络,这一段卷积网络由2个卷积层和1个最大池化层构成,即共3层。对于两个卷积层,其卷积核的大小都是3x3,同时卷积核数量(输出通道数)也均为64,步长为1x1,padding均为1。—这也就是我们做卷积时所关心的几个参数:卷积核大小、卷积核深度、步长、padding。故,第一个卷积层的输入...

2019-05-27 15:51:16 6559 5

原创 RFB-Net论文笔记

摘要深层次的网络虽然有很好的特征表示能力,但是计算代价高。而轻量级的网络实时性高,但精度不好。本篇论文中,通过人工设计的机制来增强轻量特征。提出RFB模块来提高特征可辨别性和鲁棒性。我们把RFB模块和SSD结合,构建RFB-Net检测器。为了评测它的有效性,实验在两个主要的benchmarks上进行,并证明了RFB-Net可以达到速度和精度的统一。理解:好像是通过RFB模块,来提高特征表达能力...

2019-05-27 15:17:53 246

原创 卷积核大小与卷积后特征图大小

卷积中的特征图大小计算方式有两种,分别是‘VALID’和‘SAME’。1.如果计算方式采用’VALID’,则:其中为Wout输出特征图的大小,Win为输入特征图的大小,F为卷积核大小,stride为卷积步长。不能整除时向上取整。2.如果计算方式采用’SAME’,输出特征图的大小与输入特征图的大小保持不变,其中padding为特征图填充的圈数。若采用’SAME’方式,kernel_si...

2019-05-26 19:58:28 12941 2

原创 pytorch可视化工具

使用pytorch可视化工具:1.复制代码2.报错:torch版本必须大于1.0.0,于是重新装了pytorch和pytorchvision报错:No module named ‘numpy.core._multiarray_umath’,于是更新numpyhttps://www.cnblogs.com/Terrypython/p/10467859.html...

2019-05-25 10:00:30 159

原创 RFBNet代码运行+配置pytorch0.4.0

官方链接:https://github.com/ruinmessi/RFBNet1.创建虚拟环境,激活,用conda install安装对应pytorch0.4.0版本:conda install pytorch=0.4.0 cuda90 -c pytorch(官网),并用import pytorch、pytorch.version、pytorch.cuda.is_available()查看是否...

2019-05-24 10:48:41 1255 1

原创 pytorch安装

简直了简直了,又装了一天pytorch,不就是想把代码运行起来吗?配环境咋那么困难呢?现在的问题是,之前运行ga-rpn代码时,好像是用pip install命令安装了对应CUDA9.0的pytorch1.1。那么现在想要安装多个版本的pytorch,我该怎么办呢?1.用conda创建虚拟环境2.激活虚拟环境3.安装pytorch对应版本。那么用pip install安装呢?还是用cond...

2019-05-23 20:00:50 4490

转载 numpy-arange()

参考:https://blog.csdn.net/u011649885/article/details/76851291返回值: np.arange()函数返回一个有终点和起点的固定步长的排列,如[1,2,3,4,5],起点是1,终点是5,步长为1。参数个数情况: np.arange()函数分为一个参数,两个参数,三个参数三种情况1)一个参数时,参数值为终点,起点取默认值0,步长取默认值1。...

2019-05-23 18:11:23 2971

转载 conda创建python虚拟环境及使用

1、首先在所在系统中安装Anaconda。可以打开命令行输入conda -V检验是否安装以及当前conda的版本。2、conda常用的命令。1)conda list 查看安装了哪些包。2)conda env list 或 conda info -e 查看当前存在哪些虚拟环境3)conda update conda 检查更新当前conda3、创建python虚拟环境。使用 conda c...

2019-05-23 10:58:38 184

原创 CVPR2018-2019论文梳理

https://mp.weixin.qq.com/s?__biz=MzI5MDUyMDIxNA==&mid=2247486719&idx=1&sn=061fd69d867ef292e66ce80ed58a9c33&chksm=ec1fe106db6868100c2a333c6e121ce04c862c867a0cbc2c326a6283edfdc54d9cdb292...

2019-05-22 21:46:08 239

转载 Python学习

参考链接:https://www.numpy.org.cn/article/basics/python_numpy_tutorial.html1.基本数据类型(1)Numbers(数字类型)x = 3print(type(x)) # Prints "<class 'int'>"print(x) # Prints "3"print(x + 1) # Addit...

2019-05-22 16:24:58 89

转载 numpy学习

numpy教程也看了不少了,最开始看哔哩哔哩,后来看教程,可还是糊里糊涂的。最主要的原因在于看的太杂,以至于什么都没记住。参考链接:https://www.numpy.org.cn/article/advanced/index.htmlNumPy简单入门教程1.数组基础(1)创建一个数组# 1D Arraya = np.array([0, 1, 2, 3, 4])b = np.arr...

2019-05-22 15:41:56 132

转载 交叉熵损失函数

交叉熵的作用通过神经网络解决多分类问题时,最常用的一种方式就是在最后一层设置n个输出节点,无论在浅层神经网络还是在CNN中都是如此,比如,在AlexNet中最后的输出层有1000个节点:而即便是ResNet取消了全连接层,也会在最后有一个1000个节点的输出层:一般情况下,最后一个输出层的节点个数与分类任务的目标数相等。假设最后的节点数为N,那么对于每一个样例,神经网络可以得到一个N维的...

2019-05-21 11:37:35 197

转载 tf.logging.set_verbosity(tf.logging.DEBUG)

在tensorflow中有函数可以直接log打印,这个跟ROS系统中打印函数差不多。TensorFlow使用五个不同级别的日志消息。 按照上升的顺序,它们是DEBUG,INFO,WARN,ERROR和FATAL。 当您在任何这些级别配置日志记录时,TensorFlow将输出与该级别相对应的所有日志消息以及所有级别的严重级别。 例如,如果设置了ERROR的日志记录级别,则会收到包含ERROR和FA...

2019-05-20 09:33:25 995

原创 GA-RPN代码运行

1.环境配置官方链接:https://github.com/open-mmlab/mmdetection/blob/master/INSTALL.md其中mmcv和pytorch都可以按此链接直接安装即可。NCCL好像是用于多GPU的。用pip install 包名 安装包以后,包都放在anaconda目录下,因为默认pip也是anaconda的python所对应的。见下图:之后按官方链...

2019-05-16 18:32:50 2031 3

转载 python-dict()

dict() 函数用于创建一个字典。返回一个字典。语法class dict(**kwarg)class dict(mapping, **kwarg)class dict(iterable, **kwarg)参数说明:**kwargs – 关键字mapping – 元素的容器。iterable – 可迭代对象实例>>>dict() ...

2019-05-13 20:19:43 830

原创 Ubuntu-vim命令

1.修改文件:先按"i”,即切换到“插入”状态。就可以通过上下左右移动光标,或空格、退格及回车等进行编辑内容2.保存退出:按键盘左上角的"ESC",左下角的插入状态不见了。然后这时,我们输入冒号,输入wq保存退出即可。...

2019-05-13 17:37:09 141

转载 python-dict.items()

原文链接:https://www.runoob.com/python/att-dictionary-items.html语法items()方法语法:dict.items()参数NA。返回值以列表形式返回可遍历的(键, 值) 元组。实例以下实例展示了 items()函数的使用方法:dict = {'Google': 'www.google.com', 'Runoob': 'www...

2019-05-12 21:13:22 758

转载 python-easydict模块

EasyDict可以让你像访问属性一样访问dict里的变量。`1. 问题d = {'foo':3, 'bar':{'x':1, 'y':2}}print(d['foo']) # 如果想要访问字典的元素需要这么写print(d['bar']['y']) # 如果想要继续访问字典中字典的元素需要使用二维数组#print(d.foo) 这样写会出错哦!输出:32但是感觉这样太麻...

2019-05-12 20:17:11 159

NWPU VHR-10 dataset.zip

NWPU VHR-10数据集,解压文件后,包含三个文件夹,其中positive image set文件夹中包含650张正样本,negative image set文件夹中包含150张负样本。ground truth文件夹中只包含650张正样本的标签。

2019-11-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除