自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

散修炼丹师手记

每篇丹方都来自各大门派典籍,结合本人独门手法总结熔炼,仅供学习交流,谨慎食用。。。

  • 博客(56)
  • 资源 (2)
  • 收藏
  • 关注

原创 我在云边贩卖阳光,洒向有你的人间!

I sell sunsets in the world just to collect the world's tenderness and wait for you. In that special identity, I will watch the day of sun

2020-10-15 16:12:09 317

原创 目标检测——YOLOv8(十四)

YOLOv8 是 ultralytics 公司在 2023 年 1月 10 号开源的 YOLOv5 的下一个重大更新版本,目前支持图像分类、物体检测和实例分割任务。不过 ultralytics 并没有直接将开源库命名为 YOLOv8,而是直接使用 ultralytics 这个词,原因是 ultralytics 将这个库定位为算法框架,而非某一个特定算法,一个主要特点是可扩展性。

2023-04-24 11:54:24 974

原创 目标检测——YOLOv7(十三)

继美团发布YOLOV6之后,YOLO系列原作者也发布了YOLOV7。主要从两点进行模型的优化:模型结构重参化和动态标签分配。YOLOv7的特点是快!相同体量下比YOLOv5精度更高,速度快120%。

2023-04-12 21:09:49 2264

原创 目标检测——YOLOv6(十二)

YOLOv6 是美团视觉智能部研发的一款目标检测框架,致力于工业应用。这里简单记录一下,方便以后回顾。在部署方面,YOLOv6 支持 GPU(TensorRT)、CPU(OPENVINO)、ARM(MNN、TNN、NCNN)等不同平台的部署,极大地简化工程部署时的适配工作。

2023-04-07 20:48:50 874

原创 轻量级网络——MobileNetV1~V3

简介:随着神经网络结构越来越复杂,预测和训练需要的硬件资源也逐步增多,往往只能在高算力的服务器中运行深度学习神经网络模型。移动设备因硬件资源和算力的限制,很难运行复杂的深度学习网络模型。So,业内提出了SqueezeNet、ShuffleNet、NasNet、MnasNet以及MobileNet等轻量级网络模型。这些模型使移动终端、嵌入式设备运行神经网络模型成为可能。而MobileNet在轻量级神经网络中较具代表性。原论文地址:MobileNetV1:https://arxiv.org/pdf/170

2021-01-25 11:00:27 735

原创 Github Desktop项目管理小记

简介:Github管理自己的项目流程步骤:modify → conmmit → publish → viewGitHub桌面版对于个人用户非常方便,不用去记忆那么多的命令,只需要懂得一些概念,然后点击界面即可。官网下载地址:https://desktop.github.com/创建库:点击又上角的File,然后有一个New repository给仓库取个名字,给它在本地找一个地址。把第三行的单选框勾上,相当于一个初始化,会创建一个readme文件。添加、修改文件:进入仓库的目录,新

2020-12-10 15:07:12 305

原创 ROC曲线、PR曲线(笔记整理)

简介:ROC曲线和PR曲线是机器学习中两个常见的评估指标(对于二分器而言),做个笔记…原理:在二分类问题中,分类器将一个实例的分类标记为是或否,这可以用一个混淆矩阵来表示。混淆矩阵有四个分类,如下表:TP(True Positive):指正确分类的正样本数,即预测为正样本,实际也是正样本。FP(False Positive):指被错误的标记为正样本的负样本数,即实际为负样本而被预测为正样本,所以是False。TN(True Negative):指正确分类的负样本数,即预测为负样本,实际也是负样

2020-11-20 18:39:50 1118

原创 目标检测——RefineDet(十一)

简介:RefineDet——《single-shot refinement neural network for object detection》是CVPR2018的论文,大致上是SSD和RPN、FPN的结合,可以在保持SSD高效的前提下提高检测效果。主要思想:一方面引入two stage类型的object detection算法中对box的由粗到细的回归思想,另一方面引入类似FPN网络的特征融合操作用于检测网络,可以有效提高对小目标的检测效果。原论文地址:https://arxiv.org/pdf/

2020-11-11 19:05:22 910

原创 目标检测——RetinaNet(十)

简介:这篇paper《RetinaNet:Focal Loss for Dense Object Detection》获得了ICCV 2017的Best,创新点就是Focal Loss了,其主要贡献就是解决了one-stage算法中正负样本的比例严重失衡的问题,不需要改变网络结构,只需要改变损失函数就可以获得很好的效果。原论文地址:https://arxiv.org/pdf/1708.02002.pdf网络结构:由上图可以看出结构比较简单,基础网络使用的是Resnet,然后在不同尺度的featur

2020-11-03 15:25:03 578 1

原创 目标检测——SSD(九)

简介:前面已经总结了RCNN系列和YOLO系列,那么SSD同样是目标检测领域的经典论文,后续很多论文以此为基础,所以还是有必要来梳理一下。SSD全名Single Shot MultiBox Detector,对于Faster R-CNN,先通过CNN得到候选框,然后进行分类和回归,而YOLO和SSD可以一步完成检测;对于YOLO,SSD采用CNN来直接进行检测,而不是像YOLO那样采用全连接层后做检测。原论文地址:https://arxiv.org/pdf/1512.02325.pdf一、网络结构:

2020-10-29 09:52:41 594 1

原创 图像处理——直方图均衡化算法

前言:直方图均衡化是灰度变换的一个重要应用,高效且易于实现。它通过改变图像的直方图来改变图像中各像素的灰度,主要用于增强动态范围偏小的图像的对比度。如果一幅图像整体偏暗或者偏亮,那么直方图均衡化的方法很适用。一、OpenCV中直方图均衡化函数调用自带的函数:cv2.equalizeHistOpenCV中直方图均衡化算法的输入图像需为八位单通道图像,也就是灰度图像。若想要处计算彩色图像的均衡化图,可以先将图像用split函数进行通道分离,分别处理每一个通道的图像,在用merge函数进行合并。impo

2020-10-27 14:12:12 2604 1

原创 图像处理——孔洞填充算法

前言:先看一下需求:算法原理:1、以原图像的补集作为Mask,用来限制膨胀结果;2、以带有白色边框的黑色图像为初始Marker,用SE对其进行连续膨胀,直至收敛;3、最后对Marker取补即得到最终图像,与原图相减可得到填充图像。python代码:# -*- coding:utf-8 -*-import numpy as npimport cv2class kdtc(): def __init__(self): pass def readTif(sel

2020-08-28 15:06:48 4158 5

原创 目标检测——YOLOv5(八)

简介:YOLOv4 (2020.4.23)发布还不到 2 个月,很多人都没来及仔细看。。。突然 YOLOv5 (2020.6.10)又双叕来了。。。YOLOv5的大小仅有 27 MB,而使用 darknet 架构的 YOLOv4 有 244 MB,对比之下小了近 90%,同时在准确度方面又与 YOLOv4 基准相当。Github地址:https://github.com/ultralytics/yolov5作者给的算法性能如下图:网络结构:改编自知乎大佬的一张图:创新点:1、Input:

2020-08-27 17:43:23 15644 1

原创 计算机视觉里的attention总结

简介:注意力机制(attention)最早应用应该是在机器翻译上,近年来又在计算机视觉(CV)任务中火了起来。CV中的注意力机制的主要是想让神经网络着重学习感兴趣的地方。前言:注意力有两种,一种是软注意力(soft attention),另一种则是强注意力(hard attention)。1、软注意力更关注区域或者通道,而且软注意力是确定性的注意力,学习完成后直接可以通过网络生成,最关键的地方是软注意力是可微的,这是一个非常重要的地方。可以微分的注意力就可以通过神经网络算出梯度并且前向传播和后向反馈

2020-08-07 09:31:34 769

原创 医学DICOM文件解析(笔记整理)

简介:之前做超声的时候第一次接触带dicom后缀的图像文件,于是记录一下有关医学影像的学习笔记。DICOM(Digital Imaging and Communications in Medicine)即医学数字成像和通信,是医学图像和相关信息的国际标准(ISO 12052)。它被广泛应用于放射医疗,心血管成像以及放射诊疗诊断设备(X射线,CT,核磁共振,超声等),并且在眼科和牙科等其它医学领域得到越来越深入广泛的应用。DICOM文件:医学图像设备生成 DICOM 文件,医生使用 DICOM 阅读器

2020-08-03 18:04:38 5417 1

原创 关于模型训练时loss变化的问题(笔记整理)

好记性不如烂笔头:train loss 下降⬇,val loss下降⬇,说明网络仍在学习;~~ 奈斯,继续训练train loss 下降⬇,val loss上升⬆,说明网络开始过拟合了;~~ 赶紧停止吧,然后数据增强、正则train loss 不变,val loss不变,说明学习遇到瓶颈;~~ 调小学习率或批量数目train loss 不变,val loss下降⬇,说明数据集100%有问题;~~ 检查数据集标注有没有问题train loss 上升⬆,val loss上升⬆,说明网络结构设计不当,

2020-07-28 13:23:58 9952 14

原创 十大经典排序算法python实现(笔记整理)

排序算法看多少遍忘多少遍…所以干脆记下来算了。为了方便更清晰的认识,先看一张图:一、冒泡排序。比较相邻元素。如果第一个比第二个大,就交换。从第一对开始遍历,第一轮结束后,最末的元素是最大的数。剩下的元素重复以上步骤。输入为正序时最快O(n),输入为反序时最慢O(n×n)。python实现:def bubbleSort(a): for i in range(1, len(a...

2020-07-27 11:01:28 315

原创 SVM面试问答(笔记整理)

面试的时候SVM基本必问了,做个笔记方便以后回忆

2020-07-24 09:22:28 450

原创 目标检测——YOLOv4(七)

简介:随着深度学习的发展,目前已经出现了很多算法(或者训练技巧,tricks)来提升神经网络的准确率。在实际测试中评价一个算法的好坏优劣主要看两点,一是能否在大规模的数据集中起作用(work),二是是否有理论依据。...

2020-07-23 19:59:22 2743

原创 目标检测——YOLOv3(六)

简介在前面已经介绍了很多目标检测算法,特别是R-CNN为代表两阶段算法系列。但是两阶段算法的速度太慢是一个不容忽视的问题,对于实时性要求很高的场景非常致命。而YOLO——you only look one的诞生就是为了解决识别速度的问题,它直接在输出层回归bounding box的位置和bounding box所属类别,从而实现one-stage。原论文地址:https://arxiv.org/pdf/1804.02767.pdfYOLOv3的前世今生YOLOv1 (2015,CVPR):主干网

2020-07-14 15:21:44 1733

原创 目标检测——R-FCN(五)

简介R-FCN是NIPS 2016的best paper,主要贡献在于解决了“分类网络的位置不敏感性”与“检测网络的位置敏感性”之间的矛盾,在提升精度的同时利用“position-sensitive score maps”提升了检测速度。原论文地址:https://arxiv.org/abs/1605.06409一、整体框架从上图可以看出,整个网络的组成为:一个CNN特征提取器(如Res...

2020-01-07 17:44:54 521

原创 语义分割——PSPNet(五)

简介Pyramid Scene Parsing Network(PSPNet)首次出现在2016年的ImageNet比赛中,并拿下scene parsing任务的冠军。PSPNet在FCN的基础上引入更多上下文信息是通过全局均值池化操作和特征融合实现的,因此特征呈金字塔结构,所以也叫金字塔池化。PSPNet论文地址:https://arxiv.org/pdf/1612.01105.pdfPS...

2019-12-16 11:55:49 728

原创 语义分割——SegNet(四)

简介补充一下2015年发表的SegNet模型,它是由剑桥大学团队开发的图像分割的开源项目,该项目可以对图像中的物体所在区域进行分割。SegNet是在FCN的语义分割任务基础上,搭建encoder-decoder对称结构,实现端到端的像素级别图像分割。其新颖之处在于解码器对其较低分辨率的输入特征图进行上采样的方式。SegNet论文地址:https://arxiv.org/abs/1511.005...

2019-11-26 13:30:49 2714 1

原创 目标检测——Mask R-CNN(四)

简介Mask R-CNN是ICCV 2017的best paper,彰显了机器学习计算机视觉领域在2017年的最新成果。在机器学习2017年的最新发展中,单任务的网络结构已经逐渐不再引人瞩目,取而代之的是集成,复杂的多任务网络模型。文章的主要思路就是把原有的Faster R-CNN进行扩展,添加一个分支使用现有的检测对目标进行并行预测。原论文地址:http://cn.arxiv.org/pdf...

2019-09-19 22:08:35 570

原创 目标检测——Faster R-CNN(三)

简介经过R-CNN和Fast R-CNN的积淀,Ross B. Girshick在2016年提出了新的Faster R-CNN,在结构上,Faster R-CNN已经将特征抽取(feature extraction),proposal提取,bounding box regression(rect refine),classification都整合在了一个网络中,使得综合性能有较大提高,在检测速度...

2019-06-02 23:26:11 664

原创 目标检测——Fast R-CNN(二)

简介R-CNN的进阶版Fast R-CNN就是在R-CNN的基础上采纳了Spatial Pyramid Pooling(SPP) 方法,对R-CNN作了改进,使得性能进一步提高。《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》论文地址:https://arxiv.org/pdf/140...

2019-05-30 21:32:47 425

原创 目标检测——R-CNN(一)

简介R-CNN的全称是Region-CNN,它可以说是是第一个成功将深度学习应用到目标检测上的算法。它是2014年发布的一篇论文,题目是 《Rich feature hierarchies for accurate oject detection and semantic segmentation》,通俗地来讲就是一个用来做目标检测和语义分割的神经网络。原论文地址:https://arxiv....

2019-05-25 16:11:53 976

转载 语义分割——U-Net++(三)

这篇论文《UNet++: A Nested U-Net Architecture for Medical Image Segmentation》是2018年6月的文章,DLMIA2018会议。文章对Unet改进的点主要是skip connection。

2019-05-22 10:43:39 8872 1

原创 语义分割——U-Net(二)

U-Net通俗来讲也是卷积神经网络的一种变形,主要其结构经论文作者画出来形似字母U,因而得名U-Net。

2019-05-05 00:12:56 2423

原创 语义分割——FCN(一)

简介:在计算机视觉领域,全卷积网络(FCN)是比较有名的图像分割网络。...

2019-05-04 14:44:44 6094

原创 Batch Normalization(笔记整理)

关于Batch Normalization的白话理解和算法流程之超详细笔记整理。

2019-05-03 00:46:27 11887

原创 CNN发展简史——DenseNet(六)

2017年提出一种DenseNet(Dense Convolutional Network),主要还是和ResNet及Inception网络做对比,思想上有借鉴,但却是全新的结构,网络结构并不复杂,却非常有效!

2019-05-02 14:50:49 2676 1

原创 CNN发展简史——ResNet(五)

简介深度残差网络是2015年提出的深度卷积网络,一经出世,便在ImageNet中斩获图像分类、检测、定位三项的冠军。

2019-04-30 22:26:47 4945

原创 CNN发展简史——GoogLeNet(四)

简介GoogLeNet是2014年 ILSVRC 冠军模型,top-5 错误率 6.7% ,GoogLeNet做了更大胆的网络上的尝试而不像vgg继承了lenet以及alexnet的一些框架,该模型虽然有22层,但参数量只有AlexNet的1/12。原论文地址:https://arxiv.org/pdf/1409.4842.pdf(-2014-)GoogLeNet:GoogLeNet论文指...

2019-04-30 00:17:32 1630

原创 CNN发展简史——VGG(三)

简介VGGNet是2014年ILSVRC竞赛的第二名,第一名是GoogLeNet(谷歌为了纪念LeNet,所以用的大写L)。先讲VGG,因为它这个模型在多个迁移学习任务中的表现要优于GoogLeNet。而且,从图像中提取CNN特征,VGG模型是首选算法。它的缺点在于,参数量有140M之多,需要更大的存储空间。但是这个模型很有研究价值。原论文地址:https://arxiv.org/pdf/14...

2019-04-29 14:07:37 4007

原创 CNN发展简史——AlexNet(二)

简介进入到新世纪,第一个突破并不是在算法上的,而是工程上。2006年,研究人员成功利用GPU加速了CNN,相比CPU实现快了4倍。虽然这里没有算法的提升,但是其意义可能比一般的算法提升更大。..(-2012-)AlexNet直到2012年,这一年AlexNet的出现可以说是标志着神经网络的复苏和深度学习的崛起。...

2019-04-27 15:04:23 2812

原创 CNN发展简史——LeNet(一)

CNN简史首先来回顾一下CNN发展的历史,为什么要做这个总结呢?除了加深我们对CNN框架的理解之外,沿着CNN发展的历史进程走一遍也是非常有趣的事。假如你不研究历史,你肯定不知道打火机居然早于火柴被发明,而ReLU比tanh更早被应用在神经网络中。很久很久以前:神经网络这一概念最早是生物界提出的,而人工智能界的神经网络很大程度上是在模拟人类的神经元。影响到CNN起源的相关研究是有关视觉皮层的...

2019-04-26 11:51:31 9522 2

原创 序列模型汇总__门控循环单元(GRU)(三)

简介GRU是LSTM网络的一种效果很好的变体,它较LSTM网络的结构更加简单,而且效果也很好,因此也是当前非常流形的一种网络。GRU既然是LSTM的变体,因此也是可以解决RNN网络中的长依赖问题。GRU与LSTM相比,少了一个gate,由此就少了一些矩阵乘法,GRU虽与LSTM的效果较近,但却因此在训练中节省了很多时间,在文本类处理中,相比用LSTM,更建议用GRU来训练。GRU原理:...

2019-04-25 13:34:47 1485 1

原创 序列模型汇总__长短期记忆网络(LSTM)(二)

在过去的几年里,RNN应在语音识别、语言建模、翻译,图像字幕等各种问题上取得了巨大成功。这些成功的案例的共同点就是都是用了LSTM,这是一种非常特殊的循环神经网络,对于许多任务来说,它们比基准版本好的多。 几乎所有令人兴奋的结果都是基于循环神经网络实现的,这篇文章将探讨这些LSTM,带你解开LSTM的神秘面纱。

2019-04-24 21:52:16 1443

原创 序列模型汇总__循环神经网络(RNN)(一)

序列模型是监督学习的一种,也就是其输入数据是带标签的。如语音识别、音乐生成、情感分析、DNA序列分析、机器翻译、视频行为识别、人名实体识别等,其特点是输入或输入或者输入输出是时序的。

2019-04-23 00:08:12 2333

houchuli.py

遥感图像语义分割后处理阶段,自己写的孔洞填充算法,不仅对全封闭孔洞有效,对不封闭的也有效,附带自己模仿cv2.imread函数写的readTif函数,可以直接读取整张大图。

2020-08-28

hemiaopoints.py

农业项目中,为了提取初期的小目标,设计的传统目标检测算法,可以定位到农作物的坐标,并计算株距等指标,存为xml或json文件,识别速度快效率高。

2020-07-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除