自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(55)
  • 收藏
  • 关注

原创 Navicat连接不上远程服务器MySQL提示10038

解决navicat连接mysql服务器出现10038错误

2022-08-08 22:02:30 679 1

原创 解决Cuda out of memory的一种思路

在实际做实验的过程中,cuda of memory问题很常见,在整理过网上的思路后,大致有如下几种:减小batch_size(常用)或减小模型参数和输入的大小(很少用到)。在测试过程中加上如下语句:with torch.no_grad()内存就不会分配参数梯度的空间。训练过程中遇到此情况可尝试在训练前释放cuda内存。nvidia-smi 查看gpu的使用率,若使用率不高就使用torch.cuda.empty_cache()释放内存这次又出现了新的问题,我将我遇到的情况总结如下:#在修

2022-04-30 17:58:49 8674 5

原创 学习笔记:OriTripletLoss函数的解析 源码解析

1. 源代码class OriTripletLoss(nn.Module): """Triplet loss with hard positive/negative mining. Reference: Hermans et al. In Defense of the Triplet Loss for Person Re-Identification. arXiv:1703.07737. Code imported from https://github.com/

2021-11-25 20:59:19 1276 2

原创 实验笔记:使用pycharm和github提交代码

1. pycharm设置打开pycharm File-> Settings -> Version Control -> Github 依次选择选项中内容。点击加号或者Add account,在弹出的对话框中输入自己的github账号密码:中间如果出现authe fail 404 not found的问题,试着将右边的网址填写上去,或者直接使用token的方式进行登录。Token方式登录。进入github右上角点击头像,然后settings -> Developer

2021-11-22 16:41:04 1384

原创 行人重识别论文阅读14-Learning by Aligning- Visible-Infrared Person Re-identification

文章来源:Learning by Aligning- Visible-Infrared Person Re-identification using Cross-Modal Correspondences1. 解决的问题&总结1.1 解决的问题本文主要解决了VI-ReID问题:从一系列跨模态的人物图像中找到目标可见或红外光图像。假设人物图像粗略对齐,以前的方法是学习粗糙人物图像或固定部分级别的人物表示,而这些表示在不同模式中是有区别的,现有的方法裁剪的人物图像又不一定对齐,这会影响模型的效率

2021-10-22 21:22:40 1124 1

原创 行人重识别论文阅读13-Parameter Sharing Exploration and Hetero-center Triplet Loss for Visible-Thermal Person

Parameter Sharing Exploration and Hetero-center Triplet Loss for Visible-Thermal Person Re-Identification1. 解决的问题解决白天可见光和夜晚红外热成像的人员匹配问题,通过使用共享的双流网络进行研究。VT-ReID问题面临的两个问题:可见光和红外光的图片性质差别较大。由于摄像头视点变化和不同的人体姿势导致的模态内度量困难。一般此问题都是采用双流的网络解决,将不同模态的特征映射到公共空间中。

2021-10-14 21:06:59 773 3

原创 行人重识别论文阅读12-Bi-directional Exponential Angular Triplet Loss for RGB-Infrared Person ReID

expAT:双向指数角度三元组损失Bi-directional Exponential Angular Triplet Loss for RGB-Infrared Person Re-Identification1. 解决的问题因为欧氏距离不能有效地测量角度可判别特征嵌入。并且因为角度鉴别特征空间对基于嵌入向量的行人图像分类十分重要。双向指数角度三重损失:通过显式约束嵌入向量之间的夹角帮助学习角度可分离的公共特征空间。2. 提出的方法作者提出双向指数角度三元组损失,使用余弦距离来衡量包括角度的距

2021-08-27 16:54:20 502

原创 行人重识别论文阅读11-BDTR 红外光行人重识别

Bi-Directional Center-Constrained Top-Ranking for Visible Thermal Person Re-IdentificationBDTR: 双向中心约束的排序损失1. 解决的问题红外光和可见光图像之间差异大,而且存在大量的噪声,无法学习可判别的特征。而现有的方法对噪声图像具有弱鲁棒性。多模态问题中出现模态间的特征映射关系不准确以及模态内变化巨大的问题。2. 模型概览提出双向中心聚合的排序损失函数同时考虑模态内和模态间的变化。提出双向中心约束

2021-08-26 21:22:37 742

原创 行人重识别论文阅读10-DDAG 动态双注意聚合学习策略

红外行人重识别的动态双注意力聚合学习Dynamic Dual-Attentive Aggregation Learning for Visible-Infrared Person Re-Identification1. 解决的问题:现有的VI-ReID倾向于全局表示,这种表示具有有限的可分辨率性和对噪声图像的弱鲁棒性。解决跨模态的行人重识别中模态对齐问题。2. 方法概述:提出动态双注意聚合的学习方法DDAG,通过挖掘VI-ReID的模态内部分级和跨模态图级上下文线索。模态内加权部分注意模块(IW

2021-08-26 16:12:20 1751 1

原创 行人重识别论文阅读9-ViTAA:自然语言搜索中文本属性的视觉对齐

ViTAA:自然语言搜索中文本属性的视觉对齐概括:这篇文章解决了什么问题,用了什么方法,有什么效果,你有什么收获这篇文章从属性特定对齐学习的角度来解决自然语言中人员搜索的问题。方法:允许将特定属性短语固定到相应的视觉区域。模型学习使用一个辅助属性分割层将一个人的特征空间分解成与属性对应的子空间。然后,通过一种新颖的对比学习方法(k倒数采样),将这些视觉特征与从句子中解析出来的文本属性联系起来。收获:该方法充分利用不同身份的视觉和文本模式中的共同属性信息,并利用对齐学习模式在视觉属性特征和相应的文本短

2021-08-05 14:40:25 491 1

原创 行人重识别实验笔记3-JDAI fast-reid项目配置

1. 安装依赖pip install -r requirments.txt2. Getting Started

2021-07-24 17:59:43 767 6

原创 行人重识别论文阅读8-FastReID京东快速行人重识别

7.22 京东 Fast-ReID论文阅读1. 解决的问题FastReID是京东AI研究中广泛使用的软件系统,有高度模块化和可扩展的设计,有好的可管理的系统配置和工程部署。FastReID是统一实例重标识库,允许其他人员将其他代码块插入到ReID系统,从而进一步快速的将研究思想转移到生产模型中。提供person reid,partial person reid,vehicle reid。2. 模型概述FastReID的亮点:模块化和可扩展设计:可以快速实现他们的想法,无需重写数十万行代码。可

2021-07-24 17:58:17 1167 1

原创 行人重识别论文阅读7-基于图卷积的行人骨架识别

0. 怎么看论文怎么看论文:带着目的,你是想要解决什么问题,这篇论文的摘要能给你带来什么收获。摘要、结论:是否和你的研究方向高度相关,或者如果你应用这个模型能解决什么问题。引言部分:作者为什么额开展这项研究。这篇文章是否值得精读。深度挖掘结论和讨论部分:如何开展实验获得初始数据、数据分析解读数据内涵等。做笔记(Endnote、Mendeley):列出对自己有价值核心信息,方便后面定位相关文献。或者表格列出文献:序号、文献名称、文献类型、发表年份、关键部分、研究方法、存在

2021-07-21 11:18:32 1039 1

原创 行人重识别论文阅读6-低分辨率的行人重识别研究

Learning Resolution-Invariant Deep Representations for Person Re-Identification学习分辨率不变的的深度表示用于行人重识别RAIN解决的问题现实场景查询图像可能会出现分辨率丢失的问题,这篇文章就是解决行人重识别中分辨率不匹配的问题。论文创新点提出新的网络结构解决跨分辨率的行人重识别,替代原有的应用图像超分辨率模型。提出对抗学习策略,提取分辨率不变的重识别表示,类似于自动编码器的结构,保留图像的标识能力。同时以端到端的训练方

2021-07-18 15:24:30 832 8

原创 行人重识别论文阅读5-基于换衣服的行人重识别

基于换衣服的行人重识别问题总结现有行人重识别的缺点:过度依赖衣服颜色导致将衣着相似的人混淆。本文基于人物图像的轮廓草图来执行跨服装的Re-ID,以利用人体的形状而不是颜色信息来提取对适度服装变化鲁棒的特征。算法概述假设短时间内行人轮廓变化不大并且天气也没有显著变化时,要从轮廓草图中提取可靠且有区别的曲线模式,轮廓草图为克服同一个人的图像之间的差异提供了可靠和有效地视觉线索。本文开发了一种基于学习的空间极坐标变换(SPT)来自动选择/采样相对不变的、可靠的和有区别的局部曲线模式。此外,我们引入角度特

2021-07-15 21:25:46 2673 16

原创 行人重识别论文阅读4,行人重识别实验笔记1-无锚行人搜索框架

Anchor-Free Person Search无锚的行人搜索框架(AlignPS)Feature-Aligned Person Search Network(特征对齐的行人搜索网络)解决的问题解决不同级别的错位问题:提出对齐的特征聚合模块,通过遵循“reid first”的原则来生成更具有区分性和鲁棒性的特征嵌入。本文提出:无锚检测模型的典型架构,带有对齐特征聚合模块(AFA),AFA通过利用可变形卷积和特征融合来克服重识别特征学习中区域和尺度错位的问题,重塑FPN一些构造块。one

2021-07-15 21:24:59 683 8

原创 行人重识别实验笔记2-mmdetection代码配置(人体骨架结构分析)

1. 错误处理首先出现了什么

2021-07-15 20:44:36 382

原创 目标追踪与定位实战笔记2-一生之敌:Cuda out of memory!

1. 环境配置将代码从github上下载解压之后需要配置python环境,然后安装requirements.txt中的依赖,然后我们进入readme界面,下载好maskrcnn_benchmark,将其引入到项目文件夹中,第一个问题出来了,

2021-07-06 16:38:06 619 1

原创 行人重识别论文阅读3-行人重识别中的部分对部分的对应学习(PPCL)

Partial Person Re-identification with Part-Part Correspondence Learning行人重识别中的部分对部分的对应学习论文地址:Paper解决的问题将重点放在识别部分(有缺陷的)输入,借助部分-部分对应学习(PPCL),这是以种自监督学习框架,无需任何额外的部分级监督即可学习图像块之间的对应关系。同时将本文的模型应用于人脸识别中,效果也能提高。文章概述本文提出一个部分-部分对应学习(PPCL)解决部分行人重识别问题。提出门控布局整流器

2021-06-30 14:39:32 810

原创 行人重识别论文阅读2-视频中基于时空相关性和拓扑学习的行人重识别(CTL)

视频中基于时空相关性和拓扑学习的行人重识别Spatial-Temporal Correlation and Topology Learning for Person Re-Identification in Videos解决的问题:本文提出一个新的时空相关性和拓扑学习框架(CTL),通过建立跨尺度的时空相关性来追求有区别的和鲁棒的表示。利用一个CNN主干和一个关键点估计其从人体中提取多个粒度的语义局部特征作为图节点。通过考虑全局上下文信息和人体的物理联系,探索了一种上下文增强拓扑来构造多尺度图。

2021-06-28 10:28:53 1133

原创 行人重识别论文阅读1-Watching You: Global-guided Reciprocal Learning for Video-based Person Re-identification

论文链接:GRL框架论文论文总结本文提出一个基于视频的全局引导的交互学习框架(GRL Global-guided Reciprocal Learning)。提出全局引导相关估计生成局部特征和全局特征的特征相关图,然后将区分特征分界为高相关特征和低相关特征。提出全局特征估计模块生成解纠缠视频表示下的引导图。提出一种新的TRL(时间交互学习)模块,可以有效监控信息和视频中的细粒度信息,用于依次增强高相关性语义信息和积累低相关性亚关键线索。模型特点:可以增强来自高相关区域的显著信息,还可以积累来

2021-06-24 16:27:41 1138 1

原创 目标追踪与定位学习笔记10-SiamMOT论文阅读

阅读论文SiamMOT网络我现在的问题:问题描述: 给定一个目标进行跟踪,注意观察到人物的遮挡、进入人群中或者视角变化等因素下SiamMOT专注于改进局部跟踪,在轨迹不可见的情况下也能向前跟踪,即跟踪器知道连续τ\tauτ帧未能跟踪到相应的目标是才终止轨迹。在线跟踪器在实时场景中专注于改进连续帧上的局部连接,而不是构建一个离线图来识别跨大时间间隔的实例。文章主要工作:提出SiamMOT模型,使用基于区域的特征开发(显式)模板匹配来估计实例运动能够对跟踪场景(快速运动)更加鲁棒。在Faster

2021-06-17 20:22:35 821

原创 目标追踪与定位实验笔记1-项目配置篇SiamCAR代码

首先 在命令行中输入anaconda-navigator新建anaconda环境选择python版本 然后点击确定在pycharm中选择对应项目,进行环境配置file -> settings -> project: -> python Interpreter然后选择我们创建好的python环境在pycharm终端下cd /home/username/下载pip install torch-1.8.0+cu111-cp36-cp36m-linux_x86_64.w.

2021-06-09 15:38:46 1643 9

原创 目标追踪与定位学习笔记9-端到端的多目标跟踪论文阅读

MOTR: End-to-End Multiple-Object Tracking with Transformer论文地址:arXiv论文源码:code1. 概述现有方法的缺点:缺乏从数据中学习时间变化的能力。采用简单的启发式方法(空间或外观相似性),这些方法简单不足以模拟复杂的变化,例如通过遮挡进行跟踪。本文介绍的MOTR是一个完全端到端的多目标跟踪框架,学习模拟物体的长时间变化,隐式的执行时间关联,避免以前的显示启发式。在Transformer,DETR,MOTR的基础上引入轨迹查询的概念。

2021-06-05 15:42:59 949

原创 目标追踪与定位学习笔记8-排斥损失:检测人群中的行人

Repulsion Loss: Detecting Pedestrians in a Crowd排斥损失:检测人群中的行人论文链接:arXiv1. 论文思路本文通过为拥挤场景设计普通边界框回归损失,即排斥损失。这种损失分为两部分:目标的吸引和周围其他物体的排斥。排斥损失可以防止proposals转移到周围的对象从而有更强的鲁棒性。解决的问题:当目标行人T被另一个行人B重叠时,因为检测器混淆导致以T为界限的预测框很可能会转移到B,从而导致定位不准确。更进一步,NMS使得从T偏移的边界框可能被B的预测

2021-05-26 20:43:07 803

原创 目标追踪与定位学习笔记7-遮挡感知R-CNN:在人群中检测行人论文阅读

Occlusion-aware R-CNN:Detecting Pedestrians in a Crowd遮挡感知R-CNN:在人群中检测行人1. Overview文章提出了新的遮挡感知算法来提高人群中的检测精度,具体而言设计一个新的aggregation loss去靠近并紧凑的定位到相对应对象。同时,使用一个新的汇集单元来代替RoI汇集层,以便将具有可见性预测的人体先验结构信息集成到网络中来处理遮挡。此文章使用的数据集(CityPersons, ETH, INRIA)AggLoss==不仅

2021-05-21 17:11:03 924

原创 目标跟踪与定位学习笔记6-用于视觉跟踪的孪生全卷积分类和回归论文阅读

阅读论文的步骤:查阅文献->阅读文献->文献复现->找文献的不足进行改进->研究出成果1. 论文思路通过将目标跟踪任务分解为像素级别的分类和在像素处对象边界框回归的两个子问题,提出一种新的全卷积孪生神经网络,以每个像素方式端到端的解决视觉跟踪问题。SiamCAR由两个简单的子网构成:一个用于特征提取的Siamese subnetwork和一个用于边界盒预测的分类回归子网络。框架以ResNet50为骨架网络。SOTA的方法SiamRPN,SiamRPN++和SPM都是基于区域的,

2021-05-13 18:05:33 741

原创 目标跟踪与定位学习笔记5-时间滑动窗口原理

首先提出一个问题,目标跟踪的流程是什么样的或者说怎么去实现目标追踪?这里结合老师的讲解,具体流程如下:给定第M帧图像,在M+1帧上结合M帧的位置在其周围邻域内进行搜索,通过交叉相关衡量检测框与模板框的相似度,在有限的穷举之后选择前后两帧相关程度最大的作为目标的下一个运动点,然后将前后两帧的位置进行连接就会形成一个短小的目标轨迹,以此类推,目标的运动轨迹就出现了,这也就是时间滑动窗口的原理。在此引入两个概念,交并比(IoU)和非极大抑制(NMS)在目标追踪时,生成候选样本的速度会直接决定跟踪系统表现的优

2021-05-12 19:46:52 683

原创 目标跟踪与定位学习笔记4-用于目标追踪的全卷积孪生神经网络

Fully- Convolutional Siamese Networks for Object Tracking用于目标追踪的全卷积孪生神经网络论文链接:arXiv1. 概述问题是跟踪视频中任意对象的问题,其中对象仅通过第一帧中的矩形来识别。虽然计算机视觉中的其他问题已经越来越普遍的采用的从大型监督数据集训练的深度卷积网络,但是监督数据的稀缺和实时操作的限制阻止了深度学习在每个视频学习一个检测器的范例的完美应用。本文提出的方法在数十里现阶段训练深度卷积网络来解决更一般的相似性学习问题。然后在跟

2021-05-10 15:58:44 1133

原创 目标追踪与定位学习笔记3-多目标多摄像机跟踪的局部感知外观度量论文阅读

Locality Aware Appearance Metric for Multi-Target Multi-Camera Tracking多目标多摄像机跟踪的局部感知外观度量本文要介绍的是澳洲国立大学(Australian National University)郑良老师实验室和清华大学电子系计算机视觉实验室合作的工作《Locality Aware Appearance Metric for Multi-Target Multi-Camera Tracking》。文章链接:arXiv;代码:re-

2021-04-29 15:34:03 2085

原创 目标定位与追踪学习笔记2 -目标追踪(tracking)和重识别(re-ID)的关系

关于目标追踪问题和重识别问题的一点学习笔记,参考知乎大佬的帖子:重识别(re-ID)特征适合直接用于跟踪(tracking)问题么?首先,tracking问题和re-ID问题的本质区别:局部匹配和全局匹配。...

2021-04-27 15:58:36 2127

原创 目标追踪与定位学习笔记1-行人再识别问题的分析和总结

1. ReID问题综述ReID(Person Re-Identification),行人再识别,给定一个监控行人图像,检索跨设备下的该行人图像,目标是弥补固定摄像头的视觉局限,并可以和行人检测/行人跟踪技术相结合。简单来说是跨非重叠摄像头的特定人检索问题。ReID问题的识别流程:原始数据收集->边界生成->训练数据注释->模型训练->行人检测当前问题存在的难点:存在不同视点,不同的低图像分辨率、照明变化、不同姿态约束遮挡、异质模式、复杂的相机环境、北京杂波、不可靠的边界框生成。

2021-04-21 15:14:59 1842 1

原创 pytorch学习笔记7-ResNet18的实现

1. 概述深度学习曾经很好的帮助人们解决了很多问题,但随着它的发展,两朵乌云也随之笼罩在深度学习的天空中:梯度弥散/梯度爆炸和网络的退化问题。随之ResNet被提出,解决了深度学习中层次很深网络的性能也不会衰退的很厉害的问题。本文旨在参考多方资料写出自己使用pytorch对resnet的实现,以此记录自己的学习。2. 数据集选择此处使用Cifar-10数据集,里面包含该数据集共有60000张彩色图像,这些图像是32*32,分为10个类,每类6000张图。使用pytorch将数据集导入。import

2021-04-15 17:31:54 910

原创 pytorch学习笔记6-visdom可视化工具的使用

1. 概述在深度学习框架pytorch中,可视化工具尤为重要,它可以实时监督模型训练的状况,并可视化出来,相对于visdom有一种可视化工具叫tensorboardX,因为它大概30s才刷新一次,并且运行起来比较占用内存所以现在都在用visdom进行深度学习可视化的监督。下来介绍visdom的基本用法。2. 安装在命令行cmd或者终端terminal中运行下面的语句:pip install visdom即可完成visdom的安装3. 启动visdom工具输入命令python -m visd

2021-04-14 19:48:27 315

原创 pytorch学习笔记5-回归问题实战

使用python语言进行回归问题的实战,问题是给出多个数据点通过回归方法使用梯度下降来进行问题优化。1. 加载数据def run(): points = np.genfromtext("data.csv“, delimiter=",") lr = 0.0001 # 定义学习率 即每次变量要变化的量Δ initial_b = 0 initial_w = 0 # 定义初始化参数的值 num_inerations = 1000 # 定义迭代次数 print("starting gradient

2021-04-14 15:03:31 192 3

原创 pytorch学习笔记4-张量操作

1. 概览张量的合并张量的运算张量的数值计算张量的范数张量的高阶操作2. 张量的合并# cata1 = torch.rand(4,3,32,32)a2 = torch.rand(5,3,32,32)torch.cat([a1,a2],dim=0).shape# torch.Size([9,3,32,32])a2 = torch.rand(4,1,32,32)torch.cat([a1,a2],dim=1).shape #[4,4,32,32]# cat 除了合并的那一个维度不

2021-04-13 20:05:27 388

原创 pytorch学习笔记3-张量的操作

1. 概览本节主要内容有张量索引维度变换张量转置broadcasting操作2. 张量索引a = torch.rand(4,3,28,28)a[0,0].shapea[0,0,2,4]a[:2].shape# torch.Size([2,3,28,28]) 前两张图片a[:2,:1,:,:].shape #前两张图片 第一个channel# torch.Size([2,1,28,28])a[:,:,::2,::2].shape# 两个冒号表示 有三个参数 开始值 结束值 和

2021-04-13 15:57:57 393

原创 pytorch学习笔记2-创建Tensor

1. 从其他地方引入# 从numpy中引入a = np.array(2,3)torch.from_numpy(a)# 从list中引入torch.tensor([2, 3.2])2. Tensor的大小写区分torch.tensor([2,3.2])torch.Tensor(2)# tensor小写的是接受现有的数据# Tensor大写时表示向量的维度,大写也可以接受现有的数据,但是数据必须用[]括住表示为list数据3.未初始化数据当程序中出现torch.NaN 或者 tor

2021-04-12 20:11:07 230

原创 pytorch学习笔记1-pytorch的数据结构

1.pytorch的数据类型torch.FloatTensor torch.cuda.FloatTensortorch.DoubleTensor torch.cuda.DoubleTensortorch.IntTensor torch.cuda.IntTensortorch.HalfTensor torch.cuda.HalfTensortorch.ByteTensor torch.cuda.ByteTensor torch.CharTensor to

2021-04-12 18:08:41 231

原创 linux配置Java和Anaconda环境变量

1.配置Java环境变量首先进入到终端输入vi ~/.bashrc然后输入 i 插入数据export JAVA_HOME=/usr/lib/jvm/jdk15.0.2export JRE_HOME=${JAVA_HOME}/jreexport CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/libexport PATH=${JAVA_HOME}/bin:$PATH输入esc 然后 :wq 退出最后输入 source ~/.bashrc就完成环境变量

2021-04-10 16:05:16 1038

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除