自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

郑哲东的博客

计算机视觉 行人再识别 person re-ID

  • 博客(54)
  • 资源 (6)
  • 收藏
  • 关注

原创 读 AI学者生存策略

没有计算资源 ,没有标注的人力,很难做出突破性的研究。如作者最后所说的,(1) 分享一些想法给community,(2)提供一些guidelines ,讨论 学术届 与 工业界的AI赛道差异 (3)引发一些公开的讨论。作者也提到了 Sutton 关于Bitter Lesson的例子,可能越简单的方法,scale大了,自然就好了,不需要很多ad-hoc的东西。(读者按:我知道早期2017,2018确实是,需要一点技术,但近期我也不确定有没有好一些。另外可能也没人想去你的组,如果整组人都在,有点变味儿了。

2023-04-28 00:43:30 599

原创 ACM MM23 Workshop|多媒体+无人机

更大的图像尺寸保证了更高的图像清晰度,而更宽的取景范围允许图像包含更多不同的场景,例如建筑物、城市道路、树木、田野等(见图3)。在我们的初步评估中,干扰项具有挑战性,并使竞争性基线模型 LPN 在无人机→卫星任务中将 Recall@1 的准确率从 75.93% 降低到 64.85%,并将 AP 的值从 79.14% 降低到 67.69%( 请参见表 2)。(3). 特色论文(论文的标题和摘要,加上原始论文):已经发表的论文或总结与研讨会主题相关的主要会议和高影响力期刊上现有出版物的论文;

2023-04-28 00:25:49 1151

原创 TMM 22 | 像拆玩具一样的点云预训练

受视觉和语言任务中预训练和微调范式取得巨大成功的启发,我们认为预训练也是获得 3D 点云下游任务的可扩展模型的一种潜在解决方案。因此,在本文中,我们探索了一种新的自监督学习方法,称为混合和分离 (MD),用于 3D 点云表示学习。我们的出发点其实很简单,如下图 红色箭头所指的 混合点云,我们很容易就能看出 他是由 飞机(Plane) 和 椅子(Chair) 混合而成。基于这种观察,我们很自然的提出一个拆玩具的任务,网络需要能区分 一个 混合的点云中 那些点 是来自 点云A,哪些是来自点云B。

2023-04-28 00:20:31 646

原创 TIP2022|领域迁移Adaboost,让模型“选择”学哪些数据

因为就像Adaboost一样,我们让模型overfit难样本,为了获得一个互补的模型,这个单模型在单独使用的情况下,不一定能更好。根据训练过程中的snapshot(可以看成弱分类器),来针对性“选择”难样本,提高他们采样到的概率,如下图。通过这种方法 我们可以每轮训练一个模型,得到weak models (这都是在一次训练中的),我们通过weight moving average的方式 得到 Student Aggregation 也就是 “臭皮匠们组成的诸葛亮”。传统方案,显然我们组合后的模型较为稳定。

2022-12-24 11:48:09 608

原创 读Self-supervised Single-view 3D Reconstruction via Semantic Consistency

论文名:Self-supervised Single-view 3D Reconstruction via Semantic Consistency作者:Xueting Li, Sifei Liu, Kihwan Kim, Shalini De Mello, Varun Jampani, Ming-Hsuan Yang, and Jan KautzWhat从 2D 图像 和 mask 中 预测 3D mesh shap, texture 和 camera pose的 工作。不需要3D的标注 或者

2021-10-10 22:12:00 388

原创 读SMR 三维重构

文章题目:Self-Supervised 3D Mesh Reconstruction from Single Images链接:https://openaccess.thecvf.com/content/CVPR2021/papers/Hu_Self-Supervised_3D_Mesh_Reconstruction_From_Single_Images_CVPR_2021_paper.pdf作者:Tao Hu, Liwei Wang, Xiaogang Xu, Shu Liu, Jiaya Jia

2021-10-09 14:07:39 413

原创 2020深度学习配置列表

最近有同学问配置。。。以下是一年前配置的 三张2080TI的服务器,尽量选了CP值(性价比)比较高,和稳定的产品。今年如果买的到的话,可以换成3080 或者 3090。首先决定的是平台,虽然amd 超级好,但是考虑到一些库。当时用intel然后intel平台里 X299 算是比较稳定的workstation的板子,而且可以跑4路卡(很多板子只有2卡或者3卡,买的时候要小心)。华硕(ASUS) WS X299 SAGE主板 支持Intel X 系列CPU 99京东¥ 49.

2021-01-29 15:38:11 561

原创 行人重识别的挑战 与 最新进展 (35页PPT整理)

行人重识别近几年获得了在测试结果上的大幅提升,甚至超过了人的分辨能力,但是我们在实际应用上仍有很多待解决的问题。在本文中,我们take a step back, 提出了一些问题和潜在的解决方案,主要以我们reler组的尝试为主,包括大家比较熟知的 PCB / HHL/ PUL/ SPGAN/ DG-Net等工作,抛砖引玉。 希望能为未来这个领域的发展提供一些新的视野。由于篇幅,我们只能展示有限的工作,我们respect所有在这个领域作出贡献的老师同学们。感谢大家!这篇文章中提到多数文章的代码,我们都开源

2020-07-24 18:23:40 1185 2

原创 Person Search中关于特征Norm的讨论

论文题目:Norm-Aware Embedding for Efficient Person Search论文链接:http://openaccess.thecvf.com/content_CVPR_2020/papers/Chen_Norm-Aware_Embedding_for_Efficient_Person_Search_CVPR_2020_paper.pdf代码:https://github.com/DeanChan/NAE4PS这篇是DiChen,shanshan zhang 老师,

2020-06-19 08:48:31 946

原创 Pytorch GPU 显存溢出 Out of Memory 如何处理

在不修改网络结构的情况下, 有如下操作: 同意 @Jiaming , 尽可能使用inplace操作, 比如relu 可以使用 inplace=True 。一个简单的使用方法,如下: def inplace_relu(m): classname = m.__class__.__name__ if classname.find('ReLU') != -1: m.inplace=True #model.apply(inplace_relu)2.进一步,...

2020-05-19 17:09:13 7710

原创 利用Uncertainty修正Domain Adaptation中的伪标签

论文题目: Rectifying Pseudo Label Learning via Uncertainty Estimation for Domain Adaptive Semantic Segmentation论文地址: https://arxiv.org/pdf/2003.03773.pdf作者:Zhedong Zheng, Yi Yang代码: https://github.c...

2020-04-24 07:25:05 1738

原创 【新无人机数据集】从 行人重识别 到 无人机目标定位

论文题目:University-1652: A Multi-view Multi-source Benchmark for Drone-based Geo-localization论文地址:https://arxiv.org/abs/2002.12186代码地址:https://github.com/layumi/University1652-Baseline数据集下载:填写 Request...

2020-03-05 17:46:07 2775 2

原创 源代码来了 | 英伟达开源行人生成/重识别代码

前几天英伟达开源了DG-Net的源码。让我们来回顾一下这篇CVPR19 Oral的论文。论文是英伟达(NVIDIA), 悉尼科技大学(UTS), 澳大利亚国立大学(ANU)的研究人员 在CVPR19上口头报告的文章《 Joint Discriminative and Generative Learning for Person Re-identification》。 深度学习模型训练时往往需要...

2019-07-05 09:46:02 2322 4

原创 DukeMTMC 行人重识别最新排行榜

State-of-the-artIf you notice any result or the public code that has not been included in this table, please connect Zhedong Zheng without hesitation to add the method. You are welcomed!Priorities a...

2019-06-20 22:08:12 3275

原创 图文互搜:用CNN分100,000类图像和文本

[Title]:Dual-Path Convolutional Image-Text Embedding[arXiv]:http://cn.arxiv.org/abs/1711.05535[Code]:layumi/Image-Text-Embedding[Motivation]:在这篇文章中我们尝试了 用CNN分类113,287类图像(MSCOCO)。 实际上我们将每...

2019-06-09 09:29:43 959

原创 NVIDIA开源DG-Net:用GAN做“淘宝式”换衣,辅助行人重识别

今天要介绍的论文是NVIDIA,UTS,ANU在CVPR19上的Oral文章, Joint Discriminative and Generative Learning for Person Re-identification.本文生成了高质量的行人图像,将其与行人重识别模型融合,来达到高质量行人生成图像辅助行人重识别训练,提升行人重识别精度的目标。论文链接:https://arxiv.org...

2019-05-16 09:56:30 2812

原创 10分钟看完:悉尼科技大学入选 CVPR 2019 的 8 篇论文,都研究什么?

全球计算机视觉顶级会议 IEEE CVPR 2019 (Computer Vision and Pattern Recognition,即 IEEE 国际计算机视觉与模式识别会议) 即将于六月在美国长滩召开,本届大会总共录取来自全球论文 1300 篇。CVPR 作为计算机视觉领域级别最高的研究会议,其录取论文代表了计算机视觉领域在 2019 年最新和最高的科技水平以及未来发展潮流。CVPR 官网显...

2019-05-05 12:19:24 1218

转载 从零开始行人重识别 [中文版]

转自: https://zhuanlan.zhihu.com/p/50387521原文: layumi/Person_reID_baseline_pytorchgithub.com本练习是由悉尼科技大学郑哲东学长所写,探索了行人特征的基本学习方法。在这个实践中,我们将会学到如何一步一步搭建简单的行人重识别系统。欢迎任何建议。行人重识别可以看成为图像检索的问题。给定一张摄像头A拍摄到的查询图像...

2018-12-06 11:19:12 4551 6

原创 阅读小结:Deep Hashing Network for Efficient Similarity Retrieval

作者:Han Zhu, Mingsheng Long, Jianmin Wang and Yue Cao 论文地址:https://pdfs.semanticscholar.org/eb0c/64244dcf238a2cbf479ab2fdc9047fc80bc5.pdfWhat: 1.特征没有和量化一起优化,所以特征不一定兼容后续的量化操作。 量化损失也没有统计上的最小。2.提出了Deep

2017-12-23 12:13:04 2502

原创 行人再识别 + 行人对齐

文章链接:[1707.00408] Pedestrian Alignment Network for Large-scale Person Re-identification 代码链接:layumi/Pedestrian_Alignment1.Motivation 近年来,对行人再识别(person re-ID)问题的研究也越来越多了。类比于自然语言处理(nlp)的话,大家或者集中于语义层面的设

2017-11-16 20:40:14 5662 1

原创 阅读小结:A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection

arXiv: https://arxiv.org/pdf/1704.03414.pdfWhat:1. 目标是去增强  检测器对于遮挡和形变 的泛化能力 2. 但是数据集中一般   遮挡和形变 的图像较少  3. 所以作者提出了 adversary的方法去增加 训练难度4. 整个网络是 基于 Fast-RCNN 而不是 Faster-RCNNHow:

2017-06-16 20:35:53 1517

原创 阅读小结:Unsupervised Learning of Visual Representations using Videos

paper link: http://www.cv-foundation.org/openaccess/content_iccv_2015/html/Wang_Unsupervised_Learning_of_ICCV_2015_paper.html 发表于2015ICCVWhat: 1. 使用视频中的物体去训练网络。比如:可以作为一个pretrain的结果应用到其他分类任务上。 2. 没有使

2017-06-10 19:20:21 1621

翻译 Word2Vec教程(2)- Negative Sampling

原帖地址:http://mccormickml.com/2017/01/11/word2vec-tutorial-part-2-negative-sampling/在word2vec第二部分教程中(这里是第一部分part1) 我将会讨论一些在原有skip-gram 模型基础上 额外的小trick,使模型训练可行。当你读到skip-gram model 的时候,你可能会觉得它是一个很大的网络。(译者

2017-06-05 17:28:00 14154 1

翻译 Word2Vec教程 - Skip-Gram模型

翻译原始链接: http://mccormickml.com/2016/04/19/word2vec-tutorial-the-skip-gram-model/这个教程包含 训练word2vec的 skip-gram 模型。通过这个教程,我希望跳过常规Word2Vec 的介绍和抽象理解, 而是去讨论一些细节。特别是skip gram的网络结构。模型skipgram model 常常让人惊讶于它的简单

2017-06-05 14:10:35 15863 2

原创 行人重识别(行人再识别)数据集 DukeMTMC-reID

DukeMTMC-reID 下载地址:https://github.com/layumi/DukeMTMC-reID_evaluationTerms of UseYou will use the data only for non-commercial research and educational purposes. You will NOT distribute t...

2017-05-24 21:40:07 34605 11

原创 【开源代码合集】行人重识别

关于行人重识别综述,推荐一下liang zheng 2016年的综述: Past, Present and Future 写了从传统方法到深度学习,从图片到视频的行人重识别的方法。以下为一些公开的行人重识别代码链接:LOMO: Person Re-identification by Local Maximal Occurrence Representation and Metr

2017-02-19 08:01:56 16945 3

翻译 可视化神经网络的一些方法

原文为http://cs231n.github.io/understanding-cnn/   可视化CNN学到的东西有一些方法可以用来理解和可视化CNN, 作为对深度学习不可解释的论述的反击。1. 可视化激活值和第一层卷积的权重最直接的可视化方法就是展示在前向传播(forward pass)网络中的激活值(activation)对于带relu的网络,激活值的m

2016-12-21 18:11:16 2285

原创 阅读小结:The Unreasonable Effectiveness of Noisy Data for Fine-Grained Recognition

The Unreasonable Effectiveness of Noisy Data for Fine-Grained Recognitionpaper link: http://cn.arxiv.org/pdf/1511.06789.pdfWhat:同上一篇一样,这也是一篇关于细力度分类的paper。通过加数据来做fine grain(这是以前大家不太想的。因为f

2016-12-12 15:42:55 1729

原创 阅读小结:Fine-Grained Recognition with Automatic and Efficient Part Attention

这是一篇baidu research的paper。主题为细力度分类。这个问题在于找到一些关键的细节。比如在鸟类数据集CUB上,专家往往也是通过鸟的尾巴,或者头部来对鸟类分类的。What:预测细力度分类的CNN+MDP的网络。1. 融合了三个元素: 特征提取,attetion 和细力度分类。(之前paper是把attetion part额外切割出来的。比如鸟的头部专门trai

2016-12-11 17:12:56 1599 2

原创 【行人重识别】A Discriminatively Learned CNN Embedding for Person Re-identification

A Discriminatively Learned CNN Embedding for Person Re-identification 这篇paper主要提出的是一种 行人重识别 的方法。1. verification label 为0,1二值。如果输入的两张图片为同一人,则为1,否则为0。显然,这个label较弱,由于它没有利用上整的数据集的标注信息(每次只考虑了两个或三个样本之间label的关系,如contrastive loss 和 triplet loss)。

2016-12-11 00:07:57 6539 4

原创 阅读A Discriminative Feature Learning Approach for Deep Face Recognition

What:对于分类任务来说,最后预测的是一个联合概率。打个比方:[1,0,0,1],[0,1,1,0]我可以预测为同一类。只要用[1,0,1,0]的filter。卷积和都是1,没毛病。但是我们发现一个问题。这两个虽然是同一类,但是特征完全不同。也就是说,如果我们拿CNN中间的特征出来,也可能发现这种乌龙事件。虽然分类效果很好,但是中间层的特征并不是按我们预想的那样分布的。为了解决这个问题,常见的方案是 contrastive loss 和 triplet loss。作者则提出了一个center

2016-11-21 20:52:11 2310 3

原创 阅读小结:Google's Neural Machine Translation System

自然语言处理中很多思想对cv也有用,所以决定看这篇paper。然后我会从几篇前置的paper看起。讲CharCNN的文章: https://zhuanlan.zhihu.com/p/21242454讲为什么Char好的文章:http://colinmorris.github.io/blog/1b-words-char-embeddings (有一些聚类的例子)1

2016-10-01 18:18:01 2480

原创 阅读小结:Large-Margin Softmax Loss for Convolutional Neural Networks

徐博最近一直在看我博客,肯定是想看我什么时候不更新,然后好嘲笑我。当然,不排除徐博已经爱上我的可能。What:改进SoftmaxLoss,显式的控制类内的距离,(不让 已经对的样本score太高,影响训练)可以防止过拟合。回顾SoftmaxLoss:1. Softmax 就是一个把一个向量归一的函数,输出也是向量。在matlab里就3行代码:% X

2016-09-26 21:30:26 2260 2

原创 周志华《机器学习》 读后感

书还是比较厚的,我会挑感兴趣的章节先更新。以写小结和感想为主。(我也是机器学习入门,所以小结以感性理解为主。)第四章 决策树 ☑️---------第四章 决策树 -----------What决策树 首先是一棵树 利用贪心法 每个中间节点 按照学习到的原则分隔 几波数据,(就是分叉几个子节点)。所以对于分类问题而言,数据从根节点进入,最后掉到的叶结点是哪个

2016-09-16 20:03:55 6329 1

原创 《造梦者》观后感

最近因为签证的事情待在家里,paper也在准备。可就是没心思写paper,查related work、introduction讲故事 啥的 真的对一个不说英语的人来说很烦啊。实验上还没有尽善尽美,所以心里很郁闷。看了造梦者,然后发现马云爸爸果然是高瞻远瞩。同时也是吃了好多苦。也许他们的成功很难想象,但失败的景象却很容易想象(公司破产,员工讨债)。但他们毕竟没有失败,作为

2016-09-15 10:08:49 12077

原创 设计心理学1_日常的设计 读后感

书很厚,我会一点点update,以感想和摘录书中。《设计心理学1_日常的设计》 唐纳德.A.诺曼 著----------------第一章 日用品心理学----------------一开篇作者就通过玻璃门案例 和壶把/茶嘴同一侧的茶壶设计  指出:好的设计有两个重要特征:可视性(discoverability)及 易通性(understanding)可视性:所

2016-09-11 20:53:35 6937

原创 阅读小结:InfoGAN:Interpretable Representation Learning by Information Maximising Generative Adversarial

之前GAN中都没有加入分类信息,都是耍流氓啊。用原始maxD的时候,G学到的容易收敛到一个固定图像。而用feature matching的话,相同向量可能每次match的都不同,这怎么regression啊,摔  (也可能我是用姿势不对,但有多类的feature matching不靠谱啊)What:1.通常GAN把一个随机噪声向量z生成为一张图像。z可能从一个 0到1的随机采样

2016-09-08 19:56:11 5127 7

原创 阅读小结:Stacked Hourglass Networks for Human Pose Estimation

arXiv: https://arxiv.org/pdf/1603.06937v2.pdfgithub: https://github.com/anewell/pose-hg-trainWhat:人体关键点预测,输入人体图像输出几个关键点。使用了反复迭代bottom down/  top down 这个策略在人脸landmark 甚至更早像ASM就有,反复迭代来更精

2016-09-07 14:34:53 8304 5

原创 阅读小结:Improved Techniques for training GANS

github地址:https://github.com/openai/improved-gan/What:提出了对于GANs新的结构和训练过程。主要focus在两个应用:半监督学习 和  更好的图像产生。对于G,不要求一个和test data和像的模型,也不要求不使用label。实验中,D在半监督分类任务上达到了state-of-art的结果。G在MNIST样本人已经无

2016-09-02 13:40:27 9271 10

原创 阅读小结:Unsupervised Representation with Deep Convolutional Generative Adversarial Networks

WhatCNN应用于无监督学习。将这种CNN称为DCGANs1.提出和评估了DCGANs 有一些结构上的限制,让他可以stable的去训练。2.利用图像分类任务训练的discriminator,证明了他们有无监督学习的潜力。(这是迁移学习?)证明了他们的adversarial pair学习到了一个  hierarchy of representations  从物体的部分到整个场景

2016-08-27 22:38:32 2812 2

ZhedongZheng_图文双向检索_图文互搜.pdf

TOMM2020 Dual-Path Convolutional Image-Text Embedding Zhedong Zheng

2020-12-30

ACM-MM-Talk 无人机演讲.pdf

University-1652: A Multi-view Multi-source Benchmark for Drone-based Geo-localization 发表于 ACM Multimedia 2020

2020-12-30

2021年 行人重识别最新——综述.pdf

2021年 行人重识别 最新综述 郑哲东 郑良

2020-12-30

2019行人再识别 年度回顾 VALSE

行人重识别 行人再识别 行人检索 郑良 郑哲东 钟准 孙奕帆 杨易 悉尼科技大学 龚绍刚 郑伟诗 李玺 浙江大学 中山大学

2019-04-21

行人再识别Deep-reID_郑哲东

行人再识别方法分类和梳理。分为了采用了多任务学习,以及部件匹配来分别论述。 每个方法都列出了paper的名字和代码的链接。

2017-11-16

行人重识别

行人重识别ppt,配合 基于行人重识别的深度嵌入鉴别特征学习

2017-06-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除