Walter Wu-CSDN博客

原创中文OCR识别

在闲暇时刻做了一个中文识别能力的工程，工程主要对中文文字进行识别，当前工程没有检测文本能力，后续会加入。文本字段在32000验证集合上准确率为83.2%. 可识别中文字符5990。由于没有时间做太多优化，可能对于相近字体的准确率并不太高。但是可以作为一个OCR识别的体验代码。其中模型网盘下载链接也在仓库中。算法支持最大为16的字符识别。

2023-05-16 17:34:19 220

原创车牌识别yolov6+crnn

本文是在github开源的yolov6+crnn的车牌识别算法

2023-03-10 18:40:31 618 1

原创从谷歌和百度根据关键词批量下载图像

从谷歌和百度根据关键词批量下载图像

2022-06-10 14:26:47 284

原创 RuntimeError: version_ ＜= kMaxSupportedFileFormatVersion INTERNAL ASSERT FAILED pytorch加载模型错误

pytorch的模型是在高版本中训练存储的，直接使用低版本的pytorch加载就会出现这种错误。但是低版本训练高版本存储则不会出现这种问题。

2021-12-15 16:20:24 3793

原创 YoloF you only look one level feature 详解

YOLOF摘要文中讨论FPN成功在于分而治之而不是特征融合。文中从另一个角度解决这个问题，只使用一层的特征信息。文中有两个主要因素扩张encoder、统一匹配。且608x608的图片在2080TI能够达到60fps。为什么要去FPN, 因为造成显存冗余、检测器复杂、以及降低推理速度。对比flops（浮点运算数量）FPN有134G 和一维特征6G. 显存冗余明显。推理速度为13FPS和34FPS对比。但是一维特征会导致精度低，研究发现精度低的原因在于最后一层输出尺度小、以及单层anchor

2021-03-26 09:48:04 342

原创 v2.error: OpenCV(4.4.0) C:\Users\appveyor\AppData\Local\Temp\1\pip-req-build-nxx381if\opencv\modules

这类错误导致的原因出现再cv2.bitewise_and(img, mask) (1) img 和 mask的shape不一致。（2)img和mask的dtype不一致。将两者改为一直即可解决

2021-03-02 15:09:05 4385 1

原创 TypeError: function takes exactly 5 arguments (1 given) 使用dataloader 时报错

这主要出现在docker使用中出现这类错误，解决办法就是将Num_wokers=0 就可以正常运行了。具体为什么会出现这类问题，不太清楚。

2021-02-22 20:38:09 4032 1

原创 ImportError: libGL.so.1: cannot open shared object file: No such file or directory cv2报错

使用opencv的时候原来可以正常使用的环境，忽然间就开始报错。解决方案将原来下载的opencv卸载然后pip install opencv-python-headlesspip install opencv-contrib-python-headless即可

2020-10-29 15:28:56 1777 3

原创使用pytorch的时候出现 segmentation fault(core dumped) ubuntu

再开发的时候遇到这一种情况，这种情况有可能是gpu 或者cpu 可用率不足导致的。

2020-10-15 14:33:28 1517

原创 cannot identify image file %r

这个bug主要是因为pillow 读取图像的时候产生的。解决办法升级pillow版本即可

2020-09-15 09:43:55 1325

原创 conda 整体或conda环境复制到另一个目录，使用时出现 bad interpreter 解释器错误不存在这个路径

造成这个问题的原因有大概两类（1）首先看一下是否定义了环境变量 echo $PATH 如果出现所需路径则是定义了环境变量。如果不存在需要在 ~/.bashrc中进行添加。（2）是pip conda 或者pip3 配置出现问题 vi **/anaconda3/bin/pip vi **/anaconda3/bin/conda 查看这两个文件第一句话，中对应路径是否正确，如果不正确改成正确路径。 ...

2020-08-18 11:50:03 1906 1

原创 center net 详解（检测篇）

Center net 详解由于最近换工作，很久没有开始写博客了，今天难得有空开始写进三个月来第一个博客。这篇论文主要讲解关于检测的一篇anchor free的经典论文center net。本文主要分成三个部分进行讲解第一个部分为模型大体结构。第二个部分为重要组件第三个部分为loss 详解模型结构模型的结构主主体为decode 和 encode两个部分，总体下采样倍数为4.文中介绍的网路结构有三种Resnet-18 + up conv layers D...

2020-08-07 19:12:40 4369

原创 See Better Before Looking Closer: Weakly Supervised Data Augmentation Network for Fine-Grained Visu

See Better Before Looking Closer: Weakly Supervised Data Augmentation Network for Fine-Grained Visual Classification一篇基于attention 机制的细粒度分类模型细粒度是粗粒度的延深，类间差距小，类内差距大。早期的研究中主要使用较多的人工标注来认为的定位attent...

2020-04-13 19:03:33 2218

原创 keras.utils.vis_utils import plot_model 报错

第一种错误可能你没有下载pydotpip install pydot第二种：FileNotFoundError: [Errno 2] "dot" notfound in path.这里需要进行的操作是apt-get install graphviz

2020-04-10 12:58:14 1190

原创 vscode a.html:1 SyntaxError: Unexpected token

我是在vscode中写“html”代码运行的时候出现这个问题。主要原因是我运行的时候点击了三角符号运行的。“html” 文件运行应该使用 open in browser而不是三角符号。同时给出一个vscode可以自动保存修改的链接https://www.cnblogs.com/wangyang0210/p/10854998.html...

2020-04-08 10:18:27 1302

原创 overleaf to arxiv

推荐一篇非常好的文章https://hua-ys.github.io/2019/07/17/overleaf-arxiv/

2020-03-24 18:06:18 694

转载泊松融合

原文地址：http://blog.csdn.net/hjimce/article/details/45716603作者：hjimce本篇博文主要讲解2004年Siggraph的经典paper：《Poisson Image Editing》，在图像融合领域，融合效果最牛逼的paper。讲这个算法，我没打算讲太多理论的公式，理论的东西，对于大部分数学比较差的人来说看了就头晕。什么散度、拉普拉斯...

2020-03-23 11:01:16 2377

原创 qcloud_cos 的安装问题

目前来说qcloud_cos，只支持python2.x 版本。如果是python3版本。可能不太好安装, python2 安装直接pip install 就好了。

2020-03-20 10:32:43 3430 2

原创 What Is the Best Practice for CNNs Applied to Visual Instance Retrieval?

What Is the Best Practice for CNNs Applied to Visual Instance Retrieval?文中主要介绍了一个新的多尺度的图像特征表达。其中这类推荐方法，比目前已有的方法更好。文中主要有三个贡献文中使用，五个元素来学习基于CNN的图像表达，并且使用试验证明这些的影响，并且给出这些要素的组合建议。通过组合这些东西，我们能够获得新...

2020-03-11 17:02:13 209

原创 TWO-STREAM MULTI-TASK NETWORK FOR FASHION RECOGNITION

TWO-STREAM MULTI-TASK NETWORK FOR FASHION RECOGNITION摘要本文主要使用神经网络解决衣服多任务问题，包括关键点检测，类别分类以及属性分类问题。总体来说本文是解决的一个多任务问题。简介本文将衣服时尚推荐问题转化成了多任务分类问题。多任务分类问题，能够在任务之间相互促进，从而提升模型的单任务性能，文中使用的网络是双流网络，既能...

2020-03-11 17:01:35 218

原创 Strong Baseline and Batch Normalization Neck for Deep Person Re-identification

Strong Baseline and Batch Normalization Neck for Deep Person Re-identification 文中主要提出了一种BNNeck的网络。与以前ICCV以及CVPR的一些文章存在或多或少的问题，其在公开数据集合中跑出的结果并不好，market-1501上能达到rank-1 90%的只有两个，DukeMTMC...

2020-03-11 12:02:14 414

原创 Selective Deep Convolutional Features for Image Retrieval

Selective Deep Convolutional Features for Image Retrieval文中提出使用不同的mask进行，去除冗余信息，获得较为精准具有判别性的向量特征，为中使用的mask包含，SIFT-mask, SUM-mask，MAX-mask。分别通过SIFT以及MAX，SUM pooling来做的。并且在选择的局部卷积上使用embedding以及a...

2020-03-11 12:01:17 140

原创 Selective Deep Convolutional Features for Image Retrieval

Selective Deep Convolutional Features for Image Retrieval文中提出使用不同的mask进行，去除冗余信息，获得较为精准具有判别性的向量特征，为中使用的mask包含，SIFT-mask, SUM-mask，MAX-mask。分别通过SIFT以及MAX，SUM pooling来做的。并且在选择的局部卷积上使用embedding以及a...

2020-03-11 11:59:45 182

原创 Regional Attention Based Deep Feature for Image Retrieval

Regional Attention Based Deep Feature for Image Retrieval基于给attend 区域打分权重的一种方法。文中贡献：（ 1）使用上下文以及R-MAC区域attention 模型。根据图像的上下文给出区域的权重分数。模型结构首先给出了一种可以抑制背景以及非重要区域的，然后根据上下文给出attention的方法。...

2020-03-11 11:58:22 496

原创 MultiGrain: a unified image embedding for classes and instances

MultiGrain: a unified image embedding for classes and instances摘要文中主要介绍一种叫做multiGrain的方法，这种方法可以同时对图片进行分类和检测。数据的标签只依赖于类别标签，训练也是相对简单，最小化交叉熵Loss以及ranking Loss，用来判定两张图片是否可区分的。这个模型是根据普通的分类模型构建的，它...

2020-03-11 11:57:24 281

原创 MultiGrain: a unified image embedding for classes and instances

MultiGrain: a unified image embedding for classes and instances摘要文中主要介绍一种叫做multiGrain的方法，这种方法可以同时对图片进行分类和检测。数据的标签只依赖于类别标签，训练也是相对简单，最小化交叉熵Loss以及ranking Loss，用来判定两张图片是否可区分的。这个模型是根据普通的分类模型构建的，它...

2020-03-10 19:50:39 695

原创 In Defense of the Triplet Loss for Person Re-Identification

In Defense of the Triplet Loss for Person Re-IdentificationGit地址： https:// github.com/VisualComputingInstitute/triplet-reid 框架 theano摘要一般来说，在训练基于度量的网络的时候，使用的triple Loss要优先于其他，随着数据集合Marke...

2020-03-10 19:48:23 451

原创人脸变老算法

人脸变老算法人脸变老算法在博客中主要使用图层的方法实现的。在分图层以及图片处理的过程中使用的方法较为粗糙。还有很多需要改进的地方先上原图变老后的图博客使用python 实现的所有的代码都放到了github上面。转载需带有本博客地址。手打不易，如果感觉还不错请在github上给项目打星谢谢。 Github地址： https://github.com/10...

2020-03-07 18:32:00 2475

原创面部五官迁移算法（Python）

面部器官互换指的是，将一个人的面部器官换到另一个人的脸上。比如将A的眼睛换到B的眼睛上。算法的实现技术要点为：关键点检测、人脸对齐、mask制作、色差矫正、mask融合。关键点检测，是使用的dlib81个关键点模型。人脸对齐是基于放射变换做的。Mask制作是根据opencv中封装好的凸包函数做的。其他技术比较简单实现都放在源码中了。（文章结尾给出源码的地址）面部器官...

2020-03-07 16:39:50 2420

原创美颜算法 ---磨皮、美白、眼部提亮（Python）

美颜特效博客使用python 实现的所有的代码都放到了github上面。转载需带有本博客地址。手打不易，如果感觉还不错请在github上给项目打星谢谢。 Github地址： https://github.com/1006927966/magic_face （有时候博客更新块代码更新慢请谅解）博客中美颜效果，实现了三类，磨皮、美白、眼睛变亮（之后有时间会继续添加更...

2020-03-07 15:06:15 6927 3

原创特效滤镜 Python 实现

特效滤镜博客使用python 实现的所有的代码都放到了github上面。转载需带有本博客地址。手打不易，如果感觉还不错请在github上给项目打星谢谢。 Github地址： https://github.com/1006927966/magic_face （有时候博客更新块代码更新慢请谅解）滤镜；主要是用来实现图像的各种特殊效果，滤镜的操作是非常简单的，但是真正用起...

2020-03-07 11:12:47 1036 1

原创 Learning a Discriminative Filter Bank within a CNN for Fine-grained Recognition

Learning a Discriminative Filter Bank within a CNN for Fine-grained Recognition文中有三个分支最左边，是vgg16的整个网络，当中的经过1*1得到， c使用cross-channelpooling 得到一个loss函数。中间层为进过1*1卷积过后，大小是kM*h*w...

2020-03-06 10:47:13 233

原创 FaceNet

FaceNet摘要本文主要介绍一种叫FaceNet的方法，用于将人脸从图片映射到一个欧式空间中，可以通过向量的欧式距离来确定人脸相似度。文中方法使用深度卷积网络，训练过程中直接优化embedding，而不是调整bottleneck层。文中使用了triple Loss，选取一个正样本一个负样本一个目标样本。网络使得识别精度在某些数据集合中能够达到99.6%文中也介绍了谐...

2020-03-06 10:45:32 394

原创 Deep Image Retrieval: Learning global representations for image search

Deep Image Retrieval: Learning global representations for image search文中贡献学习特征权重，构建区域特征。 2. 使用区域推荐网络，学习哪个区域需要细化形成池化构建成全局表达文中使用三流孪生网络，优化R-MAC向量权重。通过使用triplet ranking loss。第二个贡献是学习R-MAC poolin...

2020-03-06 10:44:07 704

原创 Context-Aware Visual Compatibility Prediction

Context-Aware Visual Compatibility Prediction本文主要解决，根据两种衣服的上下文来判定两种衣服是否适配的问题，和以前网络不同的是，文中所用的网络为图网络（一般输入数据满足图结构的网络成为图网络）。例如左边的是以往模型的风格匹配，右边的是本文中图结构的风格匹配。网络结构最初使用的方法是，直接使用卷积抽取嵌入向量进行举例...

2020-03-06 10:42:36 482

原创 Batch DropBlock Network for Person Re-identification and Beyond

Batch DropBlock Network for Person Re-identification and Beyond摘要重识别问题的难点主要在于姿态的多变，随机遮挡等会降低模型的精度，本文提出了一个BDB的网络，主要有两个分支，一个是主分支是resnet50网络，另一个是drop分支。Drop分支主要是为了抽取局部关注点信息，随机的去除batch中输入featu...

2020-03-06 10:39:53 423

原创分类的tricks

Bag of Tricks for Image Classification with Convolutional Neural Networks摘要本文主要介绍了一些常用的分类trick，并且使用这些trick联合起来能够提升卷积网络的验证准确率，这些trick的使用不仅仅限制在分类任务中，它在分割和检测任务中同样有效。简介随着深度网络的发展，ima...

2020-03-06 10:37:31 436

原创检索的通用tricks

A Benchmark on Tricks for Large-scale Image Retrieval摘要文中主要介绍，一些预处理和post-处理的一些trick，在不改变网络结构或者度量的前提下，单独使用这些trick或者综合使用这些trick，能够较好的提升大规模图像检索的表现。简介目前应用在图像检索中的，度量技术受到很多关注，很...

2020-03-06 10:36:15 573

原创 Class-Weighted Convolutional Features for Visual Instance Search

Class-Weighted Convolutional Features for Visual Instance Search 文中的主要内容是，从feature map中根据图像目标找到典型激活区域。这种方式是基于CAMs的方式。在re-ranking阶段使用acms形成region proposal。使用CAMS 形成语义权重，来进行全集层的特征抽取。...

2020-03-06 10:33:52 256

原创细粒度分类中双线性卷积

细粒度分类中双线性卷积摘要本文使用了两个CNN提取特征的池化输出来代表图像，并且在一定规则下定位特征交互。但是在工作中发现，双CNN提取的特征有些冗余，可以在精度不下降的前提下减少某些特征，双CNN在其他的分类任务中也是有效的，比如纹理和场景识别。现存的深度纹理表达有一些缺点，本文的关键方式是纹理表达可以可以写成两种适用网络设计特征的池化输出，网络的结构主要是两个CNN网络提取特征并连...

2020-03-06 10:25:03 1322

空空如也

空空如也