自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 目标跟踪算法

1、深度学习-单目标-孪生网络方向siamfcsiamrpndasiamrpndeeper and wider siamrpnsiamrpn++atomcascaded siamprncoarse-to-fine siamrpnSiamMaskDimPTarget-Aware Deep Tracking2、多目标跟踪sort、deepsort https://git...

2019-11-24 14:45:23 465

原创 中国计算机学会推荐国际学术会议和期刊(A类)2019年

中国计算机学会推荐国际学术会议(人工智能)一、A 类序号会议简称会议全称出版社网址1 AAAIAAAI Conference on ArtificialIntelligenceAAAI http://dblp.uni-trier.de/db/conf/aaai/2 NeurIPSAnnual Conference on NeuralInformation P...

2019-04-28 14:43:17 5763

原创 【论文学习总结】FOTS: Fast Oriented Text Spotting with a Unified Network

参考:https://arxiv.org/pdf/1801.01671.pdfhttps://blog.csdn.net/yang_daxia/article/details/88047035https://blog.csdn.net/zhangwl27/article/details/86544941https://blog.csdn.net/qq_14845119/articl...

2019-04-14 11:18:17 2373 4

原创 【论文学习总结】Shape Robust Text Detection with Progressive Scale Expansion Network

推荐学习理由:旷世18年6月提出的PSENET,论文被CVPR2019接收。整体上沿用主流的像素的语义分割的方法,提出利用不同尺寸的shrinking产生文本“核”再用渐进的尺度扩展算法来有效区分相邻文本。作者在19年3月重新发布论文,并正式开源了代码。在FMeasure指标上,ICDAR2015获得了87.21(resnet152),在ICDAR2017 MLT获得了72.45(resnet15...

2019-04-06 22:43:26 1163

原创 【学习总结】Pixel-Anchor: A Fast Oriented Scene Text Detector with Combined Networks

推荐学习理由:2018年11月云从科技提出的Pixel-Anchor,结合anchor-based和pixel-based的检测方法的特性,取长补短,并解决了长文本的检测,在FMeasure上,ICDAR2015获得了87.68,在ICDAR2017 MLT获得了74.54。参考:https://arxiv.org/abs/1811.07432https://blog.csdn.net...

2019-03-30 17:16:22 1698 3

原创 【学习总结】EAST: An Efficient and Accurate Scene Text Detector

EAST: An Efficient and Accurate Scene Text Detector参考:https://arxiv.org/abs/1704.03155https://blog.csdn.net/liuxiaoheng1992/article/details/82870923https://blog.csdn.net/sdlypyzq/article/de...

2019-03-23 15:16:57 322

翻译 【论文翻译】Scene Text Detection and Recognition: The Deep Learning Era(上)

摘要-随着深度学习的兴起和发展,计算机视觉得到了极大的改变和重塑。作为计算机视觉领域的一个重要研究领域,场景文本的检测和识别已经不可避免地受到这股革命浪潮的影响,从而进入了深度学习的时代。近年来,这方面的社区在思维、方法和效果上取得了重大进展。本次调研旨在总结和分析深度学习时代场景文本检测与识别的重大变化和重大进展。通过本文,我们致力于:(1)介绍新的见解和想法;(2)突出最近的技术和基准;...

2019-03-20 21:11:54 4007 1

原创 【论文翻译】Learning Generalizable and Identity-Discriminative Representations for Face Anti-Spoofing

Abstract 由于人脸认证系统的高安全性需求,面部反欺骗(a.k.a演示攻击检测)已引起越来越多的关注。当训练和测试欺骗样本拥有相似的模式时,现有的基于CNN的方法通常很好地识别欺骗攻击,但它们的性能会在未知场景的测试欺骗攻击上急剧下降。在本文中,我们试图通过设计两个新颖性的CNN模型来提高方法的泛化能力和适用性。首先,我们针对CNN模型提出了一种简单但有效的总成对混淆(TPC)损失函数,...

2019-03-03 15:51:28 2923 1

原创 ImageProjectiveTransform 错误解决办法

 tf.train.import_meta_graph  报错Traceback (most recent call last): File "freeze_graph.py", line 109, in <module> main(parse_arguments(sys.argv[1:])) File "freeze_graph.py", line 50, ...

2019-01-06 14:45:54 1302

原创 人工智能资料汇总记录

顶会 世界顶级人工智能会议的总结https://blog.csdn.net/u011447369/article/details/70172048 综述 文本识别白翔2018  https://cloud.tencent.com/developer/article/1154619Awesome-Scene-Text-Recognition  https://gi...

2018-07-28 13:07:12 281

原创 tensorflow中3种常用图片数据的训练方式及性能分析

摘要:本文对比了:原图、tobytes、gfile三种方式的图片数据的训练文件大小、训练时长、GPU利用率等指标,通过实际数据分析这3种训练方式的优缺点;明确指出gfile训练方式具有最佳的空间占用和GPU利用率;行文中强调了初学者容易犯错的tf.decode_raw 、 tf.image.decode_jpeg、tf.image.convert_image_dtype、tf.image.resize_images函数的使用方法;旨在减少大家在相关问题上为此付出的检索时间 目录1、引入

2018-07-21 00:09:19 4668 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除