自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Never let it go.

记录成长的每一个心得

  • 博客(61)
  • 收藏
  • 关注

原创 【无标题】

目标检测文章一般都是用COCO测试集去评估,并且这些文章一般是检测和分类结果一起出的,指标只有mAP。mAP 其实就有综合评估目标检测和分类的作用,只不过在评估分类的时候没有那么专用和准确(比如只看max的结果,而不看置信度更高或更低(方差))来自https://blog.csdn.net/pangxing6491/article/details/125297384。来自https://zhuanlan.zhihu.com/p/564855770。yolov3,v5目标检测的置信度定义,测试流程。

2024-03-13 14:34:31 214 1

原创 视频理解(大规模网络数据和弱监督学习)-基本问题和经典方法

本文为视频理解通用视觉框架OpenMMLab系列课程 第八讲 视频理解(弱监督学习)的记录。

2021-07-29 01:40:05 286 1

原创 视频理解(基于3D卷积的方法(主要是视频分类/动作识别))-基本问题和经典方法

本文为视频理解通用视觉框架OpenMMLab系列课程 第八讲 视频理解(3D卷积方法)的记录。更高效的3D卷积网络:第一种:2D卷积和3D卷积混合使用。第二种:把3D卷积分解成空间、时间维度。第三种:减少3D卷积的输入/输出通道数。...

2021-07-29 01:03:10 2389

原创 视频理解(基于光流和2D卷积的动作识别方法)-基本问题和经典方法

本文为视频理解通用视觉框架OpenMMLab系列课程 第八讲 视频理解(光流和2D卷积方法)的记录。目前最著名的非深度学习光流估计法:① Dense Trajectories:首先计算轨迹特征(30维),再计算局部特征(426维),然后拼接起来,得到轨迹① iDT(improved Dense Trajectories):目前经典的深度学习光流估计法:...

2021-07-28 23:43:45 896

原创 视频理解-(应用、主要任务、主要挑战)-介绍

本文为视频理解通用视觉框架OpenMMLab系列课程 第八讲 视频理解的记录。当下短视频日渐流行,各视频平台每日上传视频量暴增。那么如何对这些视频进行一些应用或处理呢?视频的一些智能应用场景:视频理解的基本任务:视频理解现存的3个挑战/重点问题:挑战①:解决挑战1的两种思路:挑战②:挑战③:...

2021-07-28 19:02:25 3763

原创 图像修复-基本问题和经典方法

本文为通用视觉框架OpenMMLab系列课程 第七讲 底层视觉(下)-图像修复的记录。加入GAN损失之后,细节会逼真和清晰一点。补充:部分卷积 Partial Convolutional(PConv)部分卷积将卷积分为了输入图片的卷积和输入掩码mask的卷积。之前的论文都是只在第一层使用mask,mask也不会得到跟新,本文的partial convolutions,每次都使用跟新后的mask,随着网络层数的增加,mask输出m’中为0的像素越来越少,输出的结果x’中.

2021-07-26 15:46:37 3554 1

原创 图像转译-基本问题和经典方法

本文为通用视觉框架OpenMMLab系列课程 第七讲 底层视觉(下)-图像转译的记录。解决方法(Pix2Pix、cycleGAN):加入条件判断① (生成器无论生成什么,不管像不像,判别器都应判为0)加入条件判断② (生成器无论生成什么,判别器都应判为0)加入条件判断③ (生成器无论生成什么,不管像不像,判别器都应判为0)cycleGAN包含两个生成器,两个判别器,从而构成循环一致性的判别和生成。除了cycleGAN,还有其他许多针对“非成对数据集”的“风.

2021-07-26 14:39:11 471

原创 图像配准/对齐的一些方法

非下采样轮廓波变换Nonsubsampled Contourlet变换(NSCT) 可以作为一种手段。单应性矩阵多尺度特征 + 可变形卷积伪影抑制注意力机制(多曝光融合任务中)

2021-03-19 19:58:50 1123

原创 多曝光图像融合

非深度学习方法:参考Galaxies99开发的基于对齐方法的HDR合成方法工具包AlignHDRToolkit。(可以主要地)参考使用 OpenCV 进行高动态范围(HDR)成像都是主要分为以下3个步骤:1. 对齐方法我们在中提供了以下对齐方法对齐.py,您可以自由选择要使用的方法。MTB(AlignMTB(**kwargs)):MTB alignment method,是OpenCV的内置方法;**kwargs是cv2.createAlignMTB()的参数。参考Median Threso

2021-03-07 16:03:21 2966 1

原创 收藏的机器学习算法好文。。

GBDT原理及代码终于有人说清楚了–XGBoost算法SVM初级通俗易懂–SVM算法讲解(算法+案例)SVM深入(直接看这个吧。。)支持向量机通俗导论(理解SVM的三层境界)

2020-11-22 22:13:52 125

原创 残差网络原理理解

额,,,,我是直接看百度百科的,个人觉得这个就很好理解,尤其是下面的5.1~5.2的例子。(这个文章确实可能比较简单,主要是给自己看的哈~所以没有自己写~)

2020-09-10 14:16:48 385

原创 牛客搜集到的大华面经(智能算法岗)

额。。。其实是为明天面试大华做准备的,截了好多图,整理放一起,另外要是春招还可以看哈哈

2020-08-15 00:53:19 1049

原创 caffe另一些学习网址(统一收集一下到CSDN)

Caffe学习系列总目录.caffe的python接口学习(4):mnist实例—手写数字识别.caffe的python接口学习(6):用训练好的模型(caffemodel)来分类新的图片.Caffe学习系列(12):训练和测试自己的图片.什么是caffe?....

2020-08-15 00:27:00 101

原创 Building wheel for pybm3d (setup.py) ... error

在ubuntu安装 pybm3d时(pip install pybm3d),遇到【Building wheel for pybm3d (setup.py) … error】,满屏的红色ERROR…不要慌,冷静下来,仔细看错在哪…原来是说 没有libjpeg.h ,然后去源码编译安装libjpeg即可(我参考的教程被我关闭了,反正网上教程挺多的,自己找一下吧~~)安完libjpeg再装pybm3...

2019-06-03 19:37:28 10817 1

原创 Ubuntu / Windows下安装Libtiff库

(1)下载tiff库文件http://libtiff.maptools.org/dl/windows系统可下zip,ubuntu可下tar.gz(2)编译与安装 tiff库先解压,然后按说明(http://www.libtiff.org/build.html#PC)需要使用命令行:ubuntu:cd tiff-v3.4beta099./configuremakemake inst...

2019-06-03 19:09:20 8674 1

转载 Ubuntu访问Win10文件变为【只读文件系统】

之前双系统都用的好好的,突然某一天进入ubuntu的pycharm写代码发现竟然被提示文件是只读状态无法保存,chmod 777也没用…由https://blog.csdn.net/wr891993651/article/details/79685088获得正解:在window关闭时应该用重启进入ubuntu,而不是通过关机后进入ubuntu。重启进入的话,grub引导模式才会将系统权限交给u...

2019-05-22 10:33:10 1757

转载 安装VMAF+ffmpeg笔记

要使用VMAF视频评价,就要先安装VMAF,再安装ffmpeg, 二者缺一不可!!自己安装了大半天的ffmpeg,发现还是用不了VMAF;又去源码方式安装VMAF,结果发现还要安装一堆的依赖包,醉了…于是记录一下正确安装过程(笔者的电脑上可以正确安装,其他可能因人而异)一 安装vmaf更新pip (不然下面容易出错的)sudo -H pip install --upgrade pip安...

2019-05-19 16:44:10 6870 1

转载 线性时不变系统

《信号与系统学习笔记》—线性时不变系统(一)《信号与系统学习笔记》—线性时不变系统(二)线性时不变系统(LTI)对复指数信号的响应(数字信号处理的特征值与特征函数)线性时不变系统(LIT )...

2019-04-18 21:53:58 3623

原创 为什么L0正则化是一个NP难解问题?

1. 矩阵的L0范数矩阵的L0范数就是非0元素的个数,通常用它来表示稀疏,L0范数越小0元素越多,也就越稀疏。例如 A=[-1, 2, -3; 4, -6, 6]的L0范数就是:6。2. 为什么L0可以用来计算非0的个数?当p 趋近于0的时候,这个函数就只有在x= 0的时候 等于0,其他的位置都为1! 也就是说,L0-Norm可以用于表达一个向量/矩阵的稀疏性!3. 求解L0-norm...

2019-04-16 16:17:27 4516

原创 图像去模糊——暗通道

最近在研究图像去模糊方法的传统方法(非深度学习方法),以下记录一下何凯明大神的暗通道方法。论文链接:Single Image Haze Removal Using Dark Channel Prior_CVPR_2009另外我看的是博客:暗通道优先的图像去雾算法(上)以及暗通道优先的图像去雾算法(下)来学习该方法的。由于时间问题,我只是在稿纸上记录了以下自己的心得和算法过程,太粗糙了,大...

2019-04-13 19:54:25 3964 1

转载 时域,空域,频域的基本概念

基本概念:时域:时间域频域:频率域空域:空间域好像和没说一样,详解如下:1,空间域:空间域(spatial domain)也叫空域,即所说的像素域,在空域的处理就是在像素级的处理,如在像素级的图像叠加。通过傅立叶变换后,得到的是图像的频谱。表示图像的能量梯度。2,频率域:频率域(frequency domain。)任何一个波形都可以分解成多个正弦波之和。每个正弦波都有自己的频率和...

2019-04-12 17:22:25 9198

原创 Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring(2017CVPR) 阅读笔记

Deep Multi-scale Convolutional Neural Network for Dynamic SceneDeblurring 深度多因子卷积神经网络应用于动态场景去模糊 。其实就是【CNN用于运动图像去模糊】原文链接:https://arxiv.org/pdf/1612.02177.pdf作者发布的用于运动去模糊的训练数据集 GOPROdataset(现已经成为基于...

2019-04-12 16:41:46 1431 1

原创 A Comparative Study for Single Image Blind Deblurring(CVPR2016)阅读笔记

两个缺点当下的【单张图形去模糊算法评价方法】通常有以下两个缺点:首先,合成生成的模糊图像经常无法捕获真实运动模糊降级的复杂性和特征。例如,相机运动具有6个自由度(3个平移和3个旋转),而卷积模型仅考虑平行于图像平面的2D平移[17,18]。在这些合成生成的图像中也不考虑镜头失真,传感器饱和度,非线性变换函数,噪声和相机流水线中的压缩。此外,卷积模型中的恒定场景深度假设和非均匀模糊基准...

2019-04-11 22:11:02 808

原创 超分辨率-RDN

一、简介RDN——Residual Dense Network—— 残差深度网络RDN是基于深度学习的超分方法之一二、结构RDN网络结构分为4个部分:1、SFENet(Shallow Feature Extraction Net, 浅层特征提取网络)2、RDBs( Residual Dense Blocks, 残差稠密块)3、DFF(Dense Feature Fusion, 稠密特...

2019-02-23 15:13:28 8115

原创 pycharm如何配置python interpreter(针对anaconda里配置的tensorflow环境里的python)

选择的路径是:在anaconda里配置tensorflow时的路径(在anaconda配置tensorflow会下载一个python),按以下步骤进行:查看tensorflow安装路径——命令行中输入:于是选择时我们就按上面的路径找,就能看见了。选好之后就能用anaconda里装的tensorflow了 其他需要注意的问题,在anaconda安装tensorflow的环境时,(在...

2018-12-13 21:01:57 13618 4

转载 逻辑回归和线性回归区别

1)线性回归要求变量服从正态分布,logistic回归对变量分布没有要求。2)线性回归要求因变量是连续性数值变量,而logistic回归要求因变量是分类型变量。3)线性回归要求自变量和因变量呈线性关系,而logistic回归不要求自变量和因变量呈线性关系4)logistic回归是分析因变量取某个值的概率与自变量的关系,而线性回归是直接分析因变量与自变量的关系总之, logistic回归与...

2018-09-21 10:24:58 17708

转载 贝叶斯定理

贝叶斯公式百度百科 贝叶斯定理由英国数学家贝叶斯 ( Thomas Bayes 1702-1761 ) 发展,用来描述两个条件概率之间的关系,比如 P(A|B) 和 P(B|A)。按照乘法法则,可以立刻导出:P(A∩B) = P(A)*P(B|A)=P(B)*P(A|B)。如上公式也可变形为:P(B|A) = P(A|B)*P(B) / P(A)。贝叶斯法则是关于随机事件A和B的条件概...

2018-09-09 16:18:48 2031

转载 页面排序

相关博文: Google使用pageRanking算法给搜索结果排序的原理 pr值是什么

2018-09-09 16:02:13 873

转载 数据库设计的基本步骤

按照规范设计的方法,考虑数据库及其应用系统开发全过程,将数据库设计分为以下6个阶段 1.需求分析 2.概念结构设计 3.逻辑结构设计 4.物理结构设计 5.数据库实施 6.数据库的运行和维护需求分析和概念设计可以独立于任何数据库管理系统进行,逻辑设计和物理设计与选用的DAMS密切相关。1.需求分析阶段(常用自顶向下)需求分析的任务,是通过详细...

2018-09-09 15:27:20 1456

转载 sphinx中文索引

一.sphinx介绍与好处sphinx简介:sphinx是一款速度、效率非常高的中文索引技术 ;mysql索引: 主键、唯一、普通、全文(match/agaisnt)。 mysql本身的全文索引技术特性表现一般,一般数据库使用全文索引都不是使用本身的,都需要借助第3方索引技术支持,php->mysql->sphinx> , java->oracle->l...

2018-09-09 15:17:10 464

转载 网络爬虫

网络爬虫(又被称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。1、基本知识URI :Universal Resource Identifier(通用资源标识符)的缩写,Web 上每种可用的资源,如HTML文档、图像、视频片段、程序等都有这样一个唯一通用标识符进行定位。 URL的格式由三部分组成: 协议(服务方式) 存有该资源...

2018-09-09 15:06:11 349

转载 搜索引擎的原理,架构与细节

1、全网搜索引擎架构与流程 全网搜索引擎的宏观架构如上图,主要由核心系统和核心数据组成。 核心系统主要分为三部分(粉色部分):spider爬虫系统;search&index建立索引与查询索引系统,这个系统又主要分为两部分: 一部分用于生成索引数据build_index; 一部分用于查询索引数据search_index。rank打分排序系统。核心数据主要分为两部分(...

2018-09-09 14:32:38 6080

转载 安装matlab弹出 DVD 1 并插入 DVD 2 以继续的问题

我的做法是把两个光驱全部弹出后,然后加载镜像2 文件,最后点击继续,即可安装完毕。具体做法:下面给出图示: 安装到百分之78后会提示让弹出dvd1,我的做法是全部弹出,在双击dvd2镜像文件加载,再点击继续安装就好了。 图上2个DVD都要右键弹出。...

2018-07-09 13:08:46 4784

原创 谷歌机器学习速成课程笔记 16(Multi-Class Neural Networks-多类别神经网络)

但是现实世界中,我们通常不仅是在两个类别之间做选择,有时我们需要从一系列类别中的某个类别选择一个标签——某个对象是动物?蔬菜?矿物质?人造物体?等等将模型中的一个逻辑回归输出节点用于每个可能的类别,比如节点1——识别“这是苹果吗?”——是/否;节点2——识别“这是熊的照片吗?”——是/否;节点3——识别“这是糖果吗?”——是/否;我们只需让模型的开头 具有不同的输出...

2018-05-29 13:00:22 329

原创 谷歌机器学习速成课程笔记 15(Training Neural Networks -训练神经网络)

在思考如何训练神经网络是,首先我们需要了解哪些信息是与反向传播有关的。 (我们不需要了解反向传播的实施方式/原理机制,因为tensorflow 会为我们做好) 首先,反向传播确实依赖于梯度这个概念——事物必须是可微的(函数中存在一两个小的间断点没关系)这样我们才能够使用神经网络进行学习。另外,要注意,梯度可能会消失。如果我们的网络太过深入,信噪比随着您深入模型而变差,那么学习速度可能会...

2018-05-29 11:43:01 340

原创 谷歌机器学习速成课程笔记 14(Introduction of Neural Network-神经网络简介)

仍然是邮件分类问题。 如果正负样本是上图那样分布,我们可以使用特征交叉乘积轻松地对邮件分类。但是稍微复杂的分布又要怎么样呢? 分布可能很复杂,但是我们还是希望有某种方法让模型自动学习非线性规律,而不用我们手动为其指定参数,这种方法就是——深度神经网络。深度神经网络——可以非常出色地处理复杂数据(图像数据,音频数据,视频数据等)如何让模型自动学习非线性规律,而不用我们手动为其...

2018-05-29 10:33:23 129

原创 谷歌机器学习速成课程笔记 13(Regularization for Sparsity-稀疏性正则化)

特征组合很实用但也有一些问题,尤其是将稀疏特征组合起来的时候。 (接上图)那么我们可能会遇到数百万个可能存在的字词和数百万个可能存在的视频,这些内容一旦组合起来,便会产生大量的系数,这就意味着,模型会突然增大从而占满内存,还可能减缓运行时间。 并且,尽管我们拥有大量的训练数据,但其中仍有许多组合会非常罕见,因此我们最终可能会得到一些噪声系数,并可能产生过拟合。如果产生过拟合,就要进行正则化...

2018-05-26 23:43:05 340

原创 谷歌机器学习速成课程笔记 12(Classification-分类)

例如,如果邮件为垃圾邮件的概率超过.8,我们可能就会将其标记为垃圾邮件,0.8就是阈值分类。选定分类阈值后,如何评估模型质量呢?传统方法是看准确率——正确结果除以总数/正确结果所占的百分比。但是准确率虽然是一种直观且广泛使用的指标,但它也有一些重大缺陷: 假设有一个预测广告点击率的模型,并使用准确率来评估此模型的质量,但是现实中对于展示的广告,点击率通常为千分之一、万分之一甚至更...

2018-05-26 00:31:59 249

原创 谷歌机器学习速成课程笔记 11(Logistic Regression-逻辑回归)

若要预测弯曲硬币正面朝上的概率,可以用什么模型呢?我们可能会使用之前用过的线性回归,但会出现一些奇怪的情况,例如——如果我们要预测的是一枚新硬币,且其质量前所未有的重又或者硬币的弯曲程度非常大,会怎么样呢?尤其是我们将预测的概率相乘,或使用这些概率来创建预期值时,我们预测的结果可能不在0~1范围内,这样的概率值就是不正常的,说明出问题了。在首次尝试时,我们可以为预测值设置上限,...

2018-05-25 12:55:51 405

原创 谷歌机器学习速成课程笔记 10(Regularization for Simplicity-简化正则化)

之前已经讨论了如何让训练损失降到最低(也就是获取正确的样本),今天,我们来讨论且薄优质机器学习效果的第二个关键因素——正则化(概括而言,就是不要过于依赖样本)。 从以下拟合曲线我们可以看出:随着迭代次数越来越多,训练损失会越来越少,不出所料,蓝色曲线会不断下降,最终会在某种程度上收敛于底端,但另一方面,红线却在上升,而红线正是我们要关注的(因为是通过测试集出来的结果嘛)。 我们在训练集方面...

2018-05-23 11:10:26 180

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除