- 博客(107)
- 资源 (3)
- 收藏
- 关注
原创 旷世Objects365数据集----类别对照表
{'name': 'human', 'id': 1}{'name': 'sneakers', 'id': 2}{'name': 'chair', 'id': 3}{'name': 'hat', 'id': 4}{'name': 'lamp', 'id': 5}{'name': 'bottle', 'id': 6}{'name': 'cabinet/shelf', 'id': 7}{...
2019-04-28 15:21:26 5939 2
翻译 mAP---评价目标检测模型
https://github.com/rafaelpadilla/Object-Detection-Metrics写在开头:(1) mAP总是在固定的数据集上计算(2)它不是量化模型输出的绝对度量,但是是一个比较好的相对度量。当我们在流行的公共数据集上计算这个度量时,这个度量可以很容易的用来比较不同目标检测方法(3)根据训练中类的分布情况,平均精度值可能会因为某些类别(具有良好的训练...
2019-04-25 11:26:18 539
原创 Tensorflow object detection API源码分析之如何构建模型
模型的具体参数被定义在config文件中,如samples/configs/ssd_mobilenet_v2_coco.configmodel { ssd { num_classes: 90 box_coder { faster_rcnn_box_coder { y_scale: 10.0 x_scale: 10.0 ...
2019-02-28 14:07:55 1627
原创 Tensorflow object detection API源码分析之如何处理数据
本文旨在分析Tensorflow object detection API读取到数据之后,如何进行一系列预处理操作整个预处理流程:1.批量读数据前,通过 data_augmentation_options 类指定预处理操作data_augmentation_options一系列预处理操作在samples/configs/ssd_mobilenet_v2_coco.config中指...
2019-02-27 18:29:09 1400
原创 Tensorflow object detection API源码分析之如何读数据
核心代码:object_detection/train.py关于TFRecord文件的位置一般在samples/configs/*.config中举例:samples/configs/ssd_mobilenet_v1_coco.configtrain_input_reader: { tf_record_input_reader { input_path: ...
2019-02-26 16:23:22 1106
原创 What does “class-agnostic” in most of the object detection papers mean?
For a class-aware detector, if you feed it an image, it will return a set of bounding boxes, each box associated with the class of the object inside (i.e. dog, cat, car). It means that by the time the...
2019-02-19 15:46:04 270
原创 COCO数据集转VOC(提取自己需要的类)
github:https://github.com/zcc720/COCO2VOC.git接上篇VOC数据集提取自己需要的类,这次我们依然从coco数据集中提取我们想要的类,并转为voc格式,用于目标检测。一、去官网下载数据集train2007val2007train2014val2014annotations2014annotations2017二、安装coc...
2018-12-20 14:33:35 13191 38
原创 VOC数据集提取自己需要的类
最近在做一项工作,想要从VOC数据集中自己想要的特定类。如果与我有相同需求的朋友,可以参考我下面的代码。VOC2007,VOC2012数据集均可用# -*- coding: utf-8 -*-# @Function:There are 20 classes in VOC data set. If you need to extract specific classes, you c...
2018-12-18 17:27:29 10274 24
原创 pip太慢 更换源
pip install SomePackage -i https://pypi.tuna.tsinghua.edu.cn/simple
2018-12-17 15:13:17 244
原创 图像增强
import numpy as npimport matplotlib.pyplot as pltfrom skimage.io import *from skimage.transform import *import scipy.ndimage as ndiimg = imread('test_image/0--Parade_0_Parade_marchingband_1_35...
2018-11-15 14:58:29 1269
原创 tf.data.Dataset
tf.data API带来了TensorFlow的两种新抽象:tf.data.Dataset : 表示元素的序列,其中每个元素包含了一个或多个Tensor对象。例如,一个图像数据管道中,一个元素可能是一个具有一对张量表示其图像数据和标签的训练样本 。有两个不同的方法创建dataset : 创造source (例如Dataset.from_tensor_slices()) 从一个或多个tf...
2018-11-01 15:26:27 761
原创 FaceBoxes: A CPU Real-time Face Detector with High Accuracy(论文解析)
论文:FaceBoxes: A CPU Real-time Face Detector with High Accuracy代码地址:https://github.com/TropComplique/FaceBoxes-tensorflowCPU上的高精度实时人脸检测器综述 人脸识别是计算机视觉和模式识别的基础问题,过去几十年取得了长足进步,但是由于计算量较大,在CPU...
2018-11-01 10:54:26 473 1
原创 SqueezeNet论文与源码阅读
论文下载地址:http://arxiv.org/abs/1602.07360 论文代码:https://github.com/DeepScale/SqueezeNet前言SqueezeNet目标设计不是为了得到最佳的CNN识别精度,而是希望简化网络复杂度,同时达到公共网络的识别精度。所以SqueezeNet 主要是为了降低CNN模型参数数量而设计的。SqueezeNet是一个高密小...
2018-10-26 15:56:46 1565
转载 could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR
转载:https://blog.csdn.net/tangxianyu/article/details/80537942could not create cudnn handle:CUDNN_STATUS_INTERNAL_ERROR在CPU下运行没有问题,但是在GPU版本下,一直运行不成功。可以尝试限制一下GPU的运行资源,添加如下代码:config = tf.ConfigProt...
2018-10-25 11:02:21 403 1
原创 windows下查看GPU使用率
进入C:\Program Files\NVIDIA Corporation\NVSMI在此处打开cmd输入nvidia-smi第一行Driver Version:表示驱动是385.54第二行中:第一行表示GPU序号,名字,Persisitence-M(持续模式状态),如我中有一个GPU序号为0;名字为GeForce系列的GTX1060;持续模式的状态,持续模式虽然耗能大,但是在...
2018-09-27 10:25:07 24320 1
原创 python通过函数调用进行属性的添加,修改和删除
通过函数调用进行属性的添加,修改和删除 函数getattr(对象,属性名)的功能是访问对象的属性 函数hasattr(对象,属性名)的功能是检查是否存在一个属性,结果为逻辑值 函数setattr(对象,属性名,属性值)的功能是设置一个属性,如果属性不存在,则创建一个新的此属性 函数delarrt(对象,属性名,属性值)的功能是删除属性 class P...
2018-09-09 16:56:02 872
原创 TensorFlow函数:tf.split与tf.squeeze
tf.split函数API原型(TensorFlow 1.8.0):tf.split( value, num_or_size_splits, axis=0, num=None, name='split')这个函数是用来切割张量的。输入切割的张量和参数,返回切割的结果。 value传入的就是需要切割的张量。 这个函数有两种切割的方式:以三...
2018-09-09 09:51:32 670
原创 CelebA人脸数据集
CeleA是香港中文大学的开放数据,包含10177个名人身份的202599张图片,并且都做好了特征标记,这对人脸相关的训练是非常好用的数据集。官网链接网盘链接别看只是一堆人脸,他们很贴心地做好了特征标记,也就是说,你可以找到类似下面这些标签:40种属性:01 5_o_Clock_Shadow 胡子,(清晨刮脸的人傍晚已长出的短髭 ) -1 02 Arched_Eyeb...
2018-08-20 21:34:48 21799 12
原创 Multi-task learning of facial landmarks and attributes with Tensorflow(三)
singleTask_att.py对人脸属性进行训练在main_simple.py中指定训练哪个属性:0:gender, 1:smiling, 2:glasses, 3:head_posenetwork = CNNSingleAtt(data, 50, 1) #batch size, attributesess = network.train_network(100, 0.9, T...
2018-08-16 14:31:19 293
原创 Multi-task learning of facial landmarks and attributes with Tensorflow(二)
tensorflow数据读取机制tensorflow中为了充分利用GPU,减少GPU等待数据的空闲时间,使用了两个线程分别执行数据读入和数据计算。具体来说就是使用一个线程源源不断的将硬盘中的图片数据读入到一个内存队列中,另一个线程负责计算任务,所需数据直接从内存队列中获取。tf在内存队列之前,还设立了一个文件名队列,文件名队列存放的是参与训练的文件名,要训练 N个epoch,则文件名队...
2018-08-15 15:22:29 339
原创 Multi-task learning of facial landmarks and attributes with Tensorflow(一)
数据集下载链接:http://mmlab.ie.cuhk.edu.hk/projects/TCDCN.htmlgithub地址:https://github.com/Mimsyy/Deep-learning-MTFL Multi-Task Facial Landmark (MTFL人脸数据库),这个数据库包括了12,995张人脸图片,每张图片都被做了一些标注。包括(1)5个人脸特...
2018-08-14 17:32:46 616
原创 感受野计算
感受野:在卷积神经网络CNN中,决定某一层输出结果中一个元素所对应的输入层的区域大小,被称作感受野receptive field。再通俗点的解释是,feature map上的一个点对应输入图上的区域。 感受野大小的计算 感受野计算时有下面的几个情况需要说明: (1)第一层卷积层的输出特征图像素的感受野的大小等于滤波器的大小 (2)深层卷积层的感受野大小和它之前...
2018-07-16 16:44:02 868
原创 决策树+编程实现
什么是决策树构建决策树的关键问题是:每个节点在哪个维度上做划分某个维度在哪个值上做划分信息熵信息熵在信息论中代表随机变量不确定的度量。熵越大,数据的不确定性就越高。熵越小,数据的不确定性越低。上图中可以看出,右边的数据比左边的数据熵小,右边数据更确定。以二分类问题,编程实现信息熵,观察信息熵的函数曲线import numpy as npimport matplotlib.pyplot as p...
2018-07-12 17:06:07 1766
原创 python+opencv+图像滤波
在一张图像,在数据存储或传输的过程中,或多或少都会引入噪声,常见的图像噪声如高斯噪声、瑞利噪声、椒盐噪声等。为了避免噪声对图像信息进行干扰或者说为了更有利于图像的后续处理,所以需要对图像进行滤波。在OpenCV中,有几种最基础的图像滤波函数,cv2.blur(),cv2.GaussianBlur(),cv2.medianBlur(),cv2.bilateralFiter() ,可以分别进行...
2018-07-11 21:17:08 1310
原创 python+opencv+图像特效(图像灰度处理、颜色翻转、图片融合,边缘检测,浮雕效果,颜色映射)
原图图像灰度处理#方式1import cv2#读取彩色原图img0=cv2.imread('E:/python_cv/01.jpg',1)#读取灰度图img1=cv2.imread('E:/python_cv/01.jpg',0)print(img0.shape)print(img1.shape)cv2.imshow('gary',img1)cv2.waitKey(0)#方式2...
2018-07-02 21:26:55 16644 1
原创 python+opencv+图像几何变换(图片缩放、剪切、位移、镜像,放射变换,旋转)
原图图片缩放API#缩放1import cv2img=cv2.imread('E:/python_cv/01.jpg',1)img_info=img.shapeprint(img_info)image_height=img_info[0]image_weight=img_info[1]image_mode=img_info[2]dstHeight=int(0.5*image_he...
2018-06-28 10:40:16 5804 2
原创 主成分分析PCA+编程实现
主成分分析一个非监督的机器学习算法主要用于数据的降维通过降维,可以发现更便于人类理解的特征其他应用:可视化,去噪PCA优缺点优点:降低数据的复杂性,识别最重要的多个特征缺点:不一定需要,且可能损失有用信息使用数据类型:数值型数据举个例子理解一下,二维空间上有一些样本点如下,将二维降维至一维:原始样本点(二维)映射到特征1上映射到特征2上从图中可以看到,将样本点映射到特征1这种方案感觉会好一些,因为...
2018-06-25 17:16:47 1320 1
原创 优化算法总结
优化器算法简述首先来看一下梯度下降最常见的三种变形:批量梯度下降(BGD)随机梯度下降(SGD)小批量随机梯度下降(MSGD)这三种形式的区别就是取决于我们用多少数据来计算目标函数的梯度, 涉及参数更新的准确率和运行时间。批量梯度下降(BGD)梯度更新规则: BGD 采用整个训练集的数据来计算 cost function 对参数的梯度: θ=θ−α∇θJ(θ)γvt−1缺点: 由于这种方法是在一次...
2018-06-20 14:10:36 1535 1
原创 特征图大小的计算
卷积中的特征图大小计算方式有两种,分别是‘VALID’和‘SAME’,卷积和池化都适用,当尺寸不被整除时,卷积向下取整,池化向上取整。 1.如果计算方式采用'VALID',则:其中为输出特征图的大小,为输入特征图的大小,F为卷积核大小,stride为卷积步长。2.如果计算方式采用'SAME',输出特征图的大小与输入特征图的大小保持不变,其中padding为特征图填充的圈...
2018-06-19 13:21:47 14166 3
YOLO论文学习笔记
方法:将图像划分为网格,在每个网格中预测物体边框YOLO,因为最后采用的是全连接层,每个物体边框的预测都已整张图的特征为输入,换言之当我们在判断一个位置上是否有物体,以及这个物体的大小和位置时,都是看了整张图上的所有特征,这个好处就在于我有足够多的上下文信息能够辅助判断,因此YOLO在检测中有一个很大的优势-->在背景上的误检会非常少YOLO速度和精度速度快,精度慢7*7的网格划分是比较粗糙...
2018-06-14 16:34:50 201
原创 matplotlib无法显示中文和负号解决办法
import matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei'] #显示中文plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
2018-06-13 17:06:49 3293 1
原创 K-均值聚类算法(K-Means)
简单介绍:k-means聚类属于无监督学习的一种,在没有给与labels的情况下,将数据分成指定的K类sixiang 对于第一张图一样的散乱的数据样本的聚类,首先,假设要聚成两大团,那么,随机给两个点的坐标,如同第二张图的两个十字mark,然后第一步就是帮所有点认领归属的团,站第一次队。认领方法是,每个点都算一算自己到这两个十字mark的距离,认领距离小的那个mark,作为自己的归...
2018-06-13 12:57:08 5718 1
原创 目标检测SSD+Tensorflow 训练自己的数据集
1.代码地址:https://github.com/balancap/SSD-Tensorflow,下载该代码到本地2.解压ssd_300_vgg.ckpt.zip 到checkpoint文件夹下3.测试一下看看,在notebooks中创建demo_test.py,其实就是复制ssd_notebook.ipynb中的代码,该py文件是完成对于单张图片的测试,对Jupyter不熟,就自己...
2018-06-04 18:32:38 62123 304
原创 Tensorflow实现回归(例子)
import tensorflow as tfimport numpy as npimport matplotlib.pyplot as plt#制造数据,加上随机噪声x_data = np.linspace(-0.5, 0.5, 200)[:,np.newaxis]noise = np.random.normal(0, 0.02, x_data.shape)y_data=np.squ...
2018-06-02 21:19:34 6889
原创 梯度下降法与python模拟实现
梯度下降的几何形式下图为梯度下降的目的,找到J(θ)的最小值。其实,J(θ)的真正图形是类似下面这样的,因为其是一个凸函数,只有一个全局最优解,所以不必担心像上图一样找到局部最优解直到了要找到图形中的最小值之后,下面介绍自动求解最小值的办法,这就是梯度下降法对参数向量θ中的每个分量θj,迭代减去速率因子a* (dJ(θ)/dθj)即可,后边一项为J(θ)关于θj的偏导数3 梯度下降的原理导数的概念...
2018-06-01 17:36:14 3685
原创 数据结构之单向循环链表----python实现
单向循环链表单链表的一个变形是单向循环链表,链表中最后一个节点的next域不再为None,而是指向链表的头节点。操作is_empty() 判断链表是否为空length() 返回链表的长度travel() 遍历add(item) 在头部添加一个节点append(item) 在尾部添加一个节点insert(pos, item) 在指定位置pos添加节点remove(item) 删除一个节点search...
2018-05-28 22:00:09 1092 2
原创 数据结构之单向链表----python实现
单向链表单向链表也叫单链表,是链表中最简单的一种形式,它的每个节点包含两个域,一个信息域(元素域)和一个链接域。这个链接指向链表中的下一个节点,而最后一个节点的链接域则指向一个空值。表元素域elem用来存放具体的数据。链接域next用来存放下一个节点的位置(python中的标识)变量p指向链表的头节点(首节点)的位置,从p出发能找到表中的任意节点。节点实现class Node(): """...
2018-05-27 17:56:28 3943
原创 实验楼机器学习挑战赛-----线性回归拟合并绘图
def linear_plot(): import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression data = [[5.06, 5.79], [4.92, 6.61], [4.67, 5.48], [4.54, 6.11], ...
2018-05-25 17:01:17 683
原创 线性回归---sklearn+python实现
简单线性回归问题思想回到正题,对于简单线性回归有如下问题:下面通过程序来实现简单的线性回归:import numpy as npimport matplotlib.pyplot as pltx=np.array([1,2,3,4,5])y=np.array([1,3,2,3,5])plt.scatter(x,y)x_mean=np.mean(x)y_mean=np.mean(y)up...
2018-05-25 11:53:46 1963
原创 K最近邻算法(KNN)---sklearn+python实现
k-近邻算法概述简单地说,k近邻算法采用测量不同特征值之间的距离方法进行分类。k-近邻算法优点:精度高、对异常值不敏感、无数据输入假定。缺点:计算复杂度高、空间复杂度高。 适用数据范围:数值型和标称型。 k-近邻算法(kNN),它的工作原理是:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将...
2018-05-23 16:50:10 43839 1
Python基础教程[第2版】
2018-04-25
程序员的数学1,2,3
2018-01-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人