自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(55)
  • 资源 (2)
  • 收藏
  • 关注

原创 Python批量文件重命名(rename)

大量图片或者文本名需要重命名的时候,一个一个修改太麻烦,这个时候就需要快速简洁的方法来搞定。最近在处理数据的时候,需要对图片和文本进行重命名,做了一下实验。比如像这两个不同的数据,需要将原本图像名程进行修改,现在要将上千张类似的图片名称进行修改,将所有图片放入image文件夹,从0开始编号,代码如下:import osclass BatchRename(): def rename(self): path = "E:/python/data/add_data..

2022-04-13 11:20:22 10368 5

原创 python 图像处理基本操作

PIL库对图像的基本操作PIL网上有很多介绍,这里不再讲解。直接操作,读取一张图片,将其转换为灰度图像,并打印出来。

2021-06-04 21:20:55 2504 14

原创 python 遥感图像分类

本文采用阈值切片法对遥感影像进行分类,使用数据为landsat8遥感影像,下载地址:http://github.com/GeospatialPython/Learn/blob/master/thermal.zip?raw=true用envida'k

2021-06-04 16:10:47 4419 8

原创 Tensorflow搭建一个神经网络

一、Tensorlow结构import tensorflow as tfimport numpy as np#创建数据x_data = np.random.rand(100).astype(np.float32)y_data = x_data*0.1+0.3#创建一个 tensorlow 结构weights = tf.Variable(tf.random_uniform([1], -1.0, 1.0))#一维,范围[-1,1]biases = tf.Variable(tf.zeros

2021-05-13 22:35:36 2199 17

原创 【文献阅读】VQA-E——一种对预测答案解释的模型和数据集(Q. Li等人,ECCV,2018)

一、文章背景文章题目《VQA-E: Explaining, Elaborating, and Enhancing Your Answers for Visual Questions》文章下载地址:http://openaccess.thecvf.com/content_ECCV_2018/papers/Qing_Li_VQA-E_Explaining_Elaborating_ECCV_2018_paper.pdf、二、文章导读摘要部分:Most existing works in vi

2021-05-08 22:51:15 501

原创 【文献阅读】用于遥感数据集的视觉问答

一、文章概况文章题目:《RSVQA: Visual Question Answering for Remote Sensing Data》文章下载地址:二、文献导读摘要部分:Abstract— This article introduces the task of visual question answering for remote sensing data (RSVQA). Remote sensing images contain a wealth of information

2021-04-26 17:11:46 882

原创 【文献阅读】能兼顾图像理解和推理能力的VQA模型(CVPR,2019)

一、文章概况文章题目:《Answer Them All! Toward Universal Visual Question Answering Models》文章下载地址:http://openaccess.thecvf.com/content_CVPR_2019/papers/Shrestha_Answer_Them_All_Toward_Universal_Visual_Question_Answering_Models_CVPR_2019_paper.pdf二、文献导读摘要部分:

2021-04-02 22:20:25 1184

原创 机器学习(一)——K-近邻KNN算法

一、概述1.思路k-近邻算法(KNN)采用测量不同特征值之间的距离方法进行分类。如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别,其中K通常是不大于20的整数。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。2.原理数据集:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签。 分类:输入没有标签的新数据后,将新数据的每个特征

2021-03-29 10:52:15 433

原创 【文献阅读】用自然语言来表达图像内容,将VQA视为阅读理解(H. Li等人,CVPR,2019)

一、文章概况《Visual Question Answering as Reading Comprehension》文章下载地址:http://openaccess.thecvf.com/content_CVPR_2019/papers/Li_Visual_Question_Answering_as_Reading_Comprehension_CVPR_2019_paper.pdf二、文献导读摘要部分:Visual question answering (VQA) demands.

2021-03-25 20:39:44 752 1

原创 python图像处理(十一)——图像锐化与边缘检测之Roberts算子、Prewitt算子、Sobel算子、Laplacian算子

在图像增强过程中,通常利用各类图像平滑算法消除噪声,图像的常见噪声主要有加性噪声、乘性噪声和量化噪声等。一般来说,图像的能量主要集中在其低频部分,噪声所在的频段主要在高频段,同时图像边缘信息也主要集中在其高频部分。这将导致原始图像在平滑处理之后,图像边缘和图像轮廓模糊的情况出现。为了减少这类不利效果的影响,就需要利用图像锐化技术,使图像的边缘变得清晰。一、Roberts算子Roberts算子又称交叉微分算法,它是基于交叉差分的梯度算法,通过局部差分计算检测边缘线条,常来处理具有陡峭的低噪声图像,当图

2021-03-16 22:07:32 12580 3

原创 python图像处理(十)——图像仿射变换、图像透视变换和图像校正

一、图像仿射变换1.原理仿射变换(Affine Transformation 或Affine Map)是一种二维坐标(x, y)到二维坐标(u, v)的线性变换,转换过程坐标点的相对位置和属性不发生变换,是一个线性变换,该过程只发生旋转和平移过程。因此,一个平行四边形经过仿射变换后还是一个平行四边形。所以,仿射= 旋转 + 平移。其数学表达式形式如下:对应的齐次坐标矩阵表示形式为:仿射变换保持了二维图形的“平直性”(直线经仿射变换后依然为直线)和“平行性”(直线之间的相对位置关.

2021-03-15 20:17:19 10634 2

原创 Python图像处理(九)——形态学运算之图像开运算、比运算、梯度运算

一、图像开运算1.基本原理图像开运算是图像依次经过腐蚀、膨胀处理后的过程。图像被腐蚀后,去除了噪声,但是也压缩了图像;接着对腐蚀过的图像进行膨胀处理,可以去除噪声,并保留原有图像。如下图所示:开运算:先腐蚀,后膨胀下面是借鉴一位博主写的开运算效果图:作用:用来消除小的物体,平滑形状边界,并且不改变其面积。可以去除小颗粒噪声,断开物体之间的粘连。2.函数原形图像开运算使用函数morphologyEx(),它是形态学扩展的一组函数,其参数cv2.MORPH_OPE...

2021-03-15 17:18:38 1850

原创 python图像处理(八)——形态学运算之图像腐蚀与图像膨胀

 图像的膨胀(dilation)和腐蚀(erosion)是两种基本的形态学运算,主要用来寻找图像中的极大区域和极小区域,其中膨胀类似与 '领域扩张' ,将图像的高亮区域或白色部分进行扩张,其运行结果图比原图的高亮区域更大。腐蚀类似 '领域被蚕食' ,将图像中的高亮区域或白色部分进行缩减细化,其运行结果图比原图的高亮区域更小。一、图像膨胀...

2021-03-14 11:46:08 15119 1

原创 Python图像处理(七)——图像阈值化处理

一、阈值化图像的二值化,就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。一幅图像包括目标物体、背景还有噪声,要想从多值的数字图像中直接提取出目标物体,常用的方法就是设定一个阈值T,用T将图像的数据分成两部分:大于T的像素群和小于T的像素群。这是研究灰度变换的最特殊的方法,称为图像的二值化(Binarization)。当灰度Gray小于阈值T时,其像素设置为0,表示黑色;当灰度Gray大于或等于阈值T时,其Y值为255,表示白色。Py..

2021-03-10 22:04:09 9872 10

原创 Python图像处理(六)——图像缩放、图像旋转、图像翻转、图像平移

一、图像缩放图像缩放主要使用resize函数result = cv2.resize(src, dsize[, result[. fx[, fy[, interpolation]]]])其中src表示原始图像,dsize表示缩放大小,fx和fy也可以表示缩放大小倍数,他们两个(dsize或fx\fy)设置一个即可实现图像缩放代码如下:import cv2#读取图片image = cv2.imread("E:/pythonProject/xin.jpeg")#图片缩放imag

2021-03-10 17:58:27 11161 1

原创 Python图像处理(五)——图像类型转换、加法运算及图像融合

一、图像类型转换图像类型转换是指将一种图像转化成另一种类型,比如将彩色图像转换成灰度图像,BGR格式图像转换成RGB格式图像,一下列出OpenCV中常用的三种图像类型转化。cv2.COLOR_BGR2GRAY cv2.COLOR_BGR2RGB cv2.COLOR_GRAY2BGR代码如下所示:import cv2#读取图片image = cv2.imread("E:/pythonProject/mei.jpeg")#彩色图像转换为灰度图像meig = cv2.cvtC

2021-03-08 21:53:41 2045 4

原创 Python图像处理(四)——图像平滑操作之均值滤波、方框滤波、高斯滤波、中值滤波

一、图像平滑图像平滑是一种区域增强的算法,平滑算法有邻域平均法、中指滤波、边界保持类滤波等。在图像产生、传输和复制过程中,常常会因为多方面原因而被噪声干扰或出现数据丢失,降低了图像的质量(某一像素,如果它与周围像素点相比有明显的不同,则该点被噪声所感染)。这就需要对图像进行一定的增强处理以减小这些缺陷带来的影响。为了方便做出比较,先给一幅图片中加入噪声,代码如下:import cv2import numpy as np# 读取图片image = cv2.imread('E:/pyth

2021-03-07 11:35:39 5602 1

原创 python图像处理(三)——获取图像属性、感兴趣区域ROI及通道处理

一、获取图像属性1.形状-shape通过shape关键字获取图像形状,返回值为图像行数,列数以及通道数的元组。import cv2image = cv2.imread("灰度图像”)print(image.shap)#(512,512)import cv2image = cv2.imread("彩色图像”)print(image.shap)#(512,512,3)import cv2#获取图片image = cv2.imread('E:..

2021-03-04 16:19:29 8984 2

原创 python图像处理(二)——OpenCV和Numpy库读取修改像素的区别

一、OpenCV读取像素方法1.灰度图像,返回灰度值返回值=图像(位置参数),例p=image[88,142]import cv2#读入图片image = cv2.imread("E:/pythonProject/33.png", cv2.IMREAD_UNCHANGED)#灰度图像p = image[88,142]print(p)#显示图片cv2.imshow("demo",image)#等待显示cv2.waitKey(0)cv2.destroyAllWindow

2021-03-03 11:18:26 1166

原创 python图像处理(一)——图像处理OpenCV入门函数

一、OpenCV读取图像本文在python3.7和OpenCV进行实验,首先安装OpenCV,网上有很多教程,这里不再赘述。1.图像读入OpenCV读取图像函数img = cv2.imread(“文地址”,[,参数])参数(1) cv2.IMREAD_UNCHANGED (图像不可变)参数(2) cv2.IMREAD_GRAYSCALE (灰度图像)参数(3) cv2.IMREAD_COLOR (读入彩色图像)参数(4) cv2.COLOR_BGR2RGB (图像通道BGR转成R

2021-03-02 16:59:26 795

原创 cv2.error: OpenCV(4.5.1) C:\Users\appveyor\AppData\Local\Temp\1\pip-req-build-r2ue8w6k\opencv\module

cv2.error: OpenCV(4.5.1) C:\Users\appveyor\AppData\Local\Temp\1\pip-req-build-r2ue8w6k\opencv\modules\highgui\src\window.cpp:376: error: (-215:Assertion failed) size.width>0 && size.height>0 in function 'cv::imshow'安装好opencv进行测试时,发生以下错误i

2021-03-02 10:53:40 19325 13

原创 【文献阅读】视觉问答中的一些提示和技巧(D.Teney等人,CVPR,2018)

Deep Learning has had a transformative impact on Computer Vision, but for all of the success there is also a significant cost. This is that the models and procedures used areso complex and intertwined that it is often impossible to distinguish the impact

2021-01-21 21:01:45 398

原创 Project Euler|欧拉计划 1~10 (python 3.6)

一,Project Euler. Problem 1: Multiples of 3 and 5Multiples of 3 and 5If we list all the natural numbers below 10 that are multiples of 3 or 5, we get 3, 5, 6 and 9. The sum of these multiples is 23.Find the sum of all the multiples of 3 or 5 below 10

2020-08-11 14:00:23 652

原创 简单的基本测试题python

最近整理了一些比较基本的小算法,供大家参考1.把一元的钞票换成一份二分和五分(每种至少一枚)有多少种换法?iter = 0for i in range(1,20): for j in range(1,48): one=100-5*i-2*j if one >= 1: iter+=1 # print("五分:{}个".format(i)) # print("二分:{}个".form

2020-05-11 11:32:39 628

原创 【文献导读】 Faster R-CNN人脸检测

一、文章背景文章题目《Face Detection with the Faster R-CNN》文章下载地址:https://arxiv.org/abs/1606.03473二、文章导读(一)文章摘要部分:The Faster R-CNN has recently demonstrated impressive results on various object detecti...

2019-10-24 19:22:53 1070

原创 【文献导读】

前两天准备参加一个阅读文献的活动,由于其他原因没参加,现在把读后感贴出来记录一下。文献可自行下载,这里就不贴了。论文题目[1]Yong Nie, Ainong Li, Assessment of Alpine Wetland Dynamics from 1976–2006 in the Vicinity of Mount Everest[J]. Wetlands. (2011), 31:8...

2019-06-23 16:35:02 1050

原创 对抗神经网络(二)——DCGAN

一、DCGAN介绍DCGAN即使用卷积网络的对抗网络,其原理和GAN一样,只是把CNN卷积技术用于GAN模式的网络里,G(生成器)网在生成数据时,使用反卷积的重构技术来重构原始图片。D(判别器)网用卷积技术来识别图片特征,进而做出判别。同时,CDGAN中的卷积神经网络也做了一些结构的改变,以提高样本的质量和收敛速度。DCGAN的generator网络结构图如下:G网中使用ReLU作...

2019-03-13 16:33:37 15111 13

原创 手势数字识别

直接代码import mathimport numpy as npimport cv2import h5pyimport matplotlib.pyplot as pltimport tensorflow as tffrom tensorflow.python.framework import opsfrom tf_utils import load_dataset, rand...

2019-02-27 18:06:07 1652 3

原创 对抗神经网络(一)——GAN

      对抗神经网络其实是两个网络的组合,可以理解为一个网络生成模拟数据,另一个网络判断生成的数据是真实的还是模拟的。生成模拟数据的网络要不断优化自己让判别的网络判断不出来,判别的网络也要不断优化自己让判断的更加精确。两者的关系形成对抗,因此叫对抗神经网络。GAN由generator(生成模型)和discriminator(判别式模型)两部分构成。generator:主要是从训练数据中...

2019-02-25 15:39:46 5257 2

原创 python中模型训练不收敛问题

近期在做人脸表情识别时,遇到了一个问题,就是模型写好进行训练时,出现了不收敛的现象。情况如下:出现这种问题,很难无从下手,一步一步的排查各个环节,首先检查模型,发现模型并木有问题。部分模型代码:def train_model(): # 构建模型---------------------------------------------------------- x = ...

2019-01-24 15:16:51 4172 2

原创 人脸识别Dlib——68个特征点

前面说了怎么打开摄像头框出人脸,接下来学习了一下人脸的68个特征点直接代码import dlibimport cv2# 与人脸检测相同,使用dlib自带的frontal_face_detector作为人脸检测器detector = dlib.get_frontal_face_detector()# 使用官方提供的模型构建特征提取器predictor = dlib.shape...

2019-01-10 09:47:46 30378 23

原创 人脸识别——OpenCV调取摄像头识别人脸

利用OpenCV内置分类器进行人脸识别#-*-coding:utf-8 -*-import cv2def facedetect(windowname,camera_id):#命名和打开摄像头,详情见上一篇 cv2.namedWindow(windowname) cap=cv2.VideoCapture(camera_id)#获取摄像头 classfier...

2019-01-08 14:58:06 4864 2

原创 python网络爬虫——爬取指定图片

在做花卉数据增量的时候,对102flowers进行数据增量处理,在百度上直接截取图片的话,效率太低,在这里使用python网络爬虫,仅需要输入特定的图片名称,便可以直接获取大量相关图片,本例以获取rose为例进行爬取。参考之前博主的代码,稍微进行修改即可。直接代码import requestsimport osdef getManyPages(keyword,pages): ...

2019-01-07 17:25:57 4752 2

原创 自编码网络(五)——变分自编码

变分自编码其实就是在编码过程中改变样本的分布,“学习样本的规律”,具体指的就是样本的分布,假设知道样本的分布函数,就可以从这些函数中随便取一个样本,然后进行网络解码层前向传导,这样就可以生成一个新的样本。为了得到这这个样本的分布函数,模型训练的目的将不再是这样的样本本身,而是通过加一个约束项,将网络生成一个服从高斯分布的数据集,这样按照高斯分布里的均值和方差规则就可以取任意相关的数据,然后通过...

2018-12-29 11:22:15 834 3

原创 自编码网络(四)——实现去燥自编码

1.引入头文件,创建网络模型及定义学习参数变量对mnist集中的原始输入图片加入噪声,在自编码网络中进行训练,得到抗干扰能力更强的特征提取模型。引入头文件,创建mnist数据集。import numpy as npimport tensorflow as tfimport matplotlib.pyplot as pltfrom tensorflow.examples.t...

2018-12-20 17:14:15 462

原创 自编码网络(三)—— 使用去噪自编码提取MNIST特征

1.引入头文件,创建网络模型及定义学习参数的变量import numpy as npimport tensorflow as tfimport matplotlib.pyplot as pltfrom tensorflow.examples.tutorials.mnist import input_datamnist = input_data.read_data_sets("...

2018-12-06 18:04:49 1547

原创 自编码网络(二)—— 提取图片的二维特征,并利用二维特征还原图片

在自编码网络中使用线性解码器对MNIST数据特征进行再压缩,并将其映射到直角坐标系上。这里使用4层逐渐压缩将784维度分别压缩成256、64、16、2这四个特征向量。1.引入图文件,定义学习参数变量import tensorflow as tfimport numpy as npimport matplotlib.pyplot as pltfrom tensorflow.exa...

2018-12-04 17:12:21 2208 4

原创 自编码网络(一)—— 提取图片特征,并利用特征还原图片

通过建立一个两层降维的自编码网络,将MNIST数据集的数据特征提取出来,并通过这些特征再重建一个MNIST数据集。1,引入头文件,并加载mnist数据import tensorflow as tfimport numpy as npimport matplotlib.pyplot as plt#导入mnist数据集from tensorflow.examples.tutoria...

2018-11-26 17:55:10 6790

原创 用RNN实现一个退位减法器

使用python编写一个简单的循环神经网络拟合一个退位减法的操作1.定义基本函数首先手动写一个sigmoid函数机器导数import copy, numpy as npnp.random.seed(0) #固定随机生成器的种子,可以每次得到一样的值def sigmoid(x): #激活函数 output = 1/(1+np.exp(-x)) return outp...

2018-11-22 17:05:58 664 2

原创 卷积神经网络对CIFAR数据集分类

本例通过一个具有全局平局池化层的神经网络对CIFAR数据集分类1.导入头文件引入数据集这部分使用cifar10_input里面的代码,在cifar10文件夹下建立卷积文件,部分代码如下:import cifar10_inputimport tensorflow as tfimport numpy as npbatch_size = 128data_dir = 'cifar-...

2018-11-19 10:28:53 1062 3

120flowers(剩下的40个类)

120flowers的40个类,由于全部数据量太大,无法直接上传,所以分开上传。已经将其余的62类上传,数据全部处理好,可直接使用

2018-12-28

62flowers(62类花卉分类)

120类花卉分类数据,已经分好了,由于数据太大,分两次上传,这次只上传了62类,剩下的40类下次上传。

2018-12-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除