自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(74)
  • 资源 (2)
  • 收藏
  • 关注

转载 Java正则表达式

单个字符的匹配规则如下:正则表达式规则可以匹配A指定字符A\u548c指定Unicode字符和.任意字符a,b,&,0\d数字0~90~9\w大小写字母,数字和下划线a~z,A~Z,0~9,_\s空格、Tab键空格,Tab\D非数字a,A,&,_,……\W非\w&,@,中,……...

2020-05-02 18:37:08 470

原创 如何在markdown中插入表情包

我们平时经常使用markdown完成一些诸如博客的文档写作,但是有时像我这种语言比较乏力的急需要在文档写作过程中插入表情包来完整的表达我想要表达的意思,所以我去网上查了一下,还真有。比如我想要表达开心即smile的表情,那么我只需要使用双冒号中间加入英文单词就可以啦,例如::smile::smile::smile:  

2019-07-30 22:17:31 1598

原创 初识VSCode

Visual Studio Code(以下简称vscode)是一个轻量且强大的代码编辑器,跨平台支持Windows,Mac OS X和Linux。内置JavaScript、TypeScript和Node.js支持,而且拥有丰富的插件生态系统,可通过安装插件来支持C++、C#、JAVA、Python、PHP等其他语言。微软对于vscode的定位如下图,位于编辑器与IDE之间,但是更像一个编辑器。...

2019-01-20 15:22:33 816

原创 编辑器、编译器以及IDE

编辑器: 顾名思义,就是编辑所用的软件,比如windows自带的记事本就是一个简单的编辑器软件,你要是喜欢,也可有用记事本来写代码,只不过记事本没有语法高亮,不显示行号等等一些弊端很少有程序员会用记事本去写代码,写代码比较好用的编辑器软件有vs code,vim,sublime,notepad++,emacs,atom等等,不同的编辑器软件有不同的功能,各有各的优点,但大同小异,可根据自身需求选择...

2019-01-19 20:43:05 3808

原创 win10下安装绿色版mysql 8.0.13

下载mysql: MySQL官方网站下载最新的MySQL Community Server版本:https://dev.mysql.com/downloads/mysql/我这里为mysql-8.0.13-winx64.zip;解压安装: 解压到你想要指定的安装目录,我这里为D:\setup\mysql\mysql-8-0-13,mysql-8-0-13为自己改过的mysql文件名;配置...

2018-12-28 22:14:10 2958 1

原创 python中argparse模块简介

Python解析命令行读取参数 – argparse模块前言:在多个文件或者不同语言协同的项目中,python脚本经常需要从命令行直接读取参数。万能的python就自带了argprase包使得这一工作变得简单而规范。PS:optparse包是类似的功能,只不过写起来更麻烦一些。argparse模块:argparse是python用于解析命令行参数和选项的标准模块,用于代替已经过时的optp...

2018-11-14 00:00:18 993

转载 python中字典(dictionary)数据类型常用操作

创建字典字典是另一种可变容器模型,且可存储任意类型对象。 字典的每个键值(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中 ,格式如下所示:d = {key1 : value1, key2 : value2 }键必须是唯一的,但值则不必。 值可以取任何数据类型,但键必须是不可变的,如字符串,数字或元组。 一个简单的字典...

2018-09-09 17:22:25 35689

原创 tensorflow实现一个简单的卷积神经网络实现手写数字识别

Tensorflow是一个采用数据流图(data flow graphs)用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。如下图: 借助其灵活的架构,用户可以轻松地将计算工作部署到多种平台(CPU、GPU、TPU)和设备(桌面设备、服务器集群、移动设备、边缘设备等)。TensorFlow™ 最...

2018-08-27 00:16:31 1838

原创 python实现随机森林

定义:随机森林指的是利用多棵决策树对样本进行训练并预测的一种分类器。可回归可分类。 所以随机森林是基于多颗决策树的一种集成学习算法,常见的决策树算法主要有以下几种: 1. ID3:使用信息增益g(D,A)进行特征选择 2. C4.5:信息增益率 =g(D,A)/H(A) 3. CART:基尼系数 一个特征的信息增益(或信息增益率,或基尼系数)越大,表明特征对样本的熵的减少能力更...

2018-08-26 18:10:59 117421 34

原创 python实现ID3决策树分类算法

所有的分类与回归算法中心思想大致是一样的,那就是根据现有带标签的数据集训练一个分类器模型,然后对待未知的样本,根据训练好的分类模型来判定它属于哪个类。分类与回归的区别在我看来就是标签连续与否的区别,若标签连续,则是回归,若标签离散,则是分类。数据集中的每个样本的特征都是相同维度的,生活中我们常遇到的是根据某个样本少量的特征就可以确定这个样本属于哪个类,比如可以根据一个人的长相、身高、文凭、收入...

2018-08-25 22:31:49 33324 21

原创 python中字符串常用操作

字符串是 Python 中最常用的数据类型。我们可以分别使用单引号'和双引号 ''来创建字符串。 字符串一旦创立之后,即不可更改,和python中的元组数据类型一样。 Python 不支持单字符类型,单字符在 Python 中也是作为一个字符串使用。# -*- coding: utf-8 -*-"""Created on Sun Aug 19 01:00:51 2018@...

2018-08-19 03:36:02 450

原创 python中内置高阶函数map,reduce,filter以及sorted简介

1,map()与reduce()map()函数接收两个参数,一个是函数,一个是Iterabled对象,map将传入的函数依次作用到序列的每个元素,并把结果作为新的Iterator返回。例子如下:a = list(map(int, '1234568'))print(a)#[1, 2, 3, 4, 5, 6, 8]reduce()把一个函数作用在一个序列[x1, x2, x3, …...

2018-08-19 01:39:26 258

原创 python中列表list的常用操作

列表是python中最常用的数据结构之一,非常好用,它可以作为一个方括号内的逗号分隔值出现。列表的数据项不需要具有相同的类型,接下来简单的介绍一下python中列表这种数据类型的常用操作# -*- coding: utf-8 -*-"""pythonCreated on Sat Aug 18 20:37:43 2018@author: aoanng"""## 创建列表# 创...

2018-08-19 00:30:55 1391

转载 基于深度学习的目标检测技术演进:从目标检测到人脸检测

本篇博客主要转载两篇写得好的分别介绍基于深度学习的目标检测和人脸检测的文章,最近在调研基于深度学习的人脸检测相关的文章,在网上查相关资料时,有幸看到。文末附带基于深度学习的目标检测和人脸检测相关经典文献及下载地址。基于深度学习的目标检测技术演进:R-CNN、Fast R-CNN、Faster R-CNNobject detection我的理解,就是在给定的图片中精确找到物体所在位置,并...

2018-07-29 20:54:04 5133 2

原创 python直接赋值、浅拷贝与深拷贝的区别解析

直接赋值:其实就是对象的引用(别名)。浅拷贝(copy):拷贝父对象,不会拷贝对象的内部的子对象。深拷贝(deepcopy): copy 模块的 deepcopy 方法,完全拷贝了父对象及其子对象。实例解析 a = {1: [1,2,3]} 1. b = a: 赋值引用,a 和 b 都指向同一个对象,如下图: 2. b = a.copy(): 浅拷贝, a 和 b 是一个独...

2018-07-28 18:44:21 5273 3

转载 python--闭包与装饰器简介

不管是闭包函数还是装饰器,都是基于函数的。我们知道,函数名其实就是指向一段内存空间的地址,既然是地址,那么我们可以利用这种特性。满足以下三点中的两点即称为高级函数:1,函数名可以作为一个值 函数名可以作为一个值即可以将一个函数名赋值给一个变量,此时该变量拥有和函数同样的功能,如下所示:In: abs(-1)Out: 1In: a = absIn: a(-1)Out: 1...

2018-07-28 18:17:24 218

原创 python中的下划线"_"讲解

python中,下划线 "_""_"" \_" 不管是单独作为变量名或者作为变量名的前缀或者后缀,是有特殊含义的,下面简要的来总结一下。1, 单下划线 "_""_"

2018-07-28 16:31:30 7755

原创 专利撰写概述

最近准备将前几个月在项目中做出的一些成果整理成专利发表,看了前几届师兄师姐发表的专利以及从网上下载本领域的相关专利来看,不得不说,专利的撰写是遵从一定的规律的,有相关的模板以及套路。就在前几天我刚完我的第一篇专利,这里简要的总结一下撰写流程以及撰写过程中的一些注意事项以备不时之需。定义:专利(patent),从字面上是指专有的权利和利益。“专利”一词来源于拉丁语Litterae pat...

2018-07-19 16:36:23 7733

转载 机器学习--逻辑回归

1、总述逻辑回归是应用非常广泛的一个分类机器学习算法,它将数据拟合到一个logit函数(或者叫做logistic函数)中,从而能够完成对事件发生的概率进行预测。2、由来要说逻辑回归,我们得追溯到线性回归,想必大家对线性回归都有一定的了解,即对于多维空间中存在的样本点,我们用特征的线性组合去拟合空间中点的分布和轨迹。如下图所示:线性回归能对连续值结果进行预测,而现实生活中常见的另...

2018-07-03 22:38:46 295

转载 机器学习优化问题-经验风险、期望风险、结构风险

经验风险:对所有训练样本都求一次损失函数,再累加求平均(平均损失)。即,模型f(x)对训练样本中所有样本的预测能力。Rexp=1N∑i=1NL(yi,f(xi))Rexp=1N∑i=1NL(yi,f(xi))R_{exp} = \frac{1}{N}\sum_{i=1}^{N}L(y_i,f(x_i))所谓经验风险最小化即对训练集中的所有样本点损失函数的平均最小化。经验风险越小说明模型...

2018-07-03 18:07:08 351 1

原创 数据结构--python实现链表结构

在c++中,我们以指针的形式直接访问数据的地址,在这些较为现代的预言中,单链表结构中的一个节点,包含了一个数据项和指针值。一个特殊的空值(或nil),表示指针值是一个空链接。我们并不使用数组来构建不连续的内存,而是直接向计算机请求一个指针指向一个新的节点,这个节点来自于名为对象堆的一个内建的不连续内存区域。然后,我们在该节点中设置了指向另一个节点的指针,由此建立了到结构中的其他数据的一个链接。然而...

2018-07-02 19:03:01 8205 2

转载 python自省机制

什么是自省?在日常生活中,自省(introspection)是一种自我检查行为。自省是指对某人自身思想、情绪、动机和行为的检查。伟大的哲学家苏格拉底将生命中的大部分时间用于自我检查,并鼓励他的雅典朋友们也这样做。他甚至对自己作出了这样的要求:“未经自省的生命不值得存在。”无独有偶,在中国《论语》中,也有这样的名言:“吾日三省吾身”。显然,自省对个人成长多么重要呀。在计算机编程中,自省是指这...

2018-06-25 20:45:05 1995

原创 常见排序算法(附python代码)

1. 选择排序从待排序的数据元素(列表)中选出最小(或最大)的一个元素,存放在序列的起始位置,然后算法回到下一个位置重复这个过程,直到全部待排序的数据元素排完。def selectionSort(lyst): i = 0 while i < len(lyst) - 1: minIndex = i j = i+1 #...

2018-06-20 23:28:48 344

转载 机器学习中的优化算法介绍

在机器学习中,有很多的问题并没有解析形式的解,或者有解析形式的解但是计算量很大(譬如,超定问题的最小二乘解),对于此类问题,通常我们会选择采用一种迭代的优化方式进行求解。   这些常用的优化算法包括:梯度下降法(Gradient Descent),共轭梯度法(Conjugate Gradient),Momentum算法及其变体,牛顿法和拟牛顿法(包括L-BFGS),AdaGrad,Adadel...

2018-06-14 15:43:13 832

原创 机器学习中的范数理解(L0,L1,L2)

监督机器学习就是规则化参数的同时最小化误差。有监督学习的样本都是带有标签的样本,用 yyy 来表示样本的标签,我们通过算法来提取样本特征并对其进行分类或回归,得到结果 y1=WTxy1=WTxy_1 = W^Tx, 这里xxx为样本、WWW 即是参数,此时有目标函数 z=y−y1z=y−y1z = y - y_1,我们希望对于相同的样本,其结果输出与其标签一样,于是我们通过优化算法使得zzz ...

2018-06-13 20:42:30 5092

原创 时间复杂度与空间复杂度

算法的 “时间复杂度” 和“空间复杂度”合称为算法的复杂度。时间复杂度时间复杂度的定义可以参考以下我列下的几篇博客。计算机科学家用于表示用于一个算法的效率或计算复杂度的一种表示法,叫作大O表示法(big-O notation)。“O”表示“on the order of(在……阶)”,这是对算法工作量的复杂度的级别的一种表示。例如,一个线性时间算法的阶是O(n)。大O表示法将我们队复杂...

2018-06-09 21:13:56 3857

原创 CMC曲线(python代码实现)

在看人脸识别相关的paper时,常会遇到有的文献除了ROC曲线外,也会将CMC曲线作为他们的实验性能指标。那么,怎么理解CMC曲线呢?我在网上查阅了一些资料,为了方便理解,举例如下:假如我们训练好了一个3分类的模型,分别为类别c1,c2,c3。每个样本输入模型后会得到对应的3个匹配分数,匹配分数最高的那个类别即是预测的类别数。针对单样本: 现在我们手头仅有一个属于类别c1的样本,我们将...

2018-05-26 18:15:21 5187 4

转载 文本文件和二进制文件的差异和区别

广义上的二进制文件包括文本文件,这里讨论的是狭义上的二进制文件与文本文件的比较:能存储的数据类型不同 文本文件只能存储char型字符变量。二进制文件可以存储char/int/short/long/float/……各种变量值。每条数据的长度 文本文件每条数据通常是固定长度的。以ASCII为例,每条数据(每个字符)都是1个字节。进制文件每条数据不固定。如short占两个字节,int占四个字...

2018-05-16 11:11:20 57282 22

原创 python函数参数总结

定义函数的时候,我们把参数的名字和位置确定下来,函数的接口定义就完成了。对于函数的调用者来说,只需要知道如何传递正确的参数,以及函数将返回什么样的值就够了,函数内部的复杂逻辑被封装起来,调用者无需了解。Python中的函数定义虽然简单,但是灵活度却很大,这里来总结一下。python中函数传递的方式大致有以下四种方式:**位置参数(必选参数)****默认参数****可变参数...

2018-05-14 22:24:54 375

原创 计算机视觉领域常见期刊和会议

会议:ICCV: IEEE International Conference on Computer Vision(每两年举办一次,由IEEE主办,百度百科:https://baike.baidu.com/item/iccv/7054436?fr=aladdin,ICCV 2017:http://iccv2017.thecvf.com/)CVPR: IEEE Conference on C...

2018-05-14 18:56:09 11519

原创 python中匿名函数lambda使用

在高阶函数中,会传入函数作为变量,有些时候,不需要显示地定义函数,直接传入匿名函数更方便。 下面简单的讲解python中匿名函数的使用方法:如我们要计算f(x)=x2f(x)=x2f(x)=x^2时,匿名函数为:In: a = lambda x: x * xIn: a(4)Out: 16通过对比可以看出,匿名函数lambda x: x * x实际上就是:def f(x...

2018-05-07 10:59:39 590

原创 如何使用pip安装特定版本的python第三方包

python的包管理器pip特别好用,我们可以使用它来方便的安装第三方包,但是怎样使用pip来安装特定版本的第三方包呢?安装好python后,包管理器pip就已经安装好了,在windows控制台cmd中输入pip就可以查阅到pip一些常用用法,如:pip install package#这里package即为第三方包的名称,如tensorflow,使用这种安装方式会安装最新版本的包...

2018-05-03 16:28:45 36607

原创 python中内置os模块总结

os模块在python中属于内置模块,即不需要额外安装。os模块提供了非常丰富的方法来处理文件和目录。我这里仅仅是列举其中常用的一些方法以供自己以后方便查阅。 使用os模块之前,先导入它,即:In: import os输出当前正在使用的平台In: os.nameOut: 'nt'#若是Windows则输出'nt',若是Linux/Unix,则是'posix'...

2018-05-01 22:11:51 9558

转载 机器学习中常见的损失函数

常见的待见函数和损失函数是同一个意思,目标函数是一个与他们相关但更广的概念,对于目标函数来说在有约束条件下的最小化就是损失函数(loss function)。我们用训练集训练一个模型时,常见情况是寻找一个损失函数,然后使用优化算法如梯度下降算法让该损失值最小,然后结束迭代即模型就训练好了,之后便是拿测试集来测试该模型的鲁棒性。当然具体问题具体分析,真正训练模型时需要考虑的点蛮多的,这里...

2018-04-23 22:11:16 1012

转载 机器学习中常见的防止过拟合处理方法

本文转自这里:https://blog.csdn.net/heyongluoyao8/article/details/49429629过拟合  我们都知道,在进行数据挖掘或者机器学习模型建立的时候,因为在统计学习中,假设数据满足独立同分布(i.i.d,independently and identically distributed),即当前已产生的数据可以对未来的数据进行推测与模拟,因此...

2018-04-23 19:17:24 5368

原创 softmax多分类回归模型

softmax回归模型为logistic回归模型在多分类问题上的推广。假设我们有一个数组V,Vi是V中的第i个元素,那么这个元素的softmax值就是: 也就是说,是该元素的指数与所有元素指数和的比值。由该公式我们可计算得到数组V中的所有元素值所对应的softmax值,且这些值相加正好等于1,我们可称为这些值为每个元素所对应的概率值,根据该概率值即可以实现分类,最大的概率值所...

2018-04-22 19:53:54 3313

原创 混淆矩阵(confusion matrix)理解

在机器学习中,当我们使用预先分配好的训练集训练好一个模型后,此时我们会使用预先分配好的测试集来检测我们训练好的这个模型怎么样?评价模型好坏的指标有很多,具体可以参见我以前的一篇博客: 如何理解误识率(FAR)拒识率(FRR),TPR,FPR以及ROC曲线,很常见的一个指标便是ROC曲线,它是在不同阈值的前提下以fpr以横坐标、tpr为纵坐标的二维坐标图。当我们用测试集去测试模型好坏时,输出会是...

2018-04-21 22:12:20 23266

原创 python的模块查找路径

python中每一个 .py文件即为一个模块,当我们想使用第三方模块时,首先则是使用import将模块导入进来,但是import会在哪些路径里寻找模块呢,接下来总结一下: 简单的说我们可以使用一下代码查看模块所在路径:import sysprint(sys.path)返回的结果是一个列表,该列表中列出了寻找模块时的路径,列表中的内容基本上来自以下几个来源:当前文件夹路径PY...

2018-03-23 20:24:22 5361

原创 .tsv以及.csv格式文件

机器学习中,我们在使用一些经典的分类器对数据进行分类时,需要对数据进行一些必要的预处理。或者我们在使用别人提供的数据使用一些经典的机器学习算法进行学习时,一般常见的数据格式会是.tsv和.csv格式,那么这两种格式究竟是什么以及他们之间有什么区别呢?下面简单的介绍一下:TSV:tab separated values;即“制表符分隔值”,如:name age张三 20...

2018-03-11 20:16:05 30174 1

原创 VS(Visual Studio)与VC(Visual C++)版本对应关系

本科时学c语言最早接触的c,c++开发环境是经典的VC++ 6.0,后来又用上了VS开发环境学习c++;再后来接触深度学习,安装python的第三方包的时候,某些python第三方包要求电脑上需装有vc 14版本编程环境,那么vc版本与vs之间是什么关系呢,下面简单的介绍下方便以后查阅。C++是一门编程语言。VC全名是Microsoft Visual C++是微软出的一个集成的c,c+...

2018-03-09 11:52:52 68647 6

朴素贝叶斯分类原理及Python实现简单文本分类

博客https://blog.csdn.net/colourful_sky/article/details/72793254中的代码,Nbayes_lib.py,以及Nbayes.py

2018-05-14

一天搞懂深度学习

这是台湾教授李宏毅教授的一天搞懂深度学习ppt,已经转换成pdf,共268页,讲的非常细致且生动,非常适合新手入门以及老手温习,欢迎下载。

2018-04-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除