自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 资源 (2)
  • 收藏
  • 关注

原创 Python中的正则表达式

Python中有一个re模块,每次要使用正则表达函数是必须导入re模块。下面介绍一些re模块中常用的一些函数:re.match()尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就会返回None。re.match(pattern,string,flag=0)pattern:匹配的正则表达式string:要匹配的字符串flag:标志位,用于控制正则表达式的...

2019-02-26 10:34:48 209

原创 感知机

感知机是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值。感知机对应于输入空间(特征空间)中将实例划分为正负两类的分离超平面,属于判别模型。假设输入空间(特征空间)是x⊆R^n,输出空间是y={+1,-1}。输入x∈X表示实例的特征向量,对应于输入空间(特征空间)的点,输出y∈Y表示实例的类别。由输入空间到输出空间的如下函数f(x)=sign(w*x+b)称为感...

2019-02-23 15:57:39 1287

原创 统计学习方法概论

统计学习的也称为统计机器学习。统计学习的对象是数据。数据包括存在于计算机及网络上的各种数字、文字、图像、音频数据及它们的组合。统计学习由监督学习、非监督学习、半监督学习和强化学习等组成。统计学习方法包括模型的假设空间、模型选择的准则以及模型学习的算法。简称为模型、策略和算法。监督学习的基本概念在监督学习中,将输入与输出所有可能取值的集合分别称为输入空间和输出空间。每一个具体的输入是一个...

2019-02-21 19:09:33 238

原创 正则表达式学习-简单的模式匹配

本章节可以在http://gskinner.com/RegExr上试验,并不是所有的正则表达式处理器都能识别这些简写式,具体问题具体分析,先简单了解下\d:会匹配数字字符<=>[0-9]\D:会匹配非数字字符<=>[^0-9]\w:会匹配所有的单词字符\D与\w的区别是\D会匹配空格、标点符号(引号、连字符、反斜杠、方括号),\w只会匹配字母、数字和下划线。在英语环...

2019-02-18 19:13:15 168

原创 正则表达式学习-什么是正则表达式

正则表达式[0-9]对正则表达式处理器传递的信息是“匹配0到9范围内的任意数字”。正则表达式将方括号视为特殊的元字符,因此方括号不参与匹配。元字符是在正则表达式中有特殊含义的字符,也是保留字符。[0-9]这种形式的正则表达式称作字符组,有时也叫字符集。[012789]这个字符组只会匹配列出0、1、2、7、8、9比如我们要匹配一个北美电话号码:707-827-7019,我们可以使用[0-9]来...

2019-01-23 16:23:29 773

原创 聚类

聚类聚类属于无监督学习,训练样本的标记信息是未知的,目的是通过对无标记训练样本的学习来揭示数据的内在性质及规律,然后对训练样本进行分类。聚类试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集称为一个“簇”。同一簇的样本尽可能彼此相似,不同的样本尽可能不同。换言之,聚类结果的“簇内相似度”高且“簇间相似度”低。聚类性能度量大致分为两类。一类是将聚类结果与某个“参考模型”进行比较,称为...

2018-12-06 15:24:07 1142

原创 线性回归

利用Logistic回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。

2018-12-06 14:40:13 138

原创 决策树

决策树决策树是基于树结构来进行决策的。决策树学习的目的是为了产生一颗泛化能力强,即处理未见示例能力强的决策树。决策树的生成是一个递归过程。在决策树基本算法中,有三种情形会导致递归返回:(1)当前结点包含的样本全属于同一类别,无需划分;(2)当前属性集为空,或是所有样本的所有属性上取值相同,无法划分;(3)当前结点包含的样本集合为空,不能划分。信息熵是度量样本集合纯度最常用的一种指标。假定当前...

2018-11-17 20:22:25 803

原创 利用AdaBoost元算法提高分类性能

一、元算法元算法是对其他算法进行组合的一种方式。我们自然可以将不同的分类器组合起来,而这种组合结果则被称为集成算法或者元算法。集成学习的结果通过投票法产生,即“少数服从多数”从这个例子中得出:要获得好的集成,个体学习器应“好而不同”,即个体学习器要有一定的“准确性”,即学习器不能太坏,并且要有“多样性”,即学习器间具有差异。使用集成方法时会有很多种形式:可以是不同算法的集成,也可以是同一...

2018-11-17 15:33:27 419

原创 Python学习-第八章 异常

异常Python使用异常对象来表示异常状态,并在遇到错误时引发异常。异常对象未被处理(或捕获)时,程序将终止并显示一条错误消息。类名描述Exception几乎所有的异常类都是从它派生而来的AttributeError引用属性或给它赋值失败时引发OSError操作系统不能执行指定的任务(如打开文件)时引发,有多个子类keyError使用映射中不存在的...

2018-10-24 11:03:39 262

原创 K-近邻算法

k-邻近算法k-邻近算法采用测量不同特征值之间的距离方法进行分类。优点:精度高、对异常值不敏感、无数据输入假定。缺点:计算复杂度高、空间复杂度高。适用数据范围:数值型和标称型。工作原理:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比比较,然后算...

2018-10-23 13:05:51 344 1

原创 Python学习-第六章 抽象

抽象内置函数callable可以判断某个对象是否可调用>>> import math>>> x=1>>> y=math.sqrt&am

2018-10-21 15:47:02 165

原创 Python学习-第五章 条件、循环及其他语句

条件、循环及其他语句

2018-10-21 13:51:47 170

原创 Python学习-第四章 索引

当索引行不通时字典是Python中唯一的内置映射类型,其中的值不按顺序排列,而是存储在键下。键可能是数、字符串或元组。Python字典的一些用途:表示棋盘的状态,其中每个键都是由坐标组成的元组;存储文件修改时间,其中的键为文件名;数字电话/地址簿>>> phonebook={'Alice':'2341','Beth':'9102','Cecil':'3258'}...

2018-10-17 20:11:28 169

原创 Python学习-第三章 字符串

使用字符串字符串是不可变的,因此所有元素赋值和切片赋值都是非法的。>>> format="Hello,%s.%s enough for ya?">>> values=('world','Hot')>>> format%values'Hello,world.H

2018-10-14 20:32:29 218

原创 Python学习-第二章 列表和元组

列表和元组在Python中,最基本的数据结构为序列。Python内置了多种序列,最常用的两种:列表和元组。列表和元组的主要不同在于,列表是可以修改的,而元组不可以。...

2018-10-14 18:49:51 183

原创 Python基础教程-第一章 快速上手:基础知识

快速上手:基础知识除法运算的结果为小数,即浮点数>>>1/20.5如果执行整除运算可以使用双斜杠>>>1//20内置函数round将浮点数圆整为与之最接近的整数,并在两个整数一样近时圆整到偶数。>>>round(2/3)1.0math模块中的floor是求小于或等于给定数的最大整数。而ceil则返回大于或等于给定数的最...

2018-10-13 11:31:45 199

原创 算法导论-动态规划

动态规划算法动态规划(dynamic programming)是通过组合子问题来求解原问题的方法,它应用于解决子问题重叠的情况,即不同子问题具有公共的子问题。通常动态规划可以按照如下四个步骤进行设计:1.刻画一个最优解的结构特征;2.递归地定义最优解的值;3.计算最优解的值,通常采用自底向上的方法;4.利用计算出的信息构造一个最优解(按照要求,可有可无)。一、钢条切割问题自顶...

2018-10-07 16:06:51 2943

垃圾邮件分类

本代码是利用朴素贝叶斯算法实现的垃圾邮件分类,本代码包括代码部分和垃圾邮件及正常邮件数据集

2018-11-19

KNN算法的代码

KNN近邻算法的应用,第一个应用是简单的一个测试,第二个应用是改进约会网站的配对效果,第三个应用是手写识别系统

2018-10-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除