自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(38)
  • 资源 (7)
  • 收藏
  • 关注

转载 数值型数据和标称型数据

在学习机器学习的工程中,发现有一种名为标称型的数据,具体如下:标称型:一般在有限的数据中取,而且只存在‘是’和‘否’两种不同的结果(一般用于分类)数值型:可以在无限的数据中取,而且数值比较具体化,例如4.02,6.23这种值(一般用于回归分析)...

2018-03-28 20:21:47 656 2

转载 数据预处理

https://www.cnblogs.com/serena45/p/5559122.html.原始数据存在的几个问题:不一致;重复;含噪声;维度高。2.数据预处理包含数据清洗、数据集成、数据变换和数据归约几种方法。3.数据挖掘中使用的数据的原则应该是从原始数据中选取合适的属性作为数据挖掘属性,这个选取过程应参考的原则是:尽可能赋予属性名和属性值明确的含义;统一多数据源的属性值编码...

2018-03-26 20:30:36 704

原创 内置sum() 和numpy .sum() 函数

aaa

2018-03-26 13:54:29 497

原创 numpy shape函数

shape函数是numpy.core.fromnumeric中的函数,它的功能是查看矩阵或者数组的维数

2018-03-23 16:16:36 362 1

转载 python map

*map* map(function, iterable, …)对可迭代函数’iterable’中的每一个元素应用‘function’方法,将结果作为list返回。 注意: Python 2.x 返回列表。 Python 3.x 返回迭代器。如果函数有多个参数, 但每个参数的序列元素数量不一样, 会根据最少元素的序列进行...

2018-03-23 08:42:07 502

转载 input() 和raw_input()

在Python3.X版本中,input()函数接收所有输入,并默认将所有的输入都看作字符串来处理,返回字符串类型。python3删除了raw_input()函数在python2.x中raw_input( )和input( ),两个函数都存在,其中区别为 raw_input( )—将所有输入作为字符串看待,返回字符串类型input( )—–只能 接收“数字”的输入,在对待纯数字输入时具有自...

2018-03-22 22:17:10 212

转载 if __name__ == '__main__'

if name == ‘main‘的意思是:当.py文件被直接运行时,if name == ‘main‘之下的代码块将被运行;当.py文件以模块形式被导入时,if name == ‘main‘之下的代码块不被运行。在Python中,一个.py文件就是一个模块,一般情况下,模块的名字就是文件名(不包括扩展名.py)。...

2018-03-22 21:34:45 177

转载 isinstance,issubclass

issubclass函数与isinstance 函数比较接近,isinstance 函数是判断一个实例对象与类的关系,issubclass函数判断类与类的关系。 并且isinstance 函数可以接受任何类型实例,但issubclass函数不行,会输出TypeError异常...

2018-03-19 20:50:42 335

原创 卡方分布

卡方检验能判断两个分布是否一致

2018-03-16 09:48:43 380

转载 numpy min()

min() max()类似的

2018-03-15 21:26:12 1456 1

转载 numpy的tile()函数

http://blog.csdn.net/wy250229163/article/details/52453201 侵删

2018-03-15 21:09:51 179

转载 reload()

在python2中,reload()是内置函数,能够直接使用。但是在python3中,直接使用reload()会报错,需要从imp中导入

2018-03-15 17:12:25 782 1

转载 readline() read() readlines()

https://www.cnblogs.com/qi09/archive/2012/02/10/2344964.html 读取文本对象的三种方法。 每种方法可以接受一个变量以限制每次读取的数据量,但它们通常不使用变量。 .read() 每次读取整个文件,它通常用于将所有的文件内容放到一个字符串变量中。readline() 和 .readlines() 之间的差异是后者一次读取整个文件,...

2018-03-15 17:12:01 1682

原创 numpy

两行四列的矩阵 在python命令提示符下,引入python文件的时候,不加后缀名。 数组的size()函数 如何创建数组采用np.array()创建时需要几个维度就要用几个[ ]括起来,这种创建方式要给定数据shape()函数...

2018-03-15 15:35:15 119

转载 协方差与相关系数

参考自知乎https://www.zhihu.com/question/20852004协方差公式: 协方差表示两个变量X和Y的同向变化情况,如果是正的,表示同向变化,负的表示反向变化,越大表示相关性越大。 如果某一时刻的协方差为负数,也不一定说明他们反向运动,具体要结合整体情况来判断。 协方差很像点积相关系数公式: 相关系数也可以看成协方差:一种剔除了两个变量量纲影响、标...

2018-03-12 22:09:07 8363

转载 正则化

正则化是为了防止过拟合, 进而增强泛化能力

2018-03-09 20:03:25 133

原创 unhashable type: 'list'

def loadDataSet(): postingList = [['my', 'dog', 'has', 'flea', 'problem', 'help', 'please'], ['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stupid'], [...

2018-03-06 19:50:43 2198

转载 keys(), values(), items()

Python3的keys(), values(), items()返回的都是迭代器,如果需要像Python2一样返回列表,只要传给list就行了

2018-03-06 15:22:37 293 1

原创 待研究的东东

朴素贝叶斯和贝叶斯估计得区别(统计学习方法 47页提到)P问题,NP问题。。统计学习方法57页提到https://www.zhihu.com/question/23468713?sort=created 可微和可导的区别http://jacoxu.com/jacobian%e7%9f%a9%e9%98%b5%e5%92%8chessian%e7%9f%a9%e9%98%b5/ 雅克...

2018-03-06 14:48:47 178

转载 进程 线程 协程

进程就是一个程序在一个数据集上的一次动态执行过程。 进程一般由程序、数据集、进程控制块三部分组成。我们编写的程序用来描述进程要完成哪些功能以及如何完成;数据集则是程序在执行过程中所需要使用的资源;进程控制块用来记录进程的外部特征,描述进程的执行变化过程,系统可以利用它来控制和管理进程,它是系统感知进程存在的唯一标志。线程是在进程之后发展出来的概念。 线程也叫轻量级进程,它是一个基本的CPU执行...

2018-03-05 21:10:56 98

转载 指示函数

数学中,指示函数是定义在某集合X上的函数,表示其中有哪些元素属于某一子集A。   指示函数有时候也称为特征函数

2018-03-05 20:12:24 2104

转载 近似误差 与 估计误差

统计学习方法中说:k值越小,学习的近似误差(approximation error)越小,估计误差(estimation error)越大,反之则相反http://blog.csdn.net/weixin_37895339/article/details/78794190 近似误差:可以理解为对现有训练集的训练误差。 估计误差:可以理解为对测试集的测试误差。*近似误差关注...

2018-03-05 16:59:53 5245

原创 最长公共子序列 待研究

def lcs_len(a,b): c = [[0 for j in b] for i in a] for i in range(len(a)): for j in range(len(b)): if i==0 or j==0: continue if a[i]==b[j]:...

2018-03-04 20:24:26 136

转载 utf-8 和 cp936的区别

链接:https://www.zhihu.com/question/35609295/answer/63780022 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。CP936和UTF-8本身和Python是毫无关联的。 CP936其实就是GBK,IBM在发明Code Page的时候将GBK放在第936页,所以叫CP936。至于GBK,百度百科就说的很...

2018-03-04 15:27:28 36532

转载 gram矩阵

ll

2018-03-04 14:51:09 312

转载 python __init_()

所有的类都会隐式的继承object类。

2018-03-04 14:50:34 195

转载 联合概率分布 条件概率分布 边缘概率分布 待修改

http://blog.csdn.net/thither_shore/article/details/52192553

2018-03-02 15:51:05 578

转载 python 推导式

http://blog.csdn.net/chenKFKevin/article/details/74753072举例说明 “`

2018-03-02 14:01:04 122

转载 Python中 sys.argv[]的用法

https://www.cnblogs.com/aland-1415/p/6613449.html

2018-03-02 10:55:57 385

转载 编码问题总结 utf-8 ASCII Unicode

https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001431664106267f12e9bef7ee14cf6a8776a479bdec9b9000

2018-03-01 21:04:31 157

转载 python 命名

http://blog.sina.com.cn/s/blog_62f28d560100xpva.htmlPython把以两个或以上下划线字符开头且没有以两个或以上下划线结尾的变量当作私有变量。私有变量会在代码生成之前被转换为长格式(变为公有)。转换机制是这样的:在变量前端插入类名,再在前端加入一个下划线字符。这就是所谓的私有变量轧压(Private name mangling)。”py...

2018-03-01 10:20:00 179

原创 报错:object() takes no parameters

init函数名,两边的下划线是两个,只有一个会报错

2018-03-01 09:56:36 181

原创 除法不同

Python2 中除法默认向下取整,因此 1/2 = 0,为整型。For (plain or long) integer division, the result is an integer. The result is always rounded towards minus infinity: 1/2 is 0, (-1)/2 is -1, 1/(-2) is -1, and (-1)/(...

2018-02-28 21:37:13 169

原创 range函数

python3中:range() 函数返回的是一个可迭代对象(类型是对象),而不是列表类型,。list() 函数是对象迭代器,把对象转为一个列表。返回的变量类型为列表。

2018-02-28 11:21:38 514 1

转载 true-positive,false-positive,true-negative,false-negative差别

考虑一个二分问题,即将实例分成正类(positive)或负类(negative)。对一个二分问题来说,会出现四种情况。如果一个实例是正类并且也被 预测成正类,即为真正类(True positive),如果实例是负类被预测成正类,称之为假正类(False positive)。相应地,如果实例是负类被预测成负类,称之为真负类(True negative),正类被预测成负类则为假负类(false n

2017-12-23 16:31:29 720

原创 双系统安装问题

安装win8+ubuntu,安装完成后直接进入ubuntu系统,解决办法:在ubuntu终端运行:sudo update-grub重启解决

2017-11-14 21:58:18 126

转载 linux学习

安装ubuntu时候,分区,提示分区不可使用:方法:分区的时候先创建交换空间、逻辑分区的/boot和/home,这3个分区创建好了再创建主分区的/,就可以了只设置一个/ ,也可以安装完成...

2017-11-14 21:56:57 121

转载 python小白入坑

空白在Python中是重要的。事实上行首的空白是重要的。它称为缩进。在逻辑行首的空白(空格和制表符)用来决定逻辑行的缩进层次,从而用来决定语句的分组。这意味着同一层次的语句必须有相同的缩进。每一组这样的语句称为一个块。我们将在后面的章节中看到有关块的用处的例子。

2017-03-14 14:39:26 176

PSO优化的BP神经网络——python实现

自己写的,编程渣渣,写的很乱,但也基本实现了,仅供参考。有朋友可以联系我相互讨论学习,

2019-03-08

SEA 数据集

sea数据集,或者叫schonlau数据集, 差不多的,用于内部威胁检测,等等,有需要其他日志数据的请联系我 

2018-06-26

prefixspan 算法实现 python3

prefixspan算法的实现, python3的,是将https://download.csdn.net/download/u012202808/9961002稍微修改了下,混积分,谢谢

2018-05-23

CSIC2010日志

给翻不了墙的同学用,进攻参考学习。。。。。。。。。。。。。。。。。。。

2018-05-15

ADFA-LD数据集

ADFA官网链接挂了,资源找了好久,上传上来水点积分。只有ADFA—LD,找不到WD的,仅供学习参考。

2018-05-15

网络安全 日志数据集 总结

kdd99等的描述,国内外各大资源。

2018-04-30

python plotly 包

官网下载太费劲儿,上传赚积分,方便大家下载。

2018-04-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除