自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(143)
  • 资源 (2)
  • 收藏
  • 关注

转载 anaconda安装之后,一定要设置环境变量

D:\python\Anaconda3 D:\python\Anaconda3\ScriptsD:\Anaconda\Library\bin 总结来说,要想在cmd的任意路径下使用conda命令,应当至少将Anaconda的安装路径、该路径下的Scripts目录以及Library\bin目录一同添加到环境变量中。 于是可得添加环境变量的完整路径: D:\Anacond...

2018-12-25 21:22:31 65137 16

转载 embedding到底进行了什么操作

用word embeddding  可以将一个词转换成固定长度的词向量表示!word embedding 给每个单词分配一个固定长度的向量表示!好博客:英文解释很清晰https://jalammar.github.io/illustrated-transformer/ This softmax score determines how much how much each wo...

2018-12-25 21:19:41 1268

转载 使用sklearn做单机特征工程

资料来自http://www.cnblogs.com/jasonfreak/p/5448385.html目录1 特征工程是什么?2 数据预处理  2.1 无量纲化    2.1.1 标准化    2.1.2 区间缩放法    2.1.3 标准化与归一化的区别  2.2 对定量特征二值化  2.3 对定性特征哑编码  2.4 缺失值计算  2.5 数据变换  2.6 回顾...

2018-12-20 21:16:23 224

转载 五分钟带你入门TensorFlow tf的下载 安装 简单入门介绍等

https://www.jianshu.com/p/2ea7a0632239TensorFlow是Google开源的一款人工智能学习系统。为什么叫这个名字呢?Tensor的意思是张量,代表N维数组;Flow的意思是流,代表基于数据流图的计算。把N维数字从流图的一端流动到另一端的过程,就是人工智能神经网络进行分析和处理的过程。话说在Android占领了移动端后,Google开源了TensorFlow...

2018-05-21 10:42:26 920 1

原创 scp命令同步多个文件

[email protected]:/wls/applogs/suxiaoming380/code_0420_ajslf/reg/\{extract_function_reg.xlsx,plaintiff_defendant_function_reg.xlsx,reg_casefee_1.txt,reg_casefee_2.txt\}./

2018-05-09 16:07:56 8360

原创 windows下如何用pip命令安装python 软件包 库

   1. 先安装wheel   进入下载目录,安装wheel  2. pip install   ***安装需要的软件包1.用管理员方式打开cmd2.首先通过pip命令安装wheel 如果提示’pip’不是内部或外部命令,也不是可运行的程序或批处理文件①将python安装目录下的scripts目录(例如D:\Python27\Scripts)添加到系统环境变量path里,注意前加分号。再执行该命...

2018-03-27 20:41:07 1452

原创 判别模型 vs 生成模型

判别模型: 判决属于哪一类,计算 条件概率。生成模型:计算 联合概率。需要加上贝耶斯法则,然后应用到分类中。概率分布。 生成模型是模拟这个结果是如何产生的,然后算出产生各个结果的概率两种模型都会告诉你最后的label标签 ,类别结果。但是生成模型会告诉一个概率。生成模型会告诉你关于数据的一些统计信息(p(x|y) 分布 etc.)判别模型: 决策树 (不是这个就是那个...

2018-03-26 19:43:54 345

转载 论文笔记 Neural Architectures for Named Entity Recognition

NLP论文笔记1:Neural Architectures for Named Entity Recognition原创 2017年12月26日 18:31:14标签:BILSTM-CRF458看这一篇论文的主要目的是看BILSTM-CRF模型,对于实际应用,CRF看分词、BILSTM-CRF做NER,接下来通过BILSTM-CNN-CRF做序列标注,NLP几个基本的应用也差不多了,句法分析貌似比...

2018-03-26 09:51:42 568

转载 LSTM结构理解与python实现

转自:http://blog.csdn.net/flyinglittlepig/article/details/72229041LSTM结构理解与python实现上篇博客中提到,简单的RNN结构求解过程中易发生梯度消失或梯度爆炸问题,从而使得较长时间的序列依赖问题无法得到解决,其中一种越来越广泛使用的解决方法就是 Long Short Term Memory network (

2017-12-18 15:23:57 11653 2

原创 python按行写入到文件 另存为文件

f = open('./result/new.xml','a+')for line in content:     text = ['\n',line,'\n']     f.writelines(text)     print text

2017-06-30 15:33:29 3020

转载 Python re 模块

Python通过re模块提供对正则表达式的支持。使用re的一般步骤是先使用re.compile()函数,将正则表达式的字符串形式编译为Pattern实例,然后使用Pattern实例处理文本并获得匹配结果(一个Match实例),最后使用Match实例获得信息,进行其他的操作。import repattern = re.compile('[a-zA-Z]')result =

2017-06-29 18:49:16 287

翻译 python 资源大全 摘要

http://www.cnblogs.com/groundsong/p/6549758.htmlPDFPDFMiner:一个用于从PDF文档中抽取信息的工具。官网PyPDF2:一个可以分割,合并和转换 PDF 页面的库。官网ReportLab:快速创建富文本 PDF 文档。官网用于进行网页内容提取的库。Haul:一个可以扩展的图像爬取工具。官网htm

2017-06-29 09:45:24 364

翻译 python 下划线 函数 解释

加下划线的函数会自动运行Python中所有的类成员(包括数据成员)都是 公共的 ,所有的方法都是 有效的.可在其它类中使用.若变量名称为双下划线前缀,则为私有变量.如 __private,可以只在类  或 函数中使用,有效.__init__在类中被用做构造函数.

2017-06-27 16:30:09 746

转载 径向基(RBF)神经网络

径向基(RBF)神经网络2015-06-02 16:51 4033人阅读 评论(0) 收藏 举报RBF网络能够逼近任意非线性的函数。可以处理系统内难以解析的规律性,具有很好的泛化能力,并且具有较快的学习速度。当网络的一个或多个可调参数(权值或阈值)对任何一个输出都有影响时,这样的网络称为全局逼近网络。由于对于每次输入,网络上的每一个权值都要调整,从而导致

2017-04-10 12:21:03 841

转载 径向基函数(RBF)神经网络

本文摘自:《模式识别与智能计算——matlab技术实现第三版》与《matlab神经网络43个案例分析》【注】蓝色字体为自己的理解部分     径向基函数神经网络的优点:逼近能力,分类能力和学习速度等方面都优于BP神经网络,结构简单、训练简洁、学习收敛速度快、能够逼近任意非线性函数,克服局部极小值问题。原因在于其参数初始化具有一定的方法,并非随机初始化。        RBF是具有单隐层

2017-04-10 12:20:02 11654

原创 一个函数调用另一个函数,最好用参数传递。不然就得声明为全局变量。被调用的函数里边,变量前面写 global

一个函数调用另一个函数,最好用参数传递。不然就得声明为全局变量。被调用的函数里边,变量前面写 global

2016-12-16 14:37:48 6161

原创 python中 if __name__ == "__main__": 解析

个人总结:__name__  双下划线表示name为系统变量,是模块名字。此句话保证了,当前python代码,既可以被执行,也可以被调用。import若执行该文件。name == main  执行main下面的代码若该文件被其他模块调用。import 。 则 name = 该文件的名字。  不执行 main下面的代码。可以保证调试方便。分块调试。互不影响。转:其

2016-12-14 19:55:29 492

原创 Python编程常识 总结

1.if  else  一定后边有冒号if   :elif:else:2.return  False   大写第一个字母3.条件判断if ()  and ()  or ():

2016-12-14 19:40:15 414

转载 VI命令使用大全

从shell中启动可视化编辑器 vi filename 指示shell启动vi编辑器,并将参数filename传给它。如果当前目前中存在该文件,则vi编辑器将它解释为要打开的文件;如果没有该文件,则vi编译器创建新文件 vi file1 file2 file3 shell传递3个参数给vi,vi将它们解释为要打开的文件。可以使用:w命令保存文件,使用:n命令访问下一个文件 vi +#

2016-12-09 10:58:03 1940

原创 \\s+

详解 "\\s+"正则表达式中\s匹配任何空白字符,包括空格、制表符、换页符等等, 等价于[ \f\n\r\t\v]\f -> 匹配一个换页 \n -> 匹配一个换行符 \r -> 匹配一个回车符 \t -> 匹配一个制表符 \v -> 匹配一个垂直制表符而“\s+”则表示匹配任意多个上面的字符。另因为反斜杠在Java里是转义字符,所以在Java里,我们要这么用“\\s+”.

2016-12-02 15:10:03 406

原创 python chr() 函数

chr(kk) 函数,kk为整数,asc编码值,函数返回asc编码为kk 的对应的字符。 中间的参数可以是 八进制 十六进制 0x  等形式。chr(0x0a)>>\nchr(63)>>?

2016-12-02 15:02:36 6295

原创 python strip 函数

python 函数 strip()str.strip("stkf") 删除 字符串str 左右两边 的指定字符,只要字符序列在 stkf 中,就可以被删除。 中间 “” 中的字符串可以任意组合。    str.strip(" \n\t\r" + chr(0x0a) + " abc")str.lstrip()   左边的str.rstrip()  右边的

2016-12-02 14:50:31 373

原创 终于学会了看十六进制编码!! hexdump

十六进制  hexdump:bbe4 09b6 0a30 e40a 81b8 0a0a文本:件    0丁   文            tab     0     回车e4 bb b6    09    30     0a0a  回车     丁e4 b8 81     0a  回车0a  回车

2016-12-02 11:42:57 9646

原创 hexdump命令

hexdump 命令用来查看 文件的十六进制编码hexdump命令一般用来查看“二进制”文件的十六进制编码,但实际上它能查看任何文件,而不只限于二进制文件来自: http://man.linuxde.net/hexdumphexdump命令一般用来查看“二进制”文件的十六进制编码,但实际上它能查看任何文件,而不只限于二进制文件。来自: http://man.linuxd

2016-12-02 09:52:37 1243

原创 nohup命令

nohup command > myout.file 2>&1 &其中0 表示键盘输入 1表示屏幕输出 2表示错误输出.把标准出错重定向到标准输出, 最後一個& 表示 在後臺運行輸出重定向到 myout.file

2016-11-24 15:06:55 355

原创 linux刪除文件中空白行

shell 方法cat   filename | set -e '/^$/d' > filename

2016-11-24 11:00:07 1010

原创 linux 使程序在后台稳定运行 命令 nohup

如果只是临时有一个命令需要长时间运行,什么方法能最简便的保证它在后台稳定运行呢 用nohupnohup  python  test.py &      加& 表示默认输出到nohup.out 文件中  也可以">filename 2>&1"来重定向可用ps 命令查看进程   ps  ps -ef |grep largeFile显示所有进程信息,连同命令行

2016-11-08 14:39:41 517

原创 linux 上传本地文件到服务器

linux  上传本地文件到服务器命令:scp上传文件夹  scp  -r

2016-11-08 10:29:17 3891

转载 ubuntu 安装eclipse

补充:建立软链接     进去eclipse目录后  把jdk软链接进去  ln -s /opt/jvm/jdk1.8.0_101 jre1. 下载jdk , jdk-8u77-Linux-x64.tar.gz2.下载 eclipse  , eclipse-jee-mars-2-linux-gtk-x86_64.tar.gz注:我下载的都是64位的,因为我的系统是6

2016-10-27 15:03:29 694 1

转载 查看python的安装位置及好安装第三方库的位置

有时我们需要查看python的安装位置,好安装第三方库,linux可以先python进入python cmd,然后输入import sys print sys.path即可打印所有python路径。

2016-10-25 15:14:33 22173

原创 rpm -qa|grep lrzsz 查看是否安装了 lrzsz 软件包

rz  receive Zmode 文件 从本地上传到服务器sz  send Zmode  文件从服务器下载到本地rpm命令 用来管理rpm 文件  -qa   查看安装信息

2016-10-20 14:31:55 5248 1

转载 java中的length属性和length()方法和size()方法

转自:http://blog.csdn.net/mcy478643968/article/details/3488861#comments1 Java中的length属性是针对数组说的,比如说你声明了一个数组,想知道这个数组的长度则用到了length这个属性.2 java中的length()方法是针对字符串String说的,如果想看这个字符串的长度则用到length()这个方法.

2016-10-19 20:02:17 2347

原创 Python字符串笔记

Python字符串笔记1.字符串  str = 'abcd'在引用str 希望得到abcd时kkk = str + 'cdef'ttt = open("/home/suyuhan123/" + str + '.txt')引用字符时直接写str  不要写$str  "str"  等。 str 直接就表示了 'abcd'2.代码中有中文时 写# coding

2016-09-01 17:16:42 339

原创 Linux文件压缩

Linux文件压缩1.压缩成tar文件tar命令可以用来压缩打包单文件、多个文件、单个目录、多个目录。常用格式:单个文件压缩打包 tar czvf my.tar file1多个文件压缩打包 tar czvf my.tar file1 file2,...单个目录压缩打包 tar czvf my.tar dir1多个目

2016-09-01 17:16:15 255

原创 随机森林

实习汇报目录(面试亦是如此)1.什么是weka2.机器学习算法的性能很大程度上依赖于应用程序和数据集的维度a.随机森林几乎不需要输入准备。它们可以处理二元特征,分类特征,数字特征,并且不需要任何缩放处理。b.随机森林可实现隐式特征选择,并且提供一个很好的特征重要性指标。c.随机森林训练速度非常快。它的一个特色就是当性能优化时,恰巧会提高模型精度,反之亦然。随机特征子集设置的

2016-09-01 17:13:46 651

原创 Apriori算法

Apriori算法一个项集的支持度:数据集中包含该项集的记录所占比例。{豆奶} {豆奶,尿布}置信度(可信度):针对关联规则来定义的。例如 {尿布}->{葡萄酒} = 支持度{尿布,葡萄酒} /支持度{尿布}  = 0.75           这意味着对于包含尿布的记录,规则对其中75%的记录都适用。 支持度,可信度是用来量化关联分析是否成功的方法。 频繁项集:是经常

2016-09-01 17:08:32 280

原创 Apriori 算法关联分析

Apriori 算法关联分析频繁项集:经常出现在一起的物品的集合关联规则:暗示两物品间肯恩共存在很强的关系。 一个项集的支持度:数据集中包含该项集的记录所占比例。{豆奶} {豆奶,尿布}置信度(可信度):针对关联规则来定义的。例如 {尿布}->{葡萄酒} = 支持度{尿布,葡萄酒} /支持度{尿布}  = 0.75           这意味着对于包含尿布的记录,规则对其中

2016-09-01 17:06:55 302

原创 连续值、缺失值 、正负样本不均衡处理方法

数据挖掘笔试总结:1.连续值、缺失值 、正负样本不均衡处理方法缺失值:   (1)删除含有缺失值的数据对象或属性   (2)估计遗漏值,差值补全。     a.均值插补 均值 或者众数     b.利用同类均值插补    c.极大似然估计   前提适用于大样本期望值最大化    d.多重插补(较好)     最近邻平均属性     众数    

2016-09-01 17:06:17 4585

原创 测试网络是否联通 telnet

测试网络是否联通telnet 10.33.46.55 5490

2016-09-01 17:04:41 2097

原创 特征提取:

特征提取:原始特征的数量可能很大,或者说处在高纬空间中,通过映射(或变换)的方法用低纬空间来表示样本,这个过程叫特征提取。是一个变换过程    Y是测量空间 X是特征空间  变换A:Y->X 叫特征提取器。特征选择:从一组特征中挑选出一些最有代表性的特征,以达到降维的目的,这个过程叫特征选择。用映射(变换)方法,把原始特征变换为较少新特征————特征提取从原

2016-09-01 17:03:58 666

东软招聘笔试题

东软考试题。有时候简单,有时候难些,多看看有必要。如果会日语好像会有优势!

2014-07-16

phpStudy集成工具

php集成开发环境。phpStudy 包含很多东西,集成环境,简单方便。避免错误

2014-07-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除