自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(45)
  • 收藏
  • 关注

原创 权威的我的

import loggingimport gensimfrom gensim.models import word2vec# 设置输出日志logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)# 直接用gemsim提供的API去读取txt文件,读取文件的A...

2019-12-22 21:21:36 150

原创 glove词向量

http://www.fanyeong.com/2018/02/19/glove-in-detail/#comment-1462https://blog.csdn.net/mr_tyting/article/details/80180780

2019-11-22 10:26:10 181

原创 链表

https://www.cnblogs.com/kumata/p/9147077.html

2019-08-21 16:11:53 135

原创 SVM算法

https://blog.csdn.net/blackyuanc/article/details/67640844https://www.cnblogs.com/huangyc/p/9979178.html

2019-08-21 15:08:08 173

原创 EM算法

https://blog.csdn.net/XiaoYi_Eric/article/details/80274938https://www.cnblogs.com/huangyc/p/10123780.html

2019-08-21 15:05:05 130

原创 特征工程

https://www.cnblogs.com/geo-will/tag/%E7%89%B9%E5%BE%81%E5%B7%A5%E7%A8%8B/https://www.cnblogs.com/jasonfreak/p/5448385.htmlhttps://blog.csdn.net/yywan1314520/article/details/51013289

2019-08-17 10:44:14 87

转载 2059 - authentication plugin 'caching_sha2_password'” mysql8.0 Navicat for mysql 登陆错误

当数据库和客户端安装成功后,我使用客户端连接接数据库时,却是登陆失败:2059 - Authentication plugin 'caching_sha2_password' cannot be loaded: ......原来,MySql 8.0.11换了新的身份验证插件(caching_sha2_password), 原来的身份验证插件为(mysql_native_passwor...

2019-07-05 15:38:00 136

原创 bert

https://github.com/google-research/berthttps://plmsmile.github.io/2018/12/15/52-bert/https://www.cnblogs.com/rucwxb/p/10277217.html

2019-06-04 14:22:05 133

转载 L1与L2正则化

https://blog.csdn.net/f156207495/article/details/82794151https://juejin.im/post/5a1aa57c6fb9a045040794b3https://blog.csdn.net/jinping_shi/article/details/52433975

2019-06-03 17:40:47 90

转载 箱型图

https://blog.csdn.net/ZengHaihong/article/details/53291372http://www.sohu.com/a/220236877_434937箱形图箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理,快速识别异常值...

2019-05-31 11:49:02 1239

转载 python类的继承

https://www.cnblogs.com/bigberg/p/7182741.htmlhttps://blog.csdn.net/liweiblog/article/details/54425572https://www.cnblogs.com/feeland/p/4419121.htmlhttps://www.cnblogs.com/xinghuaikang/p/8481712...

2019-05-30 14:36:36 78

转载 Transformer学习笔记

https://blog.csdn.net/qq_41664845/article/details/84969266https://blog.csdn.net/ljp1919/article/details/86659755

2019-05-29 11:42:16 112

转载 attention

https://spaces.ac.cn/archives/4765/comment-page-1https://spaces.ac.cn/archives/4765/comment-page-1https://blog.csdn.net/mpk_no1/article/details/72862348

2019-05-29 11:41:39 108

转载 XGBoost

XGBoost基本原理我重点比较一下XGBoost与GBDT两种算法的不同:XGBoost的目标函数与GBDT存在泰勒展开项的不同:最基本的差距就在于XGBoost比GBDT多了两项泰勒展开式。具体这个泰勒展开式是怎么得到的,是对于什么展开的呢?我们看:XGBoost算法可以看成是由K棵树组成的加法模型:XGBoost加法模型其中F为所有树组成的函数空间(这里...

2019-05-28 15:18:27 191

原创 GBDT(Gradient Boosting Decision Tree)基本原理

GBDT(Gradient Boosting Decision Tree)基本原理首先,GBDT使用的决策树是CART回归树,无论是处理回归问题还是二分类以及多分类,GBDT使用的决策树通通都是都是CART回归树。为什么不用CART分类树呢?因为GBDT每次迭代要拟合的是梯度值,是连续值所以要用回归树。  对于回归树算法来说最重要的是寻找最佳的划分点,那么回归树中的可划分点包含了所有特征的所...

2019-05-28 14:57:27 232

原创 TF.VARIABLE、TF.GET_VARIABLE、TF.VARIABLE_SCOPE以及TF.NAME_SCOPE关系

1. tf.Variable与tf.get_variabletensorflow提供了通过变量名称来创建或者获取一个变量的机制。通过这个机制,在不同的函数中可以直接通过变量的名字来使用变量,而不需要将变量通过参数的形式到处传递。TensorFlow中通过变量名获取变量的机制主要是通过tf.get_variable和tf.variable_scope实现的。当然,变量也可以通过tf.Va...

2019-05-27 15:06:27 94

原创 tensorflow的日用函数

1.tf.layers.MaxPooling1DClass MaxPooling1D:1D输入的最大池化层参数:pool_size:一个整数或者一个单个整数的tuple/list,表示池化窗口的大小strides:一个整数或者一个单个整数的tuple/list,指定池化操作的移动步幅padding:一个字符串。padding的方法:”valid”或者’same’data_forma...

2019-05-27 09:21:47 128

原创 经典的决策树算法

回归与分类我们在机器学习中一直会遇到两种问题,一种是回归问题,一种是分类问题。我们从字面上理解,很容易知道分类问题其实是将我们现有的数据分成若干类,然后对于新的数据,我们根据所分得类而进行划分;而回归问题是将现有数据拟合成一条函数,根据所拟合的函数来预测新的数据。 这两者的区别就在于输出变量的类型。回归是定量输出,或者说是预测连续变量;分类问题书定量输出,预测离散变量。如何区分分类与回...

2019-05-21 20:40:53 793

转载 sklearn: TfidfVectorizer 中文处理及一些使用参数

TfidfVectorizer可以把原始文本转化为tf-idf的特征矩阵基本应用如:#coding=utf-8from sklearn.feature_extraction.text import TfidfVectorizerdocument = ["I have a pen.", "I have an apple."]tfidf_model = Tfidf...

2019-05-18 17:35:51 715

原创 conda 安装指定版本的指定包

1.制定Anaconda 仓库的镜像,运行以下命令:#清华镜像conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config --set show_channel_urls yes#中科大镜像conda config --add channels htt...

2019-05-18 17:27:42 11574

原创 conda install XXX 和 pip install XXX 的区别

conda是一种通用包管理系统,是想要构建和管理任何语言的任何类型的软件。因此,它也适用于Python包。Pip代表Pip Installs Packages,是Python的官方认可的包管理器,最常用于安装在Python包索引(PyPI)上发布的包。pip是Python包的通用管理器; conda是一个与语言无关的跨平台环境管理器。对于用户,最显着的区别可能是这样的:pip在任何环境中安装p...

2019-05-18 15:13:35 5612 1

原创 TensorFlow使用显存的设置

TensorFlow默认情况下训练会占用全部显存。可以设置参数来修改显存使用情况。设置使用显存比例在构造tf.Session()时候通过传递tf.GPUOptions作为可选配置参数的一部分来显式地指定需要分配的显存比例,如下所示:假如有12GB的显存并使用其中的4GB:gpu_options = tf.GPUOptions(per_process_gpu_memory_fr...

2019-05-16 11:27:07 882 1

原创 python3 字典的排序

先看一下,直接用sorted()排序的情况。dict1={'a':2,'e':3,'f':8,'d':4}dict2 = sorted(dict1)print(dict2)结果:['a', 'd', 'e', 'f']sorted()默认是对字典的键,从小到大进行排序当然我们也可以先拿到所有的key,然后再对key排序dict1={'a':2,'e':3,'f':8,...

2019-05-14 22:29:59 940

转载 python numpy 数据类型转换

转载自https://blog.csdn.net/miao20091395/article/details/79276721numpy数据类型转换需要调用方法astype(),不能直接修改dtype。调用astype返回数据类型修改后的数据,但是源数据的类型不会变,需要进一步对源数据的赋值操作才能改变。例如>>> a=np.array([1.1, 1.2])>...

2019-05-14 22:08:22 689

转载 Python遍历列表删除多个列表元素

在遍历list的时候,删除符合条件的数据,结果不符合预期num_list = [1, 2, 2, 2, 3]print(num_list)for item in num_list: if item == 2: num_list.remove(item) else: print(item)print(num_list)结果是:...

2019-05-13 15:46:46 3366

原创 Python中如何从列表中删除None值

在Python中我们可以使用for循环遍历过滤None值,或者使用filter()函数来删除None值,然后返回没有None值的新列表。下面我们就来介绍一下删除方法,希望对大家有所帮助。None值是什么?在 Python 中有一个值称为 None,它表示没有值。None 是 NoneType 数据类型的唯一值。就像布尔值 True 和 False 一样,None 必须大写首字母 N。如...

2019-05-13 15:25:54 27062

转载 keras 保存model文件和载入model文件

保存keras的model文件和载入keras文件的方法有很多。现在分别列出,以便后面查询。keras中的模型主要包括model和weight两个部分。保存model部分的主要方法:一是通过json文件Json文件# serialize model to JSONmodel_json = model.to_json()with open("model.json", "w") ...

2019-05-13 14:14:59 658

转载 keras保存模型中的save()和save_weights()

转载于https://blog.csdn.net/leviopku/article/details/86612293我们知道keras的模型一般保存为后缀名为h5的文件,比如final_model.h5。同样是h5文件用save()和save_weight()保存效果是不一样的。我们用宇宙最通用的数据集MNIST来做这个实验,首先设计一个两层全连接网络:inputs = Input...

2019-05-13 14:06:54 739

原创 python之os模块

1.当前路径及路径下的文件import osprint(os.getcwd())#查看当前所在路径print(os.listdir(os.getcwd()))#列举目录下的所有文件,返回list类型2.绝对路径print(os.path.abspath('.'))#返回path的绝对路径print(os.path.abspath(('..')))#注意'.'与'..'区别...

2019-05-13 11:30:00 183

原创 python中统计计数的几种方法和Counter的介绍

使用字典dict()alist=['a','b','a','c','b','b',1,3]count_dict = dict()for i in alist: count_dict[i]=count_dict.get(i,0)+1 #dict.get(i,0)查询字典key=i的value,如果dict中没有i,则取i的value为0print(count_dict) ...

2019-05-12 22:22:02 570

原创 gensim Word2Vec 训练和使用

1、词向量的训练from gensim.models import Word2Vecsentences = [["cat", "say", "meow"], ["dog", "say", "woof"]]model = Word2Vec(sentences,sg=1, size=100, window=5, min_count=5, negative=3, sample=0.00...

2019-05-12 22:08:46 2008

转载 visio2016专业版2018最新密钥和下载方法 整理

visio2016是目前微软最强大的图标制作软件,也是很难激活的。今天小编就给大家分享一下visio2016专业版的下载地址和激活方法,希望能给你带来方便。一,所有版本下载和更多有效的密钥 www.dnbbn.com 当然,也可以通过官网下载,登录setup.office.com.输入密钥识别后即可下载...

2018-12-21 12:03:58 1865

原创 keras下Convolution1D与Convolution2D的区别

from keras.models import Sequentialfrom keras.layers.core import Flattenfrom keras.layers.convolutional import Convolution2D,Convolution1D#Convolution2Dmodel = Sequential()model.add(Convolution2D...

2018-12-11 10:03:42 1708

转载 tensorflow word2vec demo详解

转自https://blog.csdn.net/weixin_42001089/article/details/81224869 word2vec有CBOW与Skip-Gram模型CBOW是根据上下文预测中间值,Skip-Gram则恰恰相反本文首先介绍Skip-Gram模型,是基于tensorflow官方...

2018-11-19 17:15:45 605

转载 关于交叉熵在loss函数中使用的理解

版权声明:本文为博主原创文章,转载请注明出处。 https://blog.csdn.net/tsyccnh/article/details/79163834 关于交叉熵在loss函数中使用的理解交叉熵(cross entropy)是深度学习中常用的一个概念,一般用...

2018-11-19 16:54:58 240

转载 Tensorflow 的NCE-Loss的实现和word2vec

看看tensorflow的nce-loss的API:def nce_loss(weights, biases, inputs, labels, num_sampled, num_classes, num_true=1, sampled_values=None, remove_accidental_hits=Fals...

2018-11-18 21:54:46 706

转载 自然语言

https://www.cnblogs.com/finallyliuyu/category/236887.html

2018-10-29 09:36:01 162

转载 Python中 sys.argv[]的用法简明解释

因为是看书自学的python,开始后不久就遇到了这个引入的模块函数,且一直在IDLE上编辑了后运行,试图从结果发现它的用途,然而结果一直都是没结果,也在网上查了许多,但发现这个问题的比较详细的解释只有一个版本,大部分都是转裁和复制的。给的都是简明python教程上那个一长串代码的例子,说看了就明白了,可我看得晕头转向的还是没真正明白,只知道“sys.argv[0]表示代码本身文件路径”这点,其实还...

2018-10-11 16:22:38 131

转载 python 文件读写模式r,r+,w,w+,a,a+的区别(附代码示例)

如下表 模式 可做操作 若文件不存在 是否覆盖 r 只能读 报错 - r+ 可读可写 报错 是 w 只能写 创建 是 w+  可读可写 创建   是 a   只能写 创建 否,追加写 a+ 可读可写 创建 否,追加写  ...

2018-10-11 14:36:10 986

转载 Pandas删除数据的几种情况

开始之前,pandas中DataFrame删除对象可能存在几种情况1、删除具体列2、删除具体行3、删除包含某些数值的行或者列4、删除包含某些字符、文字的行或者列本文就针对这四种情况探讨一下如何操作。数据准备模拟了一份股票交割的记录。In [1]: import pandas as pdIn [2]: data = { ...: '证券名称' : ['格...

2018-09-07 10:07:35 947

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除