自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(53)
  • 资源 (1)
  • 收藏
  • 关注

原创 阿里云ES装自定义插件

先在本地ES测试一下如果没有本地环境,先建议根据github上的链接(在我的上一条)把版本号改完之后,编译之后gradle pz生成的包,一开始我上传ES怎么都不行。就是提示缺少文件描述符。最后,阿里云ES和本地ES不一样,阿里云ES 上传的zip包解压后,直接就是内容,并没有一个大包囊括这些生成的东西。如下。而本地ES是可以的。唉,就这么个东西折腾,烦死了...

2021-01-21 11:24:19 445

原创 ES中装jieba分词插件

分词插件获取链接:https://github.com/sing1ee/elasticsearch-jieba-plugin个人踩坑tips:提前安装gradle 这个库,注意 版本不要用高的,反正我用了一个最新的,gradle pz时候出错,版本太高了(无语… 然后他的提示是错误的,也不用看。)我用的最新版才是6.8,他给我提示7.0. 这是在玩我?下载链接:https://gradle.org/releases/我es版本是7.7.1,按理说用7.7.0是最好的,但是在两个文件中修改版

2021-01-20 18:54:00 920 3

原创 python json单、双引号问题

在 python3 里,一个json是一个字典,形如 {"a":15}json转换成字符串的话那么,如果你要将它转换成字符串,也许你用的是str({"a":15}),这样转出来的,可能是是s= "{'a':'15'}",也就是说,里面的kv是单引号的。这个字符串,传到其他地方,再用json.loads(s)的时候会出错,json不支持单引号。所以,假如你想把一个json结构,转成字符串,传递给远处,然后再重新解析成json结构,应该这样:s = json.dumps({"a":15})然

2020-11-26 15:38:59 6203

原创 压力测试-siege的使用

工作需要,把一个后排序算法打包成微服务后,需要进行一下性能测试。内搜平台压力测试需求比较简单。一、siege安装wget http://download.joedog.org/siege/siege-latest.tar.gztar zxf siege-latest.tar.gzcd siege-4.0.2/ ./configure --prefix=./siegesudo makesudo make install#是否安装成功which siege二、siege使用

2020-08-17 17:10:35 293

原创 机器学习-损失函数

https://blog.csdn.net/pearl8899/article/details/105695608

2020-08-11 11:25:08 108

原创 LTR

https://blog.csdn.net/pearl8899/article/details/102920628

2020-08-11 11:19:48 214

原创 推荐排序---Learning to Rank(LTR)

https://blog.csdn.net/lipengcn/article/details/80373744还挺完整

2020-08-11 11:15:40 299

原创 【机器学习-模型评价指标】宏平均(macro avg)、微平均(micro avg)和加权平均(weighted avg)

我们使用 sklearn.metric.classification_report 工具对模型的测试结果进行评价时,会输出如下结果:(表格)0 precision recall f1-score support0 0.99 0.99 0.99 1551 0.90 0.82 0.86 11accuracy

2020-08-11 11:14:13 12136

原创 ImportError: /lib64/libstdc++.so.6: version `CXXABI_1.3.8‘ not found

服务器上跑bert分类模型(ad_cls.py),碰到这么个问题… 还得重新编译哦~看起来很麻烦的样子,存https://www.cnblogs.com/SummerinShire/p/11840810.html

2020-08-07 18:44:41 795

原创 机器学习模型评估报告

这里写目录标题机器学习评估报告格式常用评价指标分类模型混淆矩阵F1值AUC曲线ROC曲线实现代码格式找一个格式还不错的报告参考一下常用评价指标分类模型混淆矩阵就是二分类,真值正负类和预测结果的正负类。两两组合。就有四种情况。TP/TN/FP/FN算出来 准确率、召回率、精准率、准确率(反映分类器统对整个样本的判定能力,能将正的判定为正,负的判定为负):Accuracy=(TP+TN) / (TP+FP+TN+FN)召回率(预测对的正例数占真正的正例数的比率):Recall=TP / (

2020-08-07 18:42:06 979

原创 IEEE pdf eXpress 检测fail解决方法记录

环境:win7电脑doc文档,用word2003编辑的,公式是公式编辑器、图片visio。解决方案:1. 建议转pdf的时候用word2010转,另存为里面有pdf选项。(03没有该选项)。里面会有一个默认选项是 什么什么用位图显示,不要选这个默认选项,选第一个选项就是用iso标准什么的(具体记不太清楚)2. 转成pdf之后,就可以上传成功。出现的问题:1. 文档中有...

2019-10-23 21:56:24 2678 1

转载 线程同步的方式和机制

一般来说四种:临界区(Critical Section)、互斥对象(Mutex):主要用于互斥控制;都具有拥有权的控制方法,只有拥有该对象的线程才能执行任务,所以拥有,执行完任务后一定要释放该对象。信号量(Semaphore)、事件对象(Event):事件对象是以通知的方式进行控制,主要用于同步控制!1、临界区:通过对多线程的串行化来访问公共资源或一段代码,速度快,适合控制数据访问。在...

2019-09-04 22:30:05 168

原创 小问题2019.09.04

1.程序判断题:数组在定义后不能整体赋值;2. 同步传输与异步传输的区别如下。— 异步传输是面向字符的传输,而同步传输是面向比特的传输。— 异步传输的单位是字符,而同步传输的单位是帧。— 异步传输通过字符起止的开始码和停止码调整再同步的机会,而同步传输则是从数据中抽取同步信息。— 异步传输对时序的要求较低,同步传输往往通过特定的时钟线路协调时序。...

2019-09-04 22:04:45 158

原创 MYSQL 数据库特征及控制其实现的子系统

原子性:一个事务对数据库的所有操作,是一个不可分割的工作单元,这些操作要么全部执行,要么什么也不做(由DBMS的事务管理子系统来实现);一致性:一个事务独立执行的结果,应(由DBMS的完整性子系统执行测试任务);隔离性(由DBMS的并发控制子系统实现);持久性(由DBMS的恢复管理子系统实现的)...

2019-09-04 21:38:16 419

转载 python装饰器

学习菜鸟教程上一个同学的笔记,写的很好理解。转来学习。原文链接:https://www.runoob.com/w3cnote/python-func-decorators.html开始之前先提醒一下:多个装饰器的调用顺序为:从下往上每个人都有的内裤主要功能是用来遮羞,但是到了冬天它没法为我们防风御寒,咋办?我们想到的一个办法就是把内裤改造一下,让它变得更厚更长,这样一来,它不仅有遮羞功...

2019-09-04 15:24:27 166

原创 python __name__

__name__这个系统变量显示了当前模块执行过程中的名称,如果当前程序运行在这个模块中,__name__ 的名称就是__main__如果不是,则为这个模块的名称。__main__一般作为函数的入口,类似于C语言,尤其在大型工程中,常常有if __name__ == "__main__":来表明整个工程开始运行的入口。讲的比较清楚的博文链接。https://blog.csdn.n...

2019-09-04 15:00:37 850

原创 [笔试&面试]哈夫曼树的带权路径长度

设一组权值集合W=(15,3,14,2,6,9,16,17),要求根据这些权值集合构造一棵哈夫曼树,则这棵哈夫曼树的带权路径长度为()计算方法:①先对集合中的结点按照权值从小到大排序。②选两个权值最小的点将它们的权值相加构成一个新结点,原来的这两个最小的值是新结点的左右子结点。③在有序集合中将两个被加过的结点去掉,再新的结点放入再次排序然后重复...

2019-09-04 13:08:50 4912

转载 System类getProperties()和getProperty(String)取得当前系统的属性

【1】获取系统属性两种方法Java中取得系统的属性的方法有两种:① 可以使用System类中的方法:public static Properties getProperties()得到系统的各种属性,该方法返回一个Properties类,这个类继承自Hashtable,在该类中定义了各种属性的键值对。② 直接使用System.getProperty(String key)获取所需的...

2019-07-31 14:42:08 760

原创 C#中如何向数组中动态添加元素

转自:https://blog.csdn.net/qq_35938548/article/details/78325558背景:现需要向数组中循环插入字符串,但C#中的数组是不支持动态添加元素的,只能创建固定大小的数组,该如何解决呢?参考了网上资料,个人觉得比较好的解决方法:使用泛型list< T >,先将元素存入list中,最后使用ToArray()转成数组。1.stri...

2019-07-19 02:17:38 14316

原创 C# 事件监听操作

//窗口1 Form1注册监听事件public delegate void ListenerHandler();public event ListenerHandler Listener=null;public void DoSomeThing() { if (Listener!=null)//确定事件已被订阅,也就是已被注册 { List...

2019-07-19 00:18:52 7132

原创 C# 怎么保留小数点后几位数

double s=0.55555;result=s.ToString("#0.00");点后面几个0就保留几位如果要四舍五入的话,用这个double dbdata=0.55555;string str1=dbdata.ToString("f2");fN 保留N位,四舍五入...

2019-07-15 20:55:05 1838

转载 C# string转int

C# string转intint intA = 0;intA =int.Parse(str);//1int.TryParse(str, out intA);//2intA = Convert.ToInt32(str);//3//以上都可以,其中 1和3 需要try{}异常,2不需要。int i = -1;bool b = int.TryParse(null, out i...

2019-07-15 15:07:40 9009

转载 C# 字典 Dictionary 用法

转载链接:https://www.cnblogs.com/ChenMM/p/9479987.htmlDictionary提供快速的基于键值的元素查找。结构是:Dictionary <[key] , [value] >,当你有很多元素的时候可以用它。它包含在System.Collections.Generic名控件中。在使用前,你必须声明它的键类型和值类型。usi...

2019-07-12 21:21:38 363

原创 C# 串口读取中文数据

一开始是用str方式从串口中读取数据。然后在网上找了一堆utf8转gb2312的代码.并没有什么用。然后就像是不是不应该以string的方式读取。果然,解决了问题。串口接收中文数据代码: /******************接收部分**********************************/ private void port_DataRec...

2019-07-12 19:16:12 3227 1

原创 ubuntu错误解决E: Sub-process /usr/bin/dpkg returned an error code (1)

在用apt-get安装软件时出现了如题错误。解决方法:sudo apt-get update --fix-missingsudo apt-get autoremove && sudo apt-get clean && sudo apt-get install -f

2019-06-24 17:49:59 559

原创 glove词向量的加载以及预处理

1. glove词向量的加载2. glove词向量的预处理3. 碎碎念这两天要做论文的实验,关于句向量的。因为实验代码涉及到对词向量的处理,就记一下吧,其实之前也是看过的,但是中间做了另外一个课题的内容,这两天再拾起来看的时候竟然发现自己像是没有看过一样...果然还是要有记录.... 老天赐我一个过目不忘的大脑吧!对了,好久没有写博客记东西了,后来都...

2019-05-07 15:56:55 1793

原创 Linux下gensim安装

安装之前确定python 版本 > 2.6gensim这个库对numpy scipy这两个库的版本有要求,一般就搞到最新就好了。我是在anaconda环境下安装的,命令:conda install gensim不知道我这个anaconda环境下安装包总是特别慢。sloving environment总是要好久。也可以用pip 安装。pip install ge...

2019-05-07 15:49:35 680

原创 python3绘制多类型柱状图

Linux jupyter notebook环境下绘制。图:代码: #coding:utf8import numpy as npimport matplotlibimport matplotlib.pyplot as pltimport sysfrom matplotlib.ticker import MaxNLocatorfrom collections impo...

2019-01-17 11:12:13 9289 2

原创 pyplot绘图中文乱码

linux系统下,juoyter notebook下绘制图,横纵坐标显示中文乱码。综合贴:https://www.cnblogs.com/hhh5460/p/4323985.html记录解决方法如下:1. 在windows上找一个系统字体文件。我是在win7系统下找的,方法:win+r 键入fonts ,就会打开系统字体文件夹,挑喜欢的字体文件(ttf,ttc格式都可以)然后复...

2019-01-17 10:44:04 1170

原创 win7安装CloudSim3.0云计算仿真平台

一、CloudSim介绍         2009年4月8日,澳大利亚墨尔本大学的网格实验室和Gridbus项目宣布推出云计算仿真软件,称为CloudSim。它是在离散事件模拟包SimJava上开发的函数库,可在Windows和Linux系统上跨平台运行,CloudSim继承了GridSim的编程模型,支持云计算的研究和开发,并提供了以下新的特点: (1)支持大型云计算的基础设施的建模与仿真;...

2019-01-04 10:36:39 583

转载 Linux下安装Xgboost(python2.7)以及anaconda下 安装xgboost

原文链接0)安装git:sudo apt-get install git1)安装xgboost:git clone --recursive https://github.com/dmlc/xgboost如果是未联网的机器,先去https://github.com/dmlc/xgboost下载源码,再手动传到服务器,解压缩等1)build:cd xgboost; ma...

2018-12-07 17:29:57 1498

原创 自然语言处理(NLP)各任务最新研究进展,包括数据集和优秀论文

整理NLP-Progress上的东西。目录EnglishCommon Sense 知识推理Event2MindSWAGWinograd Schema ChallengeConstituency parsingPenn TreebankEnglishCommon Sense 知识推理Common sense reasoning tasks are int...

2018-12-05 11:22:00 5357

原创 [paper notebook] A SIMPLE BUT TOUGH-TO-BEAT BASELINE FOR SENTENCE EMBEDDINGS

作者给出的实现代码:github周末整理具体内容...

2018-11-30 15:02:54 220

转载 似然函数、最大似然函数理解

摘抄自维基百科:https://zh.wikipedia.org/wiki/%E4%BC%BC%E7%84%B6%E5%87%BD%E6%95%B0https://zh.wikipedia.org/wiki/%E6%9C%80%E5%A4%A7%E4%BC%BC%E7%84%B6%E4%BC%B0%E8%AE%A1似然函数(Likelihood function、Likelihoo...

2018-11-29 20:46:23 1993

原创 [CS224n] week1-Word Vector词向量(下)

这个上呢,我没写完,总结一下[CS224n] week1-Word Vector词向量(上)主要介绍了word2vec包含两个算法(SG:skip-gram;CBOW),两个训练词向量的方法(negative sampling; Hierarchial softmax);两两组合着重讲了:SG算法(就是那张图... 完了补吧)还有 模型参数的学习:梯度法(推导了半天。)、softmax f...

2018-11-23 15:03:10 244

原创 [CS224n] week2-assginment1-1.3-1.4

3 Word2vec

2018-11-08 09:02:13 176

原创 [CS224n] week1-assginment1-1.1-1.2

1 Softmax(a) 证明                                                                                   是对每个中每一个维的数都加一个常量。 证明:这个不想写了。(b) 写代码实现softmaximport numpy as npdef softmax(x): ...

2018-11-05 19:42:11 456 6

原创 [python] numpy.apply_along_axis()函数的用法

对数组里的每一个元素进行变换,得到目标的结果。按行或者按列。相当方便了...numpy.apply_along_axis(func, axis, arr, *args, **kwargs):必选参数:func,axis,arr。其中func是我们自定义的一个函数,函数func(arr)中的arr是一个数组,函数的主要功能就是对数组里的每一个元素进行变换,得到目标的结果。        ...

2018-11-05 11:14:46 915

原创 [CS224n] week1-Word Vector词向量

1. Word meaning     计算机如何表达词的意思 词呢,通常被认为是表达意思的最小单位了。但是语言学专业好像不是这样,而是以词素为单位。(之前google了一下没怎么懂...有人懂可以给我留言一下喔,谢谢~)分类词典。WordNet词库,比如NLTK中可以通过WordNet查询熊猫的hypernyms (is-a,上位词),得到“食肉动物”“动物”之类的上位词。也可以查...

2018-11-05 10:25:40 231

原创 18.10.18 用到的链接..待整理

http://blog.sciencenet.cn/blog-350278-629028.html\https://matplotlib.org/api/_as_gen/matplotlib.pyplot.imshow.htmlhttps://blog.csdn.net/weixin_40604987/article/details/79292493http://www.runoob....

2018-10-18 20:28:28 155

淘宝专用词库—用户NLP任务

淘宝专用词库 可用于电商场景下的各类任务

2022-04-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除