自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 问答 (1)
  • 收藏
  • 关注

原创 git本地操作时提示输入密码,但是密码错误的问题

git操作时输入密码不正确git执行pull,push,fetch等操作后要求输密码,输密码后提示密码错误,报错信息:$ git remote update origin --pruneFetching [email protected]'s password:Permission denied, please try again.参考博文:https://www.cnblogs.com/JaminXie/p/11103806.html错误属于上文中第二种私钥错误的情

2020-05-25 10:34:49 1927

原创 CentOS7安装Tensorflow2.1的问题

服务器版本:CentOS Linux release 7.2.1511 (Core)服务器当前显卡驱动版本:NVRM version: NVIDIA UNIX x86_64 Kernel Module 381.22 Thu May 4 00:55:03 PDT 2017GCC version: gcc version 4.8.5 20150623 (Red Hat 4.8.5-11) (GCC)显卡信息:在conda中新建环境安装TensorFlow2.1后,安装cudat...

2020-05-18 11:40:03 816

原创 Pycharm远程调试不能Debug的问题

用pycharm调试linux服务器上的代码,当debug时总会遇到自动打断的错误,进入到__init__.py中,报错信息为AttributeError: /root/.pycharm_helpers......中的一个文件出错解决方法:在本地pycharm安装目录中的helpers文件夹中找到出错的文件,替换服务器中/root/.pycharm_helpers文件夹下对应路径中的文...

2020-04-09 17:20:45 1651

原创 记录一个Timer中使用全局变量的问题

背景:1.py文件中A()函数一直接受消息队列中的消息,并将消息发送给2.py文件中的B()函数,B()函数在接受消息后根据条件进行判断,若符合条件将全局变量flag加1。2.py中的C()函数用来定时查看全局变量flag中的值,若大于某阈值就将True返回给1.py的A()函数,并把全局变量重置为0.用python3.6写的demo:1.pyfrom Py.test.t2 impo...

2020-04-03 15:19:02 763

原创 一些代码记录

Python字典中的值为列表或字典的构造方法 # listdic = {}dic.setdefault(key,[]).append(value)# dictdic = {}dic.setdefault(key,{})[value] =1

2020-03-24 16:09:12 223

原创 算法代码

最常公共子串问题(The Longest Common Substring)LCS问题就是求两个字符串最长公共子串的问题。解法就是用一个矩阵来记录两个字符串中所有位置的两个字符之间的匹配情况,若是匹配则为1,否则为0。然后求出对角线最长的1的序列,其对应的位置就是最长匹配子串的位置。def find_lcsubstr(s1, s2): m=[[0 for i in range(len(...

2020-03-23 17:13:05 119

原创 数据挖掘之经常用之总也记不住之这次一定要记住之DataFrame使用技巧

选取df中一行,对这一行中的某些列赋值(同时根据行列选取后赋值),举个栗子:想对上面这个df进行操作:第A列为aaa的数据中BCD行进行赋值df.loc[df['A']=='aaa', ['B', 'C', 'D']] = [1, 2, 3]效果:...

2020-03-18 23:09:08 135

原创 Suricata规则编写

规则格式Suricata规则包括以下三部分:action,action决定当signature匹配的时候会发生什么 header, 定义了协议,IP地址,端口和规则的位置 rule options, 定义规则细节droptcp $HOME_NET any -> $EXTERNAL_NET any(msg:”ET TROJAN Likely Bot Nick in IRC (...

2020-03-05 10:05:13 2578

原创 IV与WOE

什么是IV——Information Value类似于信息增益、基尼指数等,用来衡量特征的预测能力IV如何计算以WOE(weight of evidence)为基础,WOE是对原始变量的一种编码形式上边是一组的IV值,要计算一个特征的IV值将各组IV值求和即可(n为分组个数):WOE如何计算需要先对特征进行分组处理(离散化、分箱说的都是一种东西)翻译一下:...

2019-10-05 17:34:24 394

原创 Python心形祝福

'''来源:一行python代码可以做什么,稍稍改了一下'''print( '\n'.join( [''.join( [('HappyBirthday2Flower!'[(x-y) % len('HappyBirthday2Flower!')] if ((x*0.05)**2+(y*0....

2019-09-07 12:50:39 420

原创 Python笔试输入(python2和python3)

Python3python3中将input()和raw_input()整合成input()注意:input() 和 raw_input() 这两个函数均能接收 字符串 ,但 raw_input() 直接读取控制台的输入(任何类型的输入它都可以接收)。而对于 input() ,它希望能够读取一个合法的 python 表达式,即你输入字符串的时候必须使用引号将它括起来,否则它会引发一个 Sy...

2019-09-06 18:01:31 179

原创 先验概率与后验概率

先验概率事情还没发生,根据经验获得的概率。例如抛硬币,在没抛之前就知道正面的概率为0.5,所以正面向上的先验概率就是0.5后验概率事情发生了,有很多原因导致发生,求是哪个原因引起的,结果→原因。例如,A导致B的发生,那么在B发生的条件下,由A引起的(A发生)概率是:...

2019-08-30 14:00:03 169

原创 CatBoost论文笔记

CatBoost: gradient boosting with categorical features support(有类别属性支持的梯度提升)→原文链接Abstract我们提出的Catboost算法很6,开源,处理类别属性比现有的梯度提升都厉害(用的一些主流的开源数据集)CatBoost, a new open-sourced gradient boosting libra...

2019-08-25 22:06:09 1288

原创 数据分析常用代码(持续更新)

模型Xgboost import xgboost as xgbdef xgb_model(X_t, X_v, y_t, y_v, test): print("XGB model start") xgb_val = xgb.DMatrix(X_v, label=y_v) xgb_train = xgb.DMatrix(X_t, label=y_t) ...

2019-08-24 17:59:58 1544

原创 银联高校极客挑战赛-数据建模赛道总结(决赛前)

赛题回顾赛题描述本次大赛基于脱敏和采样后的约 40,000 条用户消费行为数据,预测在未来的一段时间内,用户对于某产品是否会有购买和收藏的行为。数据背景本数据集为经过脱敏和采样后用户在某网站的消费行为数据,其中大致包含了三大类信息,即用户的基础信息,商品的基础信息,用户的行为信息,其中用户的基础信息除了用户的id之外皆为脱敏后的具体行为信息,商品信息除卖家id、商品id 之外皆为脱...

2019-08-24 12:09:19 710

原创 归一化

为什么要归一化数据归一化后,最优解的寻优过程明显会变得平缓,更容易正确的收敛到最优解。(参考:知乎链接-为什么要对数据归一化)什么时候需要归一化当算法需要使用梯度下降的方法求解最优解(比如逻辑回归)或者该算法计算样本点距离时(比如KNN)须使用归一化处理。如何归一化线性归一化 Min-Max 归一化:比较适用在数值比较集中的情况。实际使用中可以用经验常量值来替代max和min...

2019-08-23 22:46:28 276

原创 K折交叉验证

K折交叉验证实现StratifiedKFold用法类似Kfold,但是他是分层采样,确保训练集,测试集中各类别样本的比例与原始数据集中相同。from sklearn.model_selection import StratifiedKFoldkf = StratifiedKFold(n_splits=3, shuffle=True, random_state=2019)# 3折交叉...

2019-08-13 18:45:10 145

原创 Kernel,anaconda,pip使用清华镜像

使用清华源安装catboost,其他包同理! pip install catboost -i https://pypi.tuna.tsinghua.edu.cn/simple

2019-08-03 23:36:10 427

原创 【Pandas技巧】用pandas_profiling概览DataFrame

早上在微博上看见一段视频介绍pandas_profiling ,觉得很好用,便记录了下来。微博小视频地址@爱可可-爱生活1.安装pip install pandas_profiling# 安装时需要更新scipy和matplotlibpip install scipy --upgradepip install matplotlib --upgrade1.1安装后遇到的问题...

2019-07-31 15:06:28 3370

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除