自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 fasttext包报错

fasttext包报错Traceback (most recent call last):File “train.py”, line 37, in main()File “train.py”, line 25, in maintrain_task.train()File “train.py”, line 20, in trainws=self.ws,lr=self.lr,word_ngrams=self.word_ngrams,dim=self.dim)File “E:\Anaconda\S

2021-05-21 15:04:08 468

原创 pkl让你代码也可以见得不人

pkl让你代码也可以见得不人在写代码过程中,总有希望别人不知道代码怎么写的时候,那有些时候可以用api,以吐api给别人,别人给你的api传参数,那么你吐结果别人,这样子也可以,但是api就涉及要把ip放到公网,至少是局域的公网,那么就很麻烦了,这时候pkl就可以帮到你,pkl号称,一切皆可打包。首先先跟大家介绍一下pkl是什么东西:pickle模块详解该pickle模块实现了用于序列化和反序列化Python对象结构的二进制协议。“Pickling”是将Python对象层...

2020-06-18 14:58:14 1565

原创 安装pycorrector包出错

第一步是先升级一下你的C++到14.0,链接:https://pan.baidu.com/s/1aseYuhsI5rBbYBcU_n8NNw 提取码:nqhm下载这个安装包之后,按安装就可以了,一般要等很久。第二步,你安装了这个之后,还是会报错的,报这个错误:这时候你再pip install kenlm肯定是装不上了,你要用这句 pip installhttps://github.com/kpu/kenlm/archive/master.zip之后顺利安装好了之后。这回你再...

2020-06-06 17:22:15 512

原创 python serise处理 60句 +字符串处理 40句

​serise处理 60句:s.abs()#取整a.add(b, fill_value=0)#两个serise对应位置的数值相加,假设一个缺失一个nan,那么fill_value=0生效,nan为0,若两个都为nan,则参数不生效s.add_prefix('item_')#给serise的索引加上前缀df.add_prefix('col_')#给数据集的变量名加上前缀s.add_suffix('_item')#删除serise索引加上后缀..

2020-06-05 10:23:44 458

原创 ​python 系列-100条处理dataframe的语句

​python 系列-100条处理dataframe的语句数据集处理、筛选import pandas as pdimport numpy as npdates = pd.date_range('1/1/2000', periods=8)# 建立一个时间序列,从20000101开始,8个数据df = pd.DataFrame(np.random.randn(8, 4),index=dates, columns=['A', 'B', 'C', 'D'])# 随机生成8*4的数组,数

2020-06-05 10:18:45 416

原创 github上面那些可以让你快速做模型的代码

github上面那些可以让你快速做模型的代码01、逻辑回归1、建立基于逻辑回归的评分卡模型:https://github.com/LeronQ/score_logistic 入门级代码,作者就一篇python把逻辑回归从数据处理到最终产生评分卡都写出来了,备注也比较清晰明了,代码没有写过多的函数,所以假设出错,调试成本也不高。2、逻辑斯谛回归(Logistic Regression)的python实现,使用牛顿法https://github.com/0zo...

2020-06-05 10:13:17 1833

原创 ​python数据处理冷门但好用的包

1、phone包,根据电话号码查询号码信息,包的github地址在https://github.com/ls0f/phone,支持”13*,15*,18*,14[5,7],17[0,6,7,8]”号段的查询号码信息,以下为使用代码:from phone import Phonep = Phone()p.find(1358977668)2、ngender包,可以通过名字判定性别,当然这个性别是通过数据推测的,并不意味是准确的,但是有一定的准确率,后面接的是概率。像下面这个代码意味着有.

2020-06-05 10:08:42 368

原创 构建数据指标预警系统

我之前一直有个困扰,领导是一个很重视数据指标的人,我每天早上9点,领导准时呼唤我,为什么今天的数据是这样子,是有什么问题吗,刚开始吧,还好,但是每天都要问,我都害怕,但是吧,后来也觉得这样子也不合适,天天问再解决,要提前预警啊,所以立了这个项目,这篇文章就是跟大家系统的介绍数据指标预警系统的东西。01指标的类型一般的公司的数据指标会分布在以下几个维度:1、用户数量检测 每天早会,一般都会对昨日的活跃用户,成交用户,新增用户的数据做回报,以确认过去的...

2020-06-05 09:55:50 3825

原创 搭建智障机器人之搭建属于自己的服务器

​ 你们都知道的把,我的公众号有个智障机器人,但是由于太过于智障,我特地给他开了一个新的公众号养着他,那个公众号叫“学人精A”,为什么说养着他,因为他真的费钱,今天就是来介绍他为什么费钱的。首先呢,这个机器人哇,就是是在微信公众平台的后台调api的,这个怎么调,看你们对这个系列感兴趣,我就往下写来,不感兴趣,可能这个系列很快就没啦,我也不知道有多少粉丝对我的“智障机器人”感兴趣,因为现在这块其实挺火的,我也是想借着搭建这个机器人的过程中去增强自己的开发能力还有自己的nlp的知识的掌握。这里说...

2020-06-05 09:50:34 775

原创 python数据导入之导入各类文件方法 

​python数据导入之导入各类文件方法01、csv的导入方法1、如果数据是很规范的那种的话,而且文件不算太大的话,可以用以下代码导入即可:import pandas as pdcsv_data = pd.read_csv(filename)#没有特殊分隔符,就用这一句,df = pd.read_csv(filename,';')#如果有特殊分隔符,就用这一句df = pd.read_csv(filename,';',encoding='GBK')#如果有特殊分隔符,就用这一句..

2020-06-05 09:47:58 4179

原创 B站上那个不用钱的学习python的资源

我很喜欢在b站看视频的,特别是python的视频,但是由于嘛,你知道的,我们这种公众号只能发一些原创,或者合法搬运的,那些不合法搬运的,我只能自己偷偷看,但是我跟你说了,你们可以自己去搜啊,对不对,今天是安利大家几个我个人觉得比较适合我的粉丝的python的up主啦,给那些不喜欢看书,看教程,喜欢看视频的粉丝学习。1、鱼C-小甲鱼,粉丝数:26万https://space.bilibili.com/314076440?from=search&seid=1470325567...

2020-06-05 09:39:01 548

原创 谁说一定要开发帮你上线模型,你也可以

​ 就业压力就像大家看到的,越来越难,那边降薪,那边裁员,你有幸保住工作,那也意味着之前10个人的部门干的活,现在可能是5个人在做,作为野生的数据挖掘工程师的必备技能,就是够野生,今天就给大家分享野生的另一技能。其实大部分公司,稍微业务成型都有模型后台的,可以配置各种模型,那万一你去了一家没有模型后台的公司,暂时没有开发帮你开发后台,那怎么办,那你可以自己把你的模型封装了api呀,那样子,你自己就撑起了一个模型部门了,当然这是说笑啦~~后台开发的兄弟,爱你们哦,谢谢你们之前帮我上线模型(我的...

2020-06-05 09:36:14 410

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除