自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 资源 (11)
  • 收藏
  • 关注

原创 xshell连接docker环境中的ubuntu

一:环境windows10doceker:Server Version: 19.03.5docker 环境:ubuntu通过xshell连接docker中的ubunut步骤如下:注:参考地址1.Container安装ssh服务首先进入Container,进行以下步骤:① 安装sshsudo apt-get install openssh-server #安装ssh服务器 ,没...

2020-01-27 12:01:08 4414 3

转载 numpy中tril和triu的简单用法

参考网址:https://www.cnblogs.com/cymwill/p/7857456.html# https://www.cnblogs.com/cymwill/p/7857456.htmlimport numpy as nparr = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12], [13, 14, 15, 1...

2019-03-04 21:09:17 5008

转载 PIP下载国内镜像

参考网址:https://www.cnblogs.com/microman/p/6107879.htmlpip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyspider,这样就会从清华这边的镜像去安装pyspider库。

2019-02-12 22:14:03 1025

原创 解决to_csv存储效率低的一个方案

总所周知,pandas在分析领域给我们提供一个很好用的包,当然,如果我们的数据量很大,使用df.to_csv效率很低的时候我们可以使用pickle序列化来进行替代(小数据怎么都行,如果通过to_csv存储的文件达到1G左右的时候,那真的是存储的急人)关于pickle的详细使用可以参考网址:http://www.cnblogs.com/lincappu/p/8296078.html附上代码:...

2019-02-10 17:43:03 3743 2

原创 centos7升级内核启动失败 显示has invalid signatrue ,..load the kernel first

如果在centos更新内核后一直没法启动,然后更换内核版本问题依旧的时候,这个时候不是系统本身的问题,而是一些商业竞争的问题,我们可以直接进入bios,直接关闭secure boot,然后就可以正常使用了;  然后更新内核需要注意的是:首先安装库:yum install epel_release然后安装需要安装的:sudo yum group install -y “Dev...

2018-12-25 23:15:46 6163

转载 python实现stepwise回归

这是overflow的思路,先借鉴一下。from sklearn.datasets import load_bostonimport pandas as pdimport numpy as npimport statsmodels.api as smdata = load_boston()X = pd.DataFrame(data.data, columns=data.featu...

2018-12-14 11:52:53 11013 1

原创 python的file,time的一些知识点

1,open 和 with open的区别open是手动打开,不需要的就需要关闭,不关闭可能会发现未知的错误with open是自动打开,不需要的python会自动关闭2,遍历文本数据files = open('python.txt','r',encoding='utf-8')for line in files : print(line) files.close()`这样相对...

2018-12-13 14:20:32 531

原创 RStudio中help字体设置

help字体直接通过Tools>>Global options 来设置不管用,需要在 Rstudio安装文件中的resource中的R.css样式中的后面添加一段代码:就可以实现增加大小,具体多大可以设置数字的大小。body, td{ font-size: 28px !important; font-family: "Segoe UI" !important;}...

2018-12-12 17:42:44 3262

原创 centos7 打开wifi适配器(wifiadapter)和安装centos7 需要注意的

刚刚安装好centos7.6和windows10双系统,但是在打开centos10 之后 显示- no wifi-adaper found ,折腾了很久,终于在https://unix.stackexchange.com/questions/450874/centos-7-no-wifi-adapter-found 找到解决方案,使用下面三句代码解决,sudo rfkill un...

2018-12-09 17:40:53 22409 9

原创 阿里云的dataworks分组查找最早(大)或最晚(小)记录的两种方法

 这是第一种办法,通过inner join(内连接)的形式来实现,SELECT *FROM ( SELECT t1.mobile,t1.consumer_no, t1.risk_score, t1.suspicious_register_score, t1.risk_register_score,t1.add_time FROM ( SELECT re.mobile, re.co...

2018-12-03 17:46:00 1090

原创 loc,iloc,列索引,布尔索引的使用

结论:1,loc,iloc,df.ename,df[‘ename’],df[[‘ename’]]都是引用的方式进行访问,也就是说被引用的数据发生改变,那么df数据也会发生改变2,如果只拿一列(一个特征值)数据,那么返回的一般是Series类型,达到两列或者以上,一般是Dataframe类型3,loc[0:1,:],iloc[0:1,:],对于loc是location的缩写,iloc中的i是i...

2018-11-26 09:02:21 1744

原创 loc,iloc,列索引,布尔索引的使用

结论:1,loc,iloc,df.ename,df[‘ename’],df[[‘ename’]]都是引用的方式进行访问,也就是说被引用的数据发生改变,那么df数据也会发生改变2,如果只拿一列(一个特征值)数据,那么返回的一般是Series类型,达到两列或者以上,一般是Dataframe类型3,loc[0:1,:],iloc[0:1,:],对于loc是location的缩写,iloc中的i是i...

2018-11-26 09:02:21 317

原创 python的concat等用法

 1,numpy中的concatenate()函数:>>> a = np.array([[1, 2], [3, 4]])>>> b = np.array([[5, 6]])>>> np.concatenate((a, b), axis=0)array([[1, 2], [3, 4], [5, 6]])&...

2018-11-25 19:01:53 64104 1

原创 pandas中的stack,unstack和numpy,stack,hstack,vstack通俗理解

在网上看上很多关于numpy中stack的复杂解释,其实他的实际含义和用法很简单,被人理解复杂了,当然,我们先看pandas的用法:1,在我们常见的数据层次化结构分为两种,一种是花括号(一维数据),一种是表格(二维度数据),这个参考了如下网址https://www.cnblogs.com/bambipai/p/7658311.html左边的是一维结构(类似于Series结构),右边的是二维结...

2018-11-25 16:18:40 3947

原创 透视表的用法python

参考网址:https://blog.csdn.net/moxigandashu/article/details/694862691,交叉表(index,columns必须要给定)# index和columns是必须要指定的参数,margin为汇总项目,可以不要(也可以重命名)pd.crosstab(df.deptno,df.sal,margins=True) 2,透视表 piv...

2018-11-25 10:39:04 267

转载 bat脚本开启关闭mysql服务代码

开启代码:@echo offecho start mysqlService...pausenet start MySQL57pauseecho 启动mysql服务完成,请确认有没有错误发生。关闭代码: @echo offecho 确定要停止mysqlService... 服务吗?pausenet stop MySQL57echo 停止mysqlServi...

2018-11-25 09:50:23 2391

原创 oracle分析函数over的简单使用

Oracle over()函数的使用:在阿里云中datawork的over函数用法与这个是一样的用法:说在前面:over (partition by) 相当于groupby分组的用法,而且毕她的用法更加好用。select deptno,ename,sal, sum(sal) over (order by ename) 连续求和, sum(sal) over () 总和, -- 此处su...

2018-11-25 09:37:58 634

原创 三种增加DataFrame行的办法

第一种:在网上看到的,可以直接使用,python3.x的环境:from pandas import *from random import *df = DataFrame(columns=('lib', 'qty1', 'qty2')) # 生成空的pandas表for i in range(6): # 插入一行 df.loc[i] = [randint(-1, 1) for ...

2018-11-24 22:43:38 46964 1

原创 mmap的简单使用

参考网址:http://www.cnblogs.com/zhoujinyi/p/6062907.htmlhttp://www.cnblogs.com/huxiao-tee/p/4660352.html内存映射模块的使用mmap是一种虚拟内存映射的方法,好比:内存放目录,磁盘放数据,实现相对的快速读取# 下面对这段代码进行详细的说明:# m=mmap.mmap(fileno, lengt...

2018-11-22 20:56:07 926

原创 不同进制转换,bytes和str的转换

参考网址:http://www.cnblogs.com/hushaojun/p/7681148.html1,函数说明(帮助文档):oct() Return the octal representation of an integer.bin():Return the binary representation of an integer.ord() :Return the Unicode ...

2018-11-22 11:53:29 1104

原创 join函数的使用

Python中有join()和os.path.join()两个函数,具体作用如下:join(): 连接字符串数组。将字符串、元组、列表中的元素以指定的字符(分隔符)连接生成一个新的字符串os.path.join(): 将多个路径组合后返回# 1:join()函数的使用li1 = ['nihao','xiao','nidaye'] # 对于元祖来说也是一样print(' '.joi...

2018-11-22 11:26:16 3110

原创 yeild的一些使用

参考网址:https://www.pythoncentral.io/python-generators-and-yield-keyword/https://stackoverflow.com/questions/519633/lazy-method-for-reading-big-file-in-python1,yield就好比是生成迭代器的关键字,迭代器在需要的时候才会去拿数据,所以,第二...

2018-11-21 17:15:40 327

转载 泛化、实现、依赖和关联的区别

原文博客地址:http://www.cnblogs.com/linjiqin/p/3415440.htmla、实现表示类对接口的实现。UML图中实现使用一条带有空心三角箭头的虚线指向接口,如下:b、泛化表示类与类之间的继承关系、接口与接口之间的继承关系。UML图中实现使用一条带有空心三角箭头的实线指向基类,如下:c、依赖表现为函数中的参数(use a),是类与类之间的连接,表示...

2018-11-21 11:47:50 311

原创 nptepad++ 一些正则表达式的使用

1,把多行数据变成一行,如下面的图片所示:注意:那个‘替换为’方框中有一个空格。2,把原数字替换成其他格式的数字 :比如“ 1 ”,变成“ 1\n ”的形式:注意:查找目标框中的 需要通过()标记数字的正则代码,然后在‘替换为’中用’\1’来表示,当然:如果有多个数字需要标记,就需要使用’\1\2’来分别表示了。...

2018-11-21 09:52:46 1189

转载 50个常用sql语句(含数据)

Code:50个常用SQL语句 Student(S#,Sname,Sage,Ssex) 学生表 S#学号,主键 Course(C#,Cname,T#) 课程表 C#课程号,主键 SC(S#,C#,score) 成绩表 Teacher(T#,Tname) 教师表 T#教师编号,主键 问题: 1、查询“001”课程比“00...

2018-11-04 09:11:27 1761

转载 豆瓣评论数据词云画像()

-- coding:utf-8 --‘’’这段代码是从一个网站借用过来的,具体哪个网址一下子忘记了。可以直接运行。‘’’from selenium import webdriverimport timeimport codecsimport jiebaimport jieba.analyse as analysefrom wordcloud import WordCloudf...

2018-11-03 20:54:21 777

powerdesigner_comment转name_name转comment

可以很好的实现comment和name之间的相互转换,针对mysql数据库表的设计很方便

2018-11-21

50个常用sql语句的数据

直接可以导入到mysql数据库,如果是其他的数据库,需要手动的修改一下里面的命令。。。

2018-11-03

proxifier代理 包含密钥

一个很好用的软件,亲测可用,里面的图片就是密钥,我使用的时间是2018-9-13

2018-09-13

完全破解的editplus

EditPlus一套功能强大,可取代记事本的文字编辑器,EditPlus编辑器拥有无限制的撤消与重做、英文拼字检查、自动换行、列数标记、搜寻取代、同时编辑多文件、全屏幕浏览功能,批量转换文件编码

2018-08-05

数据挖掘与数据化运营实战:思路、方法、技巧与应用]_卢辉.机械工业出版社

《数据挖掘与数据化运营实战:思路、方法、技巧与应用》是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实的实践应用案例和场景的著作,更是创造性地针对数据化运营中不同分析挖掘课题类型,推出一一对应的分析思路集锦和相应的分析技巧集成,为读者提供“菜单化”实战锦囊的著作。作者结合自己数据化运营实践中大量的项目经验,用通俗易懂的“非技术”语言和大量活泼生动的案例,围绕数据分析挖掘中的思路、方法、技巧与应用,全方位整理、总结、分享,帮助读者深刻领会和掌握“以业务为核心,以思路为重点,以分析技术为辅佐”的数据挖掘实践应用宝典。 卢辉,阿里巴巴商业智能部数据分析专家,从事数据库营销和数据化运营分析多年,曾在不同行业以商务拓展(BD)经理、项目经理、市场营销部经理、高级咨询顾问、数据分析专家的身份亲历大量的数据库营销和互联网行业数据化运营应用项目。目前在阿里巴巴主要从事数据化运营的数据挖掘规划、项目管理、实施,拥有比较丰富的互联网行业数据化运营项目经验。关注数据化运营的规划和数据挖掘项目的管理。

2018-07-29

统计学的世界-第8版 - 戴维·穆尔

本书一点儿也不枯燥乏味,恰恰相反,它是那样生动有趣,深入浅出地把统计学的概念和分析方法呈现在你面前。通过一个个真实的小故事,本书能让你在会心的微笑中不知不觉地增长专业知识,提高分析水平。这是一本能给你带来乐趣的书,也是一本能让你更加睿智的书。

2018-07-01

PLSQL developer12.0.4 64位 含注册码

里面包含 PLSQLdeveloper 12.0.4 英文版 以及 中文包 还有一个亲测可用的注册码

2018-05-17

深入浅出Python(中文版)

确实适合入门者去学习的书籍,而且作者的视角和别人很不一样,容易上手

2018-05-17

PDF Password Remover PDF删除密码

PDF Password Remover PDF删除密码保护,完全破解版

2017-06-10

vc6.0助手破解版

这个软件之后VC++6.0将变得更加人性化,例如我们打了左括号,右括号会自动弹出,自己已经写好函数也会能够自动的提示我们,关键字能够使用不同颜色高亮显示

2013-03-23

长沙达内面试题锦集

扎实的基本功+良好的口头表达=高薪工作;在面试之前好好看看这本书,也就意味着我们在面试的时候可以轻松的回答出面试官的专业考核,很值得一看!!!

2012-12-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除