- 博客(26)
- 资源 (11)
- 收藏
- 关注
原创 xshell连接docker环境中的ubuntu
一:环境windows10doceker:Server Version: 19.03.5docker 环境:ubuntu通过xshell连接docker中的ubunut步骤如下:注:参考地址1.Container安装ssh服务首先进入Container,进行以下步骤:① 安装sshsudo apt-get install openssh-server #安装ssh服务器 ,没...
2020-01-27 12:01:08 4414 3
转载 numpy中tril和triu的简单用法
参考网址:https://www.cnblogs.com/cymwill/p/7857456.html# https://www.cnblogs.com/cymwill/p/7857456.htmlimport numpy as nparr = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12], [13, 14, 15, 1...
2019-03-04 21:09:17 5008
转载 PIP下载国内镜像
参考网址:https://www.cnblogs.com/microman/p/6107879.htmlpip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyspider,这样就会从清华这边的镜像去安装pyspider库。
2019-02-12 22:14:03 1025
原创 解决to_csv存储效率低的一个方案
总所周知,pandas在分析领域给我们提供一个很好用的包,当然,如果我们的数据量很大,使用df.to_csv效率很低的时候我们可以使用pickle序列化来进行替代(小数据怎么都行,如果通过to_csv存储的文件达到1G左右的时候,那真的是存储的急人)关于pickle的详细使用可以参考网址:http://www.cnblogs.com/lincappu/p/8296078.html附上代码:...
2019-02-10 17:43:03 3743 2
原创 centos7升级内核启动失败 显示has invalid signatrue ,..load the kernel first
如果在centos更新内核后一直没法启动,然后更换内核版本问题依旧的时候,这个时候不是系统本身的问题,而是一些商业竞争的问题,我们可以直接进入bios,直接关闭secure boot,然后就可以正常使用了; 然后更新内核需要注意的是:首先安装库:yum install epel_release然后安装需要安装的:sudo yum group install -y “Dev...
2018-12-25 23:15:46 6163
转载 python实现stepwise回归
这是overflow的思路,先借鉴一下。from sklearn.datasets import load_bostonimport pandas as pdimport numpy as npimport statsmodels.api as smdata = load_boston()X = pd.DataFrame(data.data, columns=data.featu...
2018-12-14 11:52:53 11013 1
原创 python的file,time的一些知识点
1,open 和 with open的区别open是手动打开,不需要的就需要关闭,不关闭可能会发现未知的错误with open是自动打开,不需要的python会自动关闭2,遍历文本数据files = open('python.txt','r',encoding='utf-8')for line in files : print(line) files.close()`这样相对...
2018-12-13 14:20:32 531
原创 RStudio中help字体设置
help字体直接通过Tools>>Global options 来设置不管用,需要在 Rstudio安装文件中的resource中的R.css样式中的后面添加一段代码:就可以实现增加大小,具体多大可以设置数字的大小。body, td{ font-size: 28px !important; font-family: "Segoe UI" !important;}...
2018-12-12 17:42:44 3262
原创 centos7 打开wifi适配器(wifiadapter)和安装centos7 需要注意的
刚刚安装好centos7.6和windows10双系统,但是在打开centos10 之后 显示- no wifi-adaper found ,折腾了很久,终于在https://unix.stackexchange.com/questions/450874/centos-7-no-wifi-adapter-found 找到解决方案,使用下面三句代码解决,sudo rfkill un...
2018-12-09 17:40:53 22409 9
原创 阿里云的dataworks分组查找最早(大)或最晚(小)记录的两种方法
这是第一种办法,通过inner join(内连接)的形式来实现,SELECT *FROM ( SELECT t1.mobile,t1.consumer_no, t1.risk_score, t1.suspicious_register_score, t1.risk_register_score,t1.add_time FROM ( SELECT re.mobile, re.co...
2018-12-03 17:46:00 1090
原创 loc,iloc,列索引,布尔索引的使用
结论:1,loc,iloc,df.ename,df[‘ename’],df[[‘ename’]]都是引用的方式进行访问,也就是说被引用的数据发生改变,那么df数据也会发生改变2,如果只拿一列(一个特征值)数据,那么返回的一般是Series类型,达到两列或者以上,一般是Dataframe类型3,loc[0:1,:],iloc[0:1,:],对于loc是location的缩写,iloc中的i是i...
2018-11-26 09:02:21 1744
原创 loc,iloc,列索引,布尔索引的使用
结论:1,loc,iloc,df.ename,df[‘ename’],df[[‘ename’]]都是引用的方式进行访问,也就是说被引用的数据发生改变,那么df数据也会发生改变2,如果只拿一列(一个特征值)数据,那么返回的一般是Series类型,达到两列或者以上,一般是Dataframe类型3,loc[0:1,:],iloc[0:1,:],对于loc是location的缩写,iloc中的i是i...
2018-11-26 09:02:21 317
原创 python的concat等用法
1,numpy中的concatenate()函数:>>> a = np.array([[1, 2], [3, 4]])>>> b = np.array([[5, 6]])>>> np.concatenate((a, b), axis=0)array([[1, 2], [3, 4], [5, 6]])&...
2018-11-25 19:01:53 64104 1
原创 pandas中的stack,unstack和numpy,stack,hstack,vstack通俗理解
在网上看上很多关于numpy中stack的复杂解释,其实他的实际含义和用法很简单,被人理解复杂了,当然,我们先看pandas的用法:1,在我们常见的数据层次化结构分为两种,一种是花括号(一维数据),一种是表格(二维度数据),这个参考了如下网址https://www.cnblogs.com/bambipai/p/7658311.html左边的是一维结构(类似于Series结构),右边的是二维结...
2018-11-25 16:18:40 3947
原创 透视表的用法python
参考网址:https://blog.csdn.net/moxigandashu/article/details/694862691,交叉表(index,columns必须要给定)# index和columns是必须要指定的参数,margin为汇总项目,可以不要(也可以重命名)pd.crosstab(df.deptno,df.sal,margins=True) 2,透视表 piv...
2018-11-25 10:39:04 267
转载 bat脚本开启关闭mysql服务代码
开启代码:@echo offecho start mysqlService...pausenet start MySQL57pauseecho 启动mysql服务完成,请确认有没有错误发生。关闭代码: @echo offecho 确定要停止mysqlService... 服务吗?pausenet stop MySQL57echo 停止mysqlServi...
2018-11-25 09:50:23 2391
原创 oracle分析函数over的简单使用
Oracle over()函数的使用:在阿里云中datawork的over函数用法与这个是一样的用法:说在前面:over (partition by) 相当于groupby分组的用法,而且毕她的用法更加好用。select deptno,ename,sal, sum(sal) over (order by ename) 连续求和, sum(sal) over () 总和, -- 此处su...
2018-11-25 09:37:58 634
原创 三种增加DataFrame行的办法
第一种:在网上看到的,可以直接使用,python3.x的环境:from pandas import *from random import *df = DataFrame(columns=('lib', 'qty1', 'qty2')) # 生成空的pandas表for i in range(6): # 插入一行 df.loc[i] = [randint(-1, 1) for ...
2018-11-24 22:43:38 46964 1
原创 mmap的简单使用
参考网址:http://www.cnblogs.com/zhoujinyi/p/6062907.htmlhttp://www.cnblogs.com/huxiao-tee/p/4660352.html内存映射模块的使用mmap是一种虚拟内存映射的方法,好比:内存放目录,磁盘放数据,实现相对的快速读取# 下面对这段代码进行详细的说明:# m=mmap.mmap(fileno, lengt...
2018-11-22 20:56:07 926
原创 不同进制转换,bytes和str的转换
参考网址:http://www.cnblogs.com/hushaojun/p/7681148.html1,函数说明(帮助文档):oct() Return the octal representation of an integer.bin():Return the binary representation of an integer.ord() :Return the Unicode ...
2018-11-22 11:53:29 1104
原创 join函数的使用
Python中有join()和os.path.join()两个函数,具体作用如下:join(): 连接字符串数组。将字符串、元组、列表中的元素以指定的字符(分隔符)连接生成一个新的字符串os.path.join(): 将多个路径组合后返回# 1:join()函数的使用li1 = ['nihao','xiao','nidaye'] # 对于元祖来说也是一样print(' '.joi...
2018-11-22 11:26:16 3110
原创 yeild的一些使用
参考网址:https://www.pythoncentral.io/python-generators-and-yield-keyword/https://stackoverflow.com/questions/519633/lazy-method-for-reading-big-file-in-python1,yield就好比是生成迭代器的关键字,迭代器在需要的时候才会去拿数据,所以,第二...
2018-11-21 17:15:40 327
转载 泛化、实现、依赖和关联的区别
原文博客地址:http://www.cnblogs.com/linjiqin/p/3415440.htmla、实现表示类对接口的实现。UML图中实现使用一条带有空心三角箭头的虚线指向接口,如下:b、泛化表示类与类之间的继承关系、接口与接口之间的继承关系。UML图中实现使用一条带有空心三角箭头的实线指向基类,如下:c、依赖表现为函数中的参数(use a),是类与类之间的连接,表示...
2018-11-21 11:47:50 311
原创 nptepad++ 一些正则表达式的使用
1,把多行数据变成一行,如下面的图片所示:注意:那个‘替换为’方框中有一个空格。2,把原数字替换成其他格式的数字 :比如“ 1 ”,变成“ 1\n ”的形式:注意:查找目标框中的 需要通过()标记数字的正则代码,然后在‘替换为’中用’\1’来表示,当然:如果有多个数字需要标记,就需要使用’\1\2’来分别表示了。...
2018-11-21 09:52:46 1189
转载 50个常用sql语句(含数据)
Code:50个常用SQL语句 Student(S#,Sname,Sage,Ssex) 学生表 S#学号,主键 Course(C#,Cname,T#) 课程表 C#课程号,主键 SC(S#,C#,score) 成绩表 Teacher(T#,Tname) 教师表 T#教师编号,主键 问题: 1、查询“001”课程比“00...
2018-11-04 09:11:27 1761
转载 豆瓣评论数据词云画像()
-- coding:utf-8 --‘’’这段代码是从一个网站借用过来的,具体哪个网址一下子忘记了。可以直接运行。‘’’from selenium import webdriverimport timeimport codecsimport jiebaimport jieba.analyse as analysefrom wordcloud import WordCloudf...
2018-11-03 20:54:21 777
完全破解的editplus
2018-08-05
数据挖掘与数据化运营实战:思路、方法、技巧与应用]_卢辉.机械工业出版社
2018-07-29
统计学的世界-第8版 - 戴维·穆尔
2018-07-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人