自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 # python列表知识点总结

python列表知识点总结1.索引和切片list1=[1,2,3,'string',[1,2,3]]# 索引print(list1[3])print(list1[3][2])# 切片print(list1[0:5:2])print(list1[::-1])2.添加元素append(),insert()str1=[1,2,3,'string',[1,2,3]]# appen...

2019-04-04 08:51:33 640

原创 # python字符串指点总结

python字符串指点总结1.Python字符串中也可以进行索引切片str1='hello python hello world'# 索引print(str1[1])# 切片 变量[起始,结束,步长]print(str1[2:9:2])2.输入输出printprint()有五个参数,一般只要熟悉这3个参数print(values,sep,end)#value:要...

2019-04-04 08:12:07 134

翻译 apply函数家族

apply函数家族1.lapplylapply输出的为一个列表> students <- list(+ a1=list(name="James",age=25,gender="M",interest=c("reading","writing")),+ a2=list(name="Jenny",age=23,gender="F",interest

2019-03-01 11:03:33 239

翻译 # R使用逻辑向量

R使用逻辑向量逻辑运算符运算符描述&向量化AND一个绝对值向量化or&&单变量AND两个绝对值单变量OR在if表达式中,&&和||经常用来执行只需返回单元素逻辑向量的逻辑运算,但是当多元素向量使用&&时,会有风险,因为它会默默忽略运算符两侧 的向量中除第一个元素以外的其他元素(即只注意第...

2019-03-01 08:40:00 1339

翻译 # R浅谈时间格式

R浅谈时间格式#返回当前值或者返回当前时间# 返回当前日期Sys.Date()[1] "2019-02-28"# 返回当前时间> Sys.time()[1] "2019-02-28 17:32:06 CST"#时间、日期是向量,可以当成数字进行运算as.Date(1000,"2019-2-28&

2019-02-28 21:45:03 155

翻译 R使用正则表达式

R使用正则表达式#R里面自带的正则表达式grep,grepl,前者返回的是索引,后者返回的是逻辑向量telephone=c("123-23451", "1225-3123", "121-45672", "1332-1231", "1212-3212" ,"123456789")grep('^[0-9]{4}-[0-9]{4}$',telephone)output:[1] 2,4,5

2019-02-28 19:50:25 660

翻译 python时间序列2

python时间序列2使用偏置进行移位日期#锚定位置from pandas.tseries.offsets import Day,MonthEndnow=datetime.datetime(2011,11,17)# 锚定偏置量:MonthEndprint(now+3*Day())# MonthEnd将now这个日期移至本月末尾;如果日期已经是本月末尾了,就移至下月末尾算1print...

2019-02-22 16:08:12 556

翻译 python时间序列一

python时间序列1.显示当前日期import datetimenow=datetime.datetime.now()print(now)2.可以做时间上的差值运算delta=datetime.datetime(2019,02,22)-datetime.datetime(2019,01,01)print(delta)3.字符串与datet日期型互换1.strptime型v...

2019-02-22 15:21:40 343

原创 R语言时间序列分析

R语言时间序列分析预测后6期销售量# R语言时间序列分析revenue <- read.csv('D:\\DTLDownLoads\\软件配置\\桌面配置\\桌面小助手\\Desktop\\收入数据.csv')revenue# 数据转换(ts)转换为时间序列的格式revenue.ts <- ts(revenue[,2],frequency=12,start = c(2...

2019-02-21 17:32:48 3194 1

翻译 python分层索引+合并+重塑

python分层索引frame=pd.DataFrame({'a':range(7),'b':range(7,0,-1),'c':['one','one','one','two','two''two','two'],'d':[0,1,2,0,1,2,3]})# set_index:分层索引(类比透视表中的行标签)frame1=frame.set_index(['c','d'])print(...

2019-02-21 15:43:01 929

原创 用R语言建立logistic回归模型

用R语言建立logistic回归模型公式:fm<-glm(formula,family=binomial(link=logit),data=data.frame)其中:link=logit可以不写。函数用途summary()展示拟合模型的详细结果coefficients()列出拟合模型的模型参数(截距项和斜率)fitted()列出拟合模型的预测值...

2019-02-20 22:13:32 51720 12

翻译 python数据处理

python数据处理1.删除重复值# 删除重复值data=pd.DataFrame({'k1':['one','two']*3+['two'],'k2':[1,1,2,3,3,4,4]})print(data)data_1=data.drop_duplicates()print(data_1)结果输出k1 k20 one 11 two 12 one 2...

2019-02-20 20:18:41 150

翻译 描述性统计的概述与计算

描述性统计的概述与计算df=pd.DataFrame([[1.4,np.nan],[7.1,-4.5],[np.nan,np.nan],[0.75,-1.3]],index=['a','b','c','d'],columns=['one','two'])print(df)print(df.sum())print(df.sum(axis=1))print(df.sum(axis=1,ski...

2019-02-20 20:17:46 238

翻译 python数据处理(2)

离散化和分箱ages=[20,22,25,27,21,23,37,31,61,45,41,32]bins=[18,25,35,60,100]cats=pd.cut(ages,bins)print(cats)print(cats.codes) # 分箱的箱子数(0,1,2...)print(cats.categories)cc=pd.value_counts(cats) # 每个箱...

2019-02-20 20:17:06 124

翻译 pyhthon中pandas的排序和排名

pyhthon中pandas的排序和排名排序1.sort_index():对索引进行排序obj=pd.Series(range(4),index=['d','a','b','c'])print(obj.sort_index()) # 默认为对行进行排序(升序排序)frame=pd.DataFrame(np.arange(8).reshape((2,4)),index=['two','o...

2019-02-20 11:33:55 371

原创 pandas库的某些函数(1)

1.maximum:二元函数maximum:两个数组相对位置返回最大值import numpy as npimport randomx=np.random.randn(5)print('x:',x)y=np.random.randn(5)print('y':,y)print(np.maximum(x,y)结果显示x: [ 0.41040096 -0.89344657 -1.4...

2019-02-19 21:14:37 116

原创 Python中enumerate,zip函数的结合使用

Python中enumerate,zip函数的结合使用enumerate函数:遍历一个序列的同时追踪当前元素的索引。some_list=['foo','bar','baz']mapping={}for i,value in enumerate(some_list): mapping[value]=iprint(mapping)结果显示:{‘foo’: 0, ‘bar’: 1...

2019-02-19 20:22:38 12246 2

原创 R语言算法之聚类分析

R语言算法之聚类分析Kmeans聚类先以已知的鸢尾花数据集为例(它的类已知,为三类)加载数据集data(iris)# 查看数据集结构head(iris)数据处理:图中可以看出,数据的单位差不了多少,不需要对数据集进行标准化处理,但是在进行聚类分析的时候,我们是通过对其他的标量进行分析判断,所以对于分的类(iris里面的Species在新数据集中不需要)原数据保留,在新建的数据...

2019-02-18 11:24:18 1731

原创 R语言十大算法之KNN案列

R语言十大算法之KNN案列R语言的机器算法的学习不是很难,把握清楚思路就可以进行操作了!不要慌,慢慢积累,一天一小部分的知识输入输出。首先,先了解以下什么是KNN吧(KNN近邻算法)?KNN是通过测量不同特征值之间的距离进行分类。它的思路是:如果一个样本在特征空间(你可以随便圈一个区域)中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别,其中K通常是不...

2019-02-17 21:35:54 2668

原创 数据分析EXCEL常用统计函数

count家族:(计数)count:对含有数值的单元格进行计数counta:对有值的单元格进行计数(数值,文本,逻辑值)countblank:对空格单元格进行计数countif:对满足单个条件进行计数countif(条件区域,条件)...

2019-02-13 21:51:51 1288

原创 set()函数的简单使用

set()去重函数(独一无二)#1.基础用法:将单词中的单个元素拆分后去重print(set('hello'))output:{‘l’, ‘e’, ‘h’, ‘o’}#2.对列表遍历的每一个元素去重list=[1,2,3,4,5,4,3]s=set(list)for i in s: print(i)output:12345#基于以上操作;add()向s=set(l...

2019-02-02 15:40:11 291

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除