weixin_43408110-CSDN博客

原创 # python列表知识点总结

python列表知识点总结1.索引和切片list1=[1,2,3,'string',[1,2,3]]# 索引print(list1[3])print(list1[3][2])# 切片print(list1[0:5:2])print(list1[::-1])2.添加元素append(),insert()str1=[1,2,3,'string',[1,2,3]]# appen...

2019-04-04 08:51:33 640

原创 # python字符串指点总结

python字符串指点总结1.Python字符串中也可以进行索引切片str1='hello python hello world'# 索引print(str1[1])# 切片变量[起始,结束,步长]print(str1[2:9:2])2.输入输出printprint()有五个参数，一般只要熟悉这3个参数print(values,sep,end)#value：要...

2019-04-04 08:12:07 134

翻译 apply函数家族

apply函数家族1.lapplylapply输出的为一个列表> students <- list(+ a1=list(name="James",age=25,gender="M",interest=c("reading","writing")),+ a2=list(name="Jenny",age=23,gender="F",interest

2019-03-01 11:03:33 239

翻译 # R使用逻辑向量

R使用逻辑向量逻辑运算符运算符描述&向量化AND一个绝对值向量化or&&单变量AND两个绝对值单变量OR在if表达式中，&&和||经常用来执行只需返回单元素逻辑向量的逻辑运算，但是当多元素向量使用&&时，会有风险，因为它会默默忽略运算符两侧的向量中除第一个元素以外的其他元素（即只注意第...

2019-03-01 08:40:00 1339

翻译 # R浅谈时间格式

R浅谈时间格式#返回当前值或者返回当前时间# 返回当前日期Sys.Date()[1] &quot;2019-02-28&quot;# 返回当前时间&amp;gt; Sys.time()[1] &quot;2019-02-28 17:32:06 CST&quot;#时间、日期是向量，可以当成数字进行运算as.Date(1000,&quot;2019-2-28&

2019-02-28 21:45:03 155

翻译 R使用正则表达式

R使用正则表达式#R里面自带的正则表达式grep，grepl,前者返回的是索引，后者返回的是逻辑向量telephone=c("123-23451", "1225-3123", "121-45672", "1332-1231", "1212-3212" ,"123456789")grep('^[0-9]{4}-[0-9]{4}$',telephone)output:[1] 2,4,5

2019-02-28 19:50:25 660

翻译 python时间序列2

python时间序列2使用偏置进行移位日期#锚定位置from pandas.tseries.offsets import Day,MonthEndnow=datetime.datetime(2011,11,17)# 锚定偏置量：MonthEndprint(now+3*Day())# MonthEnd将now这个日期移至本月末尾；如果日期已经是本月末尾了，就移至下月末尾算1print...

2019-02-22 16:08:12 556

翻译 python时间序列一

python时间序列1.显示当前日期import datetimenow=datetime.datetime.now()print(now)2.可以做时间上的差值运算delta=datetime.datetime(2019,02,22)-datetime.datetime(2019,01,01)print(delta)3.字符串与datet日期型互换1.strptime型v...

2019-02-22 15:21:40 343

原创 R语言时间序列分析

R语言时间序列分析预测后6期销售量# R语言时间序列分析revenue <- read.csv('D:\\DTLDownLoads\\软件配置\\桌面配置\\桌面小助手\\Desktop\\收入数据.csv')revenue# 数据转换（ts）转换为时间序列的格式revenue.ts <- ts(revenue[,2],frequency=12,start = c(2...

2019-02-21 17:32:48 3194 1

翻译 python分层索引+合并+重塑

python分层索引frame=pd.DataFrame({'a':range(7),'b':range(7,0,-1),'c':['one','one','one','two','two''two','two'],'d':[0,1,2,0,1,2,3]})# set_index:分层索引（类比透视表中的行标签）frame1=frame.set_index(['c','d'])print(...

2019-02-21 15:43:01 929

原创用R语言建立logistic回归模型

用R语言建立logistic回归模型公式：fm<-glm(formula,family=binomial(link=logit),data=data.frame)其中：link=logit可以不写。函数用途summary()展示拟合模型的详细结果coefficients()列出拟合模型的模型参数（截距项和斜率）fitted()列出拟合模型的预测值...

2019-02-20 22:13:32 51720 12

翻译 python数据处理

python数据处理1.删除重复值# 删除重复值data=pd.DataFrame({'k1':['one','two']*3+['two'],'k2':[1,1,2,3,3,4,4]})print(data)data_1=data.drop_duplicates()print(data_1)结果输出k1 k20 one 11 two 12 one 2...

2019-02-20 20:18:41 150

翻译描述性统计的概述与计算

描述性统计的概述与计算df=pd.DataFrame([[1.4,np.nan],[7.1,-4.5],[np.nan,np.nan],[0.75,-1.3]],index=['a','b','c','d'],columns=['one','two'])print(df)print(df.sum())print(df.sum(axis=1))print(df.sum(axis=1,ski...

2019-02-20 20:17:46 238

翻译 python数据处理（2）

离散化和分箱ages=[20,22,25,27,21,23,37,31,61,45,41,32]bins=[18,25,35,60,100]cats=pd.cut(ages,bins)print(cats)print(cats.codes) # 分箱的箱子数（0，1，2...）print(cats.categories)cc=pd.value_counts(cats) # 每个箱...

2019-02-20 20:17:06 124

翻译 pyhthon中pandas的排序和排名

pyhthon中pandas的排序和排名排序1.sort_index():对索引进行排序obj=pd.Series(range(4),index=['d','a','b','c'])print(obj.sort_index()) # 默认为对行进行排序(升序排序)frame=pd.DataFrame(np.arange(8).reshape((2,4)),index=['two','o...

2019-02-20 11:33:55 371

原创 pandas库的某些函数(1)

1.maximum：二元函数maximum：两个数组相对位置返回最大值import numpy as npimport randomx=np.random.randn(5)print('x：',x)y=np.random.randn(5)print('y':,y)print(np.maximum(x,y)结果显示x: [ 0.41040096 -0.89344657 -1.4...

2019-02-19 21:14:37 116

原创 Python中enumerate，zip函数的结合使用

Python中enumerate，zip函数的结合使用enumerate函数：遍历一个序列的同时追踪当前元素的索引。some_list=['foo','bar','baz']mapping={}for i,value in enumerate(some_list): mapping[value]=iprint(mapping)结果显示：{‘foo’: 0, ‘bar’: 1...

2019-02-19 20:22:38 12246 2

原创 R语言算法之聚类分析

R语言算法之聚类分析Kmeans聚类先以已知的鸢尾花数据集为例（它的类已知，为三类）加载数据集data(iris)# 查看数据集结构head(iris)数据处理：图中可以看出，数据的单位差不了多少，不需要对数据集进行标准化处理，但是在进行聚类分析的时候，我们是通过对其他的标量进行分析判断，所以对于分的类（iris里面的Species在新数据集中不需要）原数据保留，在新建的数据...

2019-02-18 11:24:18 1731

R语言十大算法之KNN案列R语言的机器算法的学习不是很难，把握清楚思路就可以进行操作了！不要慌，慢慢积累，一天一小部分的知识输入输出。首先，先了解以下什么是KNN吧（KNN近邻算法）？KNN是通过测量不同特征值之间的距离进行分类。它的思路是：如果一个样本在特征空间（你可以随便圈一个区域）中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别，其中K通常是不...

2019-02-17 21:35:54 2668

原创数据分析EXCEL常用统计函数

count家族：（计数）count:对含有数值的单元格进行计数counta:对有值的单元格进行计数（数值，文本，逻辑值）countblank:对空格单元格进行计数countif:对满足单个条件进行计数countif(条件区域，条件)...

2019-02-13 21:51:51 1288

原创 set()函数的简单使用

set()去重函数（独一无二）#1.基础用法：将单词中的单个元素拆分后去重print(set('hello'))output:{‘l’, ‘e’, ‘h’, ‘o’}#2.对列表遍历的每一个元素去重list=[1,2,3,4,5,4,3]s=set(list)for i in s: print(i)output:12345#基于以上操作；add()向s=set(l...

2019-02-02 15:40:11 291

weixin_43408110的博客