自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 如何安全的做词云? jiebaR与wordcloud2实战

因为工作保密性需要,又开始上手R语言,保障数据安全。工作时间久了(此处有卖老嫌疑),是面对新知识比从前更有耐心,也更愿意优化代码。网上作词云的工具很多,但如果是公司比较重要的数据信息,我不建议用网上工具,会造成信息泄露。所以,不如花点时间,琢磨以下自己去做。要做词云,有两件事情要做:1)文本分词;2)制作词云。先说文本分词,主要用到jiebaR包,处理txt文本,变成关键词+频次的数据框形式...

2022-03-08 21:55:15 434

原创 浅谈数据分析师职业发展之路

看了一眼上次更新文章的时间,居然是两年前了,检讨,我的确不是一个合格的分享者。近几年我从数据分析师升为高级主管、再到高级经理,实现了职场的大跨步前进,也是因为更多精力投入到管理工作,所以分享文章也就暂时告一段落,只是没想到一晃两三年,感慨时间飞逝。回归正题,从我自己的职业发展来和大家分享,数据分析这条路到底怎么走?1.根据自己所在部门决定发展方向部门分为2种:1)一线业务部门(比如销售部、市场部);2)中台部门(比如运营部、技术部)如果处在业务部门,主要就是深入了解业务知识。将分析与业务

2021-07-24 16:49:39 766

原创 Python学习笔记——快速入门篇

陆陆续续学习了Python一段时间,发现又已经很久没更新笔记,之前写的R语言编程艺术都没有结束,又开始新的笔记内容,似乎不太厚道,不过R语言编程艺术学习笔记还是会坚持写完,善始善终嘛,哈哈。Python最近几年真的很火,有多火,火到周围程序员、分析师、甚至财务都在跃跃欲试,在这种大环境下,多会一门编程会扩大视野,对职业发展也比较有利。好了,切入正题,Python怎么入门?入门应该做什么?...

2019-04-30 16:45:57 466

原创 R语言编程艺术学习笔记——第五章数据框

距离上一次分享又过了一段时间,要坚持真的不容易,所以自律真的是人身上非常重要的品质。继续捡回R语言编程艺术系列,这真的是一本不错的R语言经典书籍,有很多细节值得细细思考。话不多说,开始第五章数据框的笔记。1.数据框的创建data.frame()用来创建数据框,函数包含参数如下:data.frame(..., row.names = NULL, check.rows = FALSE...

2019-03-27 22:31:24 544

原创 R画图实战之——桑基图

   之所以会想到写关于桑基图的内容是因为最近工作需要,研究了下桑基图,发现网络上和桑基图相关的真实可用的资料少之又少,所以决定出这篇博客,讲讲如何用R语言绘制桑基图。什么是桑基图?它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,通常应用于能源、材料成分、金融等数据的可视化分析。因1898年Matthew Henry Phineas Riall Sankey绘制的“蒸汽机...

2018-12-18 17:32:49 22141 16

原创 时间序列分析预测实战之ARIMA模型

接着上一章的内容,当数据超过100个,要对数据进行更加精准的预测,该用什么样的方法呢?这时候ARIMA模型就登场了,全称是自回归差分移动平均模型,使用这个模型建模,具体的操作步骤如下:1)观察时序的平稳性和随机性;2)选择具体的模型;3)拟合模型;4)根据选定模型进行预测;5)模型评价;我将用一个实际的例子分步骤进行详细的讲解。一、观察时序的平稳性和随机性这里选...

2018-11-09 16:40:21 18473 2

原创 时间序列分析预测实战之指数平滑法

一、什么是时间序列分析?在工作中,常常要对数据进行预测,确定业务未来的发展趋势,进而配置相关的营销策略、制定业务目标,由此引申出了一个重要的用数据预测未来的方法——时间序列分析,今天和大家分享就是实战中难度系数比较高的时间序列分析,一种根据一段时间内数据的趋势,进行预测的模型方法,实际中主要用于对销售数据、金融数据的预测。一般来说,要对数据进行预测,需要分析时间段内数据的影响因素是哪种,这...

2018-10-31 14:50:25 27361 6

原创 R语言编程艺术学习笔记—第四章列表

终于又回来写《R语言编程艺术》的学习笔记了,坚持真的很难,战胜懒惰,坚持把这本书的学习笔记写完,自我监督!坚持分享之路!列表这章主要包含列表的创建、增加、删除和函数应用。列表也是向量,但是和向量有不同之处,向量中的元素只能是一种类型,但是列表中的组件可以是多种类型。一、创建列表使用list()来创建向量,通过$来指定某个组件,比如:> a<-list(age=23...

2018-08-31 23:17:17 459

原创 ggplot2绘图技巧之条形图

今天和大家分享的是关于ggplot2的快速画图入门攻略,会在接下来三章教大家如何绘制工作中最常用的条形图、直方图和折线图,讲解ggplot2的基本语法规则、简单的图形修饰,以及图形进阶功能—分面,不做深入的研究,简单易上手、使用就是王道!一、ggplot2基本语法规则ggplot(数据集,aes(x=横坐标,y=纵坐标,fill=填充颜色,color=边框颜色))+geom_bar()/g...

2018-07-31 23:29:44 7706

原创 用各种工具对数据进行分类汇总

数据分类汇总的方法有很多种,工具也有很多,这次为大家一一介绍,各种工具如何进行分类汇总,大家自行判断,觉得哪种最好用,就用哪种,毕竟工具不重要,高效出结果才最重要。为了方便举例,所用的数据集就是鸾尾花数据集,5个字段(Sepal.Length、Sepal.Width、Petal.Length、Petal.Width、Species),每个字段150个观测值,1)根据Species来计算各种类型的花...

2018-06-04 15:10:19 5437

原创 R语言数据集行列互换技巧

现在给大家介绍的数据处理技巧是长转宽,也就相当于Excel中的转置,不过用R语言实现的长转宽还有数据合并的功能,自然比Excel强大多了。这里给大家介绍4个函数,其中melt()、dcast()来自reshape2包,gather()、spread()来自tidyr包一、宽转长——melt()、gather()mydata<-data.frame( name=c("store1","st...

2018-05-17 11:50:08 35386

原创 R语言数据合并与连接技巧

最近仍然在陆陆续续自学,真.生命不息学习不止,这次和大家分享一些实用的数据处理技巧,干货满满!一、数据合并涉及函数cbind(),rbind(),bind_rows(),bind_cols().cbind(),rbind()在我前面写的《R语言编程艺术学习笔记》中已经出现过了,很好用,举个栗子:> data1<-data.frame(+ nameA=c("Tom","Jack",...

2018-05-16 17:32:21 31818

原创 R语言编程艺术学习笔记—第三章数组和矩阵

现在是第三章,数组和矩阵,先列举本章的概述内容:1.创建矩阵2.矩阵运算3.调用矩阵的行和列4.增加或删除行和列5.矩阵VS向量6.案例1:生成协方差矩阵7.案例2:寻找异常值8.案例3:找到图中距离最近的一对端点一、创建矩阵使用matrix()函数创建矩阵,nrow指定行数,ncol指定列数> y<-matrix(c(1,2,3,4),nrow=2,ncol=2)> y ...

2018-04-27 10:41:18 1393

原创 R语言聚类分析-kmeans聚类分析实战

这次分享的是在工作中经常用到的聚类分析,只要是工作中涉及到客户分群,哪能不用到聚类分析呢?聚类分析涉及的方法有层次聚类、kmeans聚类、密度聚类等,这里主要介绍最容易上手的kmeans聚类算法,上手就是王道!kmeans聚类原理:基于原型的、划分的距离技术,它试图发现用户指定个数(K)的簇。统计学原理请大家自觉完成自学~~实战一:老板的需求:将17家门店分成3类,依据指标是销售金额和客户数量,其...

2018-04-12 22:47:17 29597 12

原创 R语言编程艺术学习笔记—第二章

第二章开始就是正式、深入了解R语言的知识点,首先开始了解的是向量相关的知识,牢记三大要点,贯穿始终:循环补齐、筛选、向量化。1.添加、删除向量增加向量主要用插入法,利用向量索引,去达到增加的目的,如下例所示:> x<-c(1:4)> x[1] 1 2 3 4> x<-(1:2,5,3:4)> x<-c(x[1:2],5,x[3:4])> x...

2018-02-07 15:56:49 1304

原创 R语言编程艺术学习笔记—第一章

断断续续学习R语言已经很久,一直想要记录下自己学习时的所想所得,但是始终没有行动,这次终于决定记录下学习R语言编程艺术时的所思所悟,原因是第二次读这本书,终于意识到书中的精髓,想要和大家分享,如果有理解不对的地方,也欢迎大家批评指正。第一章   快速入门刚开始认识R语言,最重要是了解R语言中数据结构(当然,安装和启动我略掉了,大家记得安好Rstudio)。1.向量向量包括字符型向量和数值型向量,注...

2018-01-24 21:52:39 776 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除