自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 桑基图-plotly

##读入数据URL <- paste0("https://cdn.rawgit.com/christophergandrud/networkD3/","master/JSONdata/energy.json")Energy <- jsonlite::fromJSON(URL)##查看数据构成str(Energy)List of 2 $ nodes:'data.frame': 4...

2018-03-24 20:23:55 2756 1

原创 python 调用openstreet

import numpy as npimport pandas as pdimport seaborn as snsimport foliumimport webbrowserfrom folium.plugins import HeatMapposi=pd.read_excel("/Users/mike/Desktop/heatmap.xlsx")num = 10lat =...

2018-02-27 11:45:41 821

原创 pandas apply vs agg vs transform

Data Prepartionimport pandas as pdimport numpy as npdf = pd.DataFrame({'A': [1, 1, 2, 2],'B': [1, 2, 3, 4],'C': np.random.randn(4)})2.先来一波正常聚合操作1.求和 sum,计数(非去重:size 或者 len 都可以,去重的:pd.Se

2017-11-14 16:18:07 3083

原创 pandas 实现 sql 中的row_number,dense_rank,rank

data df=pd.DataFrame({'Year':[2012,2013,2013,2014],'Value':[10,20,25,30]})---------------------------------df Value Year0 10 20121 20 20132 25 20133 30 2014实现row_number的排名

2017-11-10 12:38:52 6474

原创 python 实现动态行转列

python 代码import pandas as pdfrom collections import defaultdictgeo_df=pd.read_excel('path\geo.xlsx')geo_dict=defaultdict(list)for k,v in geo_df.values: geo_dict[k].append(v)for i,j in geo_dict

2017-07-04 15:22:38 1034

转载 用心理学解释用户行为

斯金纳同学(Burrhus Frederic Skinner,1904—1990,美国心理学家,新行为主义学习理论的创始人)是一名很严肃的心理学家,他摒弃了传统心理学中“心理活动”的不可考也不可靠的分析,将人的内部思维作为黑盒函数,对心理学的外在刺激与外在行为作为自变量和函数结果,进行科学实验分析,这就是“行为心理学”。而“斯金纳箱”,则是他的一项最著名的研究成果。什么是斯金纳箱?

2017-02-14 17:52:08 2400

原创 R -ggplot2 气泡图

关键词点击成本投入产出比总费用MTF词8.10.1732673有入金的词16.91.1523740外汇词5.50.1813979竞品词3.61.4612765外汇交易词6.30.6111285炒外汇词8.00.329866外汇平台词

2015-03-26 11:18:45 13386

转载 计算熵

1 计算熵我们检查的属性是是否出去玩。用Excel对上面数据的play变量的各个取值排个序(这个工作簿里把“play”这个词去掉),一共是14条记录,你能数出取值为yes的记录有9个,取值为no的有5个,我们说这个样本里有9个正例,5个负例,记为S(9+,5-),S是样本的意思(Sample)。这里熵记为Entropy(S),计算公式为:Entropy(S)=-(9/14)*log

2014-12-18 13:41:42 1944

转载 R 语言 RFM 模型实现

以前一直在猜测RFM的实现原理,今天总算了解了一点直接附上R code,google所得:##Creating Random Sales Data of the format CustomerId (unique to each customer), Sales.Date,Purchase.Valuesales=data.frame(sample(1000:1999,repla

2014-12-09 15:35:12 1485

原创 R-统计--参数的假设检验备忘

r代码> a=c( 914, 920, 910, 934, 953,940, 912, 924, 930)> t.test(a,mu=950,alternative='less')        One Sample t-testdata:  a t = -4.9589, df = 8, p-value = 0.0005542alternative hypoth

2014-12-04 17:31:08 1271

原创 case when 运用的一点提醒

对于运用sql 的同学对 case when 肯定很熟悉,这边就不贴出 case when  的语法了,直接上例子说明:下面是构建的测试数据,插入语句就不附上了。1.如图所示,结果应该和你想象的没什么不同2.改变一下SUM 的位置咦,好像结果完全相同啊,我是不是在忽悠你们啊,嘿嘿3.那么接下来我们修改一下 条件pay_sum>=20 and

2014-12-02 14:43:26 428

原创 数据分析---常用检验收录

t检验适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。包括配对资料间、样本与均数间、两样本均数间比较三种,三者的计算公式不能混淆。(处理时不用判断分布类型就可以使用t检验)t'检验应用条件与t检验大致相同,但t′检验用于两组间方差不齐时,t′检验的计算公式实际上是方差不齐时t检验的校正公式。U检验应用条件与t检验基本一致,只是当大样本时用U检验,而

2014-11-21 10:26:14 565

转载 深度分析DROP,TRUNCATE与DELETE的区别【我的数据库之路系列】

这次特意从数据库块的层次深度分析一下DROP,TRUNCATE和DELETE的区别:     在此之前先为那些初学数据库的童鞋们阐述2个概念,如果你还没有真正理解这2个概念那也请你看完:DML语句与DDL语句。简单的DML与DDL概念:     我们不去重复那些抽象又没用的概念,简单的说DML语句就是增删改(INSERT,DELETE,UPDATE),DDL就是对数

2013-10-31 16:14:31 715

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除