自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

傅劲的专栏

说数+闲聊

  • 博客(32)
  • 收藏
  • 关注

原创 代码优化的层次

代码优化的逻辑思维

2017-04-04 09:14:50 820

原创 可视化分析工具Qlik进阶

不再是商业智能BI的Congons和水晶报表用图表透视数据,不再是Flash交互增强的MSTR用图表体验数据,今天的Tableau和Qlik可视化分析技术是用可视化解读和操作数据。Qlik是一个架构灵活,高度开放的系统,下面通过三个功能点,介绍Qlik深度定制的技巧。定制Qlik的数据导出在Qlik中右键点击工作表Sheet中的图表控件,弹出菜单中有“导出数

2016-03-07 13:47:24 2959 1

原创 数据分析-主成分分析

用Excel做主成分分析,计算特征值特征向量

2016-02-25 11:34:45 3440

原创 数据分析-回归分析读书笔记

用案例讲解如何在Excel中做线性回归、多元线性回归和逻辑回归

2016-02-16 22:06:05 2242

原创 数据分析-可视化挖掘读书笔记

数据可视化 数据挖掘

2016-02-16 22:03:59 1635

原创 软件开发人员的七级台阶

今天和小明同学聊完前端开发同学的能力后,整理一下七级的能力模型,希望能给从事软件开发的同学一点参考和启发。一级-实际使用会使用一个产品或者框架,例1:使用excel的公式函数和图表完成几份统计表格和一组分析视图,完成了公司老板安排的一项实际工作任务;例2:使用react框架完成公司的门户网站的前端开发,自己学习做的练习就不包括在内二级-精通工具

2016-02-08 23:58:58 743

原创 数据分析-淘宝卖家的数据分析

在淘宝的历史上有二个广为人”用“的数据产品《数据魔方》和《量子恒道》。魔方侧重行业指标,量子侧重店铺行为,二者合并赋予淘宝上数据玩家巨大的潜能。举个例子,看看玩家是的如何用玩转淘宝数据的。淘宝卖家要给宝贝撰写一个“宝贝标题”,长度限定30位的中文,在搜索时代是惜字如金,如何确定用那些词呢?比较有趣但绝对不是巧合的是,玩家的分析从《数据魔方》开始,到《量子恒道》结束,

2016-02-07 00:21:52 3998

原创 数据分析-可视化数据分析

走投无路选择视化数据分析在做POI(Point of Interest)兴趣点的时候,最困扰我的问题是每天产出POI数据的质量。POI主要有三种数据来源:1. 购买的季度更新的图商POI数据,四维和高德的都用过,实地采集的POI数据质量最好但是更新频率太低,一个季度有太多店铺开张和关门2. 交换来的业务数据中的POI信息,搜房做房产有小区的POI,点评做

2016-02-07 00:19:42 2256

原创 数据案例-蓝米手机的精准广告营销

背景介绍:假设我是大米手机的数据分析师大傅,今天收到市场运营小旋同学的春节投放需求,在大米平台的DMP投放展示广告,做促销蓝米手机活动,投放预算是100万,同时悄悄告诉我,如果投放ROI超过2,她们市场运营总监设立奖励金额为(n-2)*1万的奖金。大傅是如何选取目标人群做精准广告投放呢?1. 广告数据和数据估算100w的投放,ROI为2的时候,目标销售额为100w*

2016-02-07 00:17:51 947

原创 一个前端报表设计器的设计分析

一个计分析前端报表设计器的设响应“忙碌的农夫”同学的提议,讲解一个前端设计的例子。报表设计器是一个布局设计容器,可以将各种图表控件拖拽进去,然后调整控件的大小和位置,做出一个美观实用的分析界面。举一个简单的栗子:做一个线性回归分析,主窗口用散点图,残差分析可用几个辅助小窗口从不同侧面展示。截图是Qlik Sense的报表设计器,我非常喜欢这款简洁

2016-02-07 00:15:28 2214

原创 数据分析-人群画像和目标群体分析

人群画像人群画像是指产品消费者群体的性别、年龄、收入、城市、教育、家庭情况、生活态度,价值观念等特征。举个栗子:2011年公布的小米手机调查中显示:小米手机的消费者集中在18到35岁、男性、追逐功能、爱好科技、有一定的经济基础、白领或者学生、大学学历为主、分布在一二线城市。目标群体指数目标群体指数TGI表明目标群体在研究范围内总体的占比,代表研究主题倾向性的强弱

2016-01-05 17:35:54 39544

原创 数据分析-时间序列分析

时间序列分析和预测,举几个栗子:用优衣K在天猫的连续n年的销售数据,对双12的销售量进行预测。用阿里妈妈的站内站外媒体投放的监测数据,预估宝J在双12广告投放的效果。这些问题中数据的共同特点是序列中的数据有很强的依赖关系,又表现一定的随机性。参考Holt-Winter模型:一个时间序列由三部分叠加组成:趋势部分,周期部分和随机部分。还是举个栗子:优衣K的周周销售数据有三个部分,年度的增长趋

2015-12-08 16:36:11 3833

原创 说说为什么阿里要破冰?

今天又给新来的同学进行了一场集体破冰活动。确实有很多同学不太理解破冰说:”我对别人的性生活不感兴趣!“。如果你经历过正直生死相依的团队,比如:创业团队和战友,你会换个角度看待破冰。破冰你是在团队面前展示真实和完整的自我,也是让队友有机会了解你,帮助你在后面的工作中能更好地发挥你的特点和特长。开放和保守面对困难和挑战时候的心态,是开放还是保守。在破冰活动中,有一类人会拒绝回答一切问题

2015-12-03 23:49:53 15846 4

原创 如何写前端开发的改进建议书?

上周启动了一个项目打算统一规划前端的开发,一方面是想在前端方面有长期积累,另一方是想提升前端的开发效率和代码质量。就请海Y准备了一个ppt,计划在本月双周会上给产品同学介绍一下,今天先和架构组的同学一起过了一遍,也收到不少好的建议。建议书的目的1. 提升前端的开发效率和代码质量2. 规划前端的技术发展路线和做长期技术积累现状问题分析

2015-11-30 23:30:00 3819

原创 Hive开发人员如何提升?

今天小P同学咨询我一个问题,他在公司做大数据技术开发,却仅是在用Hive写业务的SQL,感觉好空虚和迷茫。让我给出出主意。我询问了一下业务,是提取新注册用户的信息。又询问了一下数据规模,大概几千万数据量。最后询问了一下团队,有做数据仓库,实时和算法的。SQL优化和配置优化优化现在的业务在Hive上的执行效率。对于具体SQL做优化,对小表使用Map

2015-11-29 22:01:27 647

原创 选微博的还是京东的php开发的offer?

如何选择offer

2015-11-28 22:14:46 2416

原创 宝洁的消费者研究的方法和趋势

从宝洁大名鼎鼎的CMK消费者市场研究部说起。CMK负责分析、监测、预测消费者行为和市场变化。每年花费3.5亿美元在60个国家调研500万以上的消费者用来充实和更新行业中最全面的数据库。在中国有超过100人的专研市场调研队伍。然而强大的CMK也没有遏制宝洁最近几年的业务大幅下滑。于是他们开始从基于用户的问卷和结构化的数据的传统的消费者研究方法,积极转向实践基于非结构或者大数据观察消费者的行为的内容。

2015-11-24 12:05:41 6090

原创 中国小企业的信息化的伪命题

今天晚饭和何Z闲聊中国小企业的信息化问题。何Z做小企业的信息化项目十年有余,谈话让我回忆起多年前在AccountMate做美国财务软件、在TSG做供应链管理软件、给山东三联做订单和库存管理系统、给上海浦运做运输管理系统,给惠州TCL做IT规划的时候。每次投标都是四方俱全,一方是强大的国际纵队如IBM、Oracle、SAP的销售团队;一方是新兴的土豪如用友、金蝶;一方是企业高管的影子公司;一方是我们

2015-11-20 01:03:51 661

原创 数据案例-SAP为何转向HANA云计算?

今天的会议见到SAP的全球服务部门的首席运营官帅哥Stefan Steinie。Stefan的开场白说,SAP目前全面转型到Hana云计算。我下意识地搜了一下新闻,SAP CEO说We beat on the cloud and revenue。顺便扫了一下SAP微博:SAP大中华区公布了2015年第二季度财报:云业务实现两位数增长,SAP商务分析业务取得双位数强劲增长,SAP S/4Hana的市

2015-11-19 00:23:36 1558

原创 计算引擎-GPU计算的优势

基于GPU的大规模计算早有耳闻,直到中午吃饭范W聊到他的多层神经网络程算法在GPU和CPU上的运行效率是40:1的时候,我才恍然大悟。中央处理CPU用来解释机器指令以及处理计算数据。首先是控制部件取出机器指令,翻译并发出执行操作的控制信号;然后运算器负责执行定点浮点算数运算和位运算等;运算器执行操作用的数据和结果放在寄存器中;更多的计算数据放在高速缓存中通过

2015-11-18 15:03:58 3398

原创 数据引擎-Paxos分布式一致协议

Paxos分布一致性协议

2015-11-16 17:10:37 822

原创 数据引擎-阿里的ODPS大规模计算引擎

阿里云大规模计算引擎

2015-11-16 17:08:37 1935

原创 项目管理和主观能动性

项目管理

2015-11-10 07:03:09 696

原创 数据案例-估算脉脉用户

数据案例

2015-11-10 07:01:45 1819

原创 阿里需要什么样的人才?

阿里面试

2015-11-10 06:59:15 1936

原创 数据分析-质量管理的7+1种武器

质量数据分析

2015-11-10 06:57:30 1321

原创 数据挖掘-关联分析

关联分析

2015-11-10 06:55:43 831

原创 数据挖掘-聚类分析

数据挖掘

2015-11-10 06:53:53 1693

原创 数据引擎-阿里开源引擎OceanBase

OceanBase

2015-11-10 06:52:04 5988

原创 数据引擎-列存储数据库

列存储数据库

2015-11-10 06:50:17 729 1

原创 数据引擎- 主流SQL计算引擎

主流SQL计算引擎

2015-11-10 06:25:25 2285

原创 数据引擎-列存储数据库

列存储数据库的原理

2015-11-10 06:21:06 606

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除