自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

chumingke的博客

个人学习笔记等等

  • 博客(30)
  • 收藏
  • 关注

转载 图数据库相关

OrientDB 入门OrientDB是什么?用一句话概括:一种Nosql数据库,支持文档、Key/Value,文档,图多种模型。基础概念记录是读取和存储的最小单元。有四种类型: * 文档(Document) * 字节流(RecordBytes) * 顶点(Vertex) * 边(Edge)文档文档是OrientDB中最灵活的记录类型。文档默认有类型

2018-01-29 18:52:32 423

转载 信用评分中VOI和PSI的计算逻辑

信用评分中VOI和PSI的计算逻辑?群体稳定性指标(population stability index) 群体稳定性指标(population stability index)公式: psi = sum((实际占比-预期占比)* ln(实际占比/预期占比))举个例子解释下,比如训练一个logistic回归模型,预测时候会有个类概率输出,p。在你的测试数据集上的输出设定为p1,将它从小到大

2018-01-29 18:35:37 16447

转载 python数据分析师面试题选

转自http://www.cnblogs.com/arkenstone/p/5467034.htmlpython数据分析部分1. 如何利用SciKit包训练一个简单的线性回归模型利用linear_model.LinearRegression()函数 # Create linear regression objectregr = linear_model.LinearRegression()# T

2017-10-30 10:55:24 2257

转载 MySQL索引相关

转自http://blog.csdn.net/xluren/article/details/32746183 http://www.cnblogs.com/chenshishuo/p/5030029.html 推荐再去看看http://www.cnblogs.com/hustcat/archive/2009/10/28/1591648.html关于MySQL索引的好处,如果正确合理设计并且使用索

2017-10-29 21:59:04 303

转载 用SQL实现 excel常用操作

转自https://zhuanlan.zhihu.com/p/30212389数据是网上找到的销售数据,命名为sale。一、关联公式:Vlookupvlookup是excel几乎最常用的公式,一般用于两个表的关联查询等。所以我先创建一个新表:复制sale表并筛选出地区仅为广州的,命名为sale_guang。create table sale_guang SELECT * from sale wher

2017-10-29 11:06:29 10525

转载 SQL语句常用优化技巧(一)

转载自http://blog.csdn.net/jayzai/article/details/45074529要提高SQL语句的执行效率,最常见的方法就是建立索引,以及尽量避免全表扫描。给大家整理一些常见的SQL优化技巧,避免全表扫描。一个简单的优化,也许能让你的SQL执行效率提高几倍,甚至几十倍。1、避免在where子句中使用 is null 或 is not null 对字段进行判断。如:sel

2017-10-25 16:26:49 255

转载 程序员老鸟写sql语句的经验之谈、百万数据查询优化技巧三十则

转载自http://blog.csdn.net/chenleixing/article/details/42610529一、程序员老鸟写sql语句的经验之谈做管理系统的,无论是bs结构的还是cs结构的,都不可避免的涉及到数据库表结构的设计,sql语句的编写等。因此在开发系统的时候,表结构设计是否合理,sql语句是否标准,写出的sql性能是否优化往往会成为公司衡量程序员技术水平的标准。 我们程序员不

2017-10-25 16:09:45 804

原创 tableau应用实战笔记

tableau应用实战之人人都是数据分析师tableau入门敏捷商务智能与传统BI相比灵活、实时数据可视化明星tableau定位:数据可视化敏捷开发和实现的商务智能展现工具 核心技术:独创的VizQl数据库用户体验良好且易用的表现形式tableau主要特性1.极速高效 2.简单易用 3.多种数据源 4.高效接口集成数据提取API:c,c++,java,python,.tde文件javas

2017-10-10 23:38:36 14656

原创 关于传统企业数据规划的看法

其实这是个很大的话题。也很难一时说清,这里我记录一下自己的看法。估计可能会有很多不对的地方,权当为以后做一些参考。传统企业的特点1.组织机构庞大复杂。 组织复杂如果能运行良好,其实也可以。不过一般来讲,组织一旦复杂。公司运行就会受到阻碍。而且组织一旦复杂,牵一发而动全身。当我们需要更新某些部分的时候,从技术角度讲很难下手,从个人利益角度讲也是,公司的利益关系网也是复杂。2.业务周期长 打个比方,

2017-10-09 14:05:49 857

原创 数据分析方法

整理了一些数据分析方法。数据分析方法描述统计关系分析相关分析描述两个变量之间的关系关联分析描述一个变量对另一个变量关系支持度单因素方差分析研究对象的某一指标、变量对因变量是否有影响双因素方差分析两种因素、对因变量是否有影响因子分析求解单变量求解已知公式,求某一解规划求解已知公式限定条件,求多解回归分析线性回归得出回归方程,预测检验逻辑回归分类算法决策树算法根据特征进行分类,便于决策聚类分析时间序列分

2017-10-08 21:07:34 704 1

原创 数据分析方法论

整理了一些思维、方法论。统计分析方法论营销管理方法论SWOT分析Strength(强势) Opportunity(机会) Weekness(弱点) threat(威胁)4P营销理论产品 价格 渠道 促销 分析公司的整体营运情况PEST分析法政治(Political) 经济(Economic) 技术(Technological) 社会(Social) - 用于对宏观环境的分析SM

2017-10-08 20:45:37 1460

原创 Numpy学习笔记

安装通过Anconda安装网页形式的编辑器Jupyter NoteBook 很好用 anconda安装好后,直接终端输入jupyter notebook然后会跳出网页。目录类似GITNumpy介绍+ndarryscipyscipy库是基于python生态的一款开源数值计算、科学与工程应用的开源软件。 包括常用的Numpy,pandas、matplotlib等库。NumpyNumerical P

2017-10-08 17:36:44 541

原创 Python2.7学习笔记(二)

第二部分高级特性切片迭代1.如果给定一个list或tuple我们可以通过for循环来历遍这个list后者tuple。 这种历遍我们称为迭代(Iteration) 2.dict 由于dict的储存不是按照list的方式顺序排列,所以迭代出的结果顺序可能不一样。 默认dict迭代的是key,如果要迭代value:for value in d.itervalues()如果要同时迭代:for k,v

2017-10-08 16:05:18 273

原创 Python2.7学习笔记(一)

廖老师的教程https://www.liaoxuefeng.com第一部分python简介优缺点安装pythonpython解释器:PythonIPythonJPythonCPythonironPython第一个python程序使用文本编辑器推荐两个: Sublime Text——免费 Notepad++——免费 中文界面运行py终端如何使用py文件:##定位到根目录下cd ...un

2017-10-08 14:15:26 571

原创 如何利用pandas进行数据清洗?

本文为课程笔记。 参考网址:www.cnblogs.com/stream886/p/6021743.html数据重复值处理引入pandasimport pandas数据载入excel或csv,参数为路径pd.read_excel()pd.read.csv()数据库查询语句conn = Mysqldb.connect(host='127.0.0.1',user = 'root',passwd =

2017-10-07 11:06:58 2235

原创 简明Python教程笔记(一)

此文为简明Python教程笔记。第一部分介绍Python特点 简单、易学——伪代码本质 免费开源——FLOSS(自由/开放源码软件) 高层语言 可移植性强——支持多平台 解释性——更易移植 面向对象——既面向过程也面向对象 可扩展性 可嵌入性 丰富的库最初的步骤环境变量如果是windows,使用前需要编辑path变量——c\python23运行方式命令行,交互式解释器,或者源文件。

2017-10-06 21:45:04 1216

转载 MySQL触发器与事件调度器

触发器自动执行预定好的sql语句触发时间 before /after 触发事件 insert,update,delete 触发地点 表名触发内容 要执行的语句在同一个位置不能建立两个不同的触发器,可以合并##例子1create TRIGGER tr_1after insert on card_moneyfor each rowbegin case when c.

2017-10-06 17:13:18 1771 1

原创 MySQL数据库小技巧(注意点)

复合语句中声明变量/指令declare定义sql结束符delimiterdelimiter %select * from login %漂号`用于包裹关键词,来当做普通字符串处理 加上后不会自动解析关键词把关联查询转为子查询能写子查询写子查询

2017-10-06 17:01:13 279

原创 Mysql错误码与异常捕获

Mysql错误码重要的几个1049 数据库不存在1051 数据表不存在1054 字段不存在异常捕获异常条件类型##字符串类型的错误码SQLSTATE sqlstate_value##数值类型的错误码mysql_error_code异常的定义DECLARE condition_name CONDITION FOR [condition_type]异常的捕获DECLARE handler_ty

2017-10-06 16:57:29 3473

原创 MySQL存储过程与视图

视图视图相当于把一个复杂sql语句作为表保存起来,对于外层用户,只能查到视图中的数据,保护数据源,可以设置权限##创建create view show_week_name as (...);##使用select * from show_week_name;存储过程(带参函数)##创建create produre show_gender_list (in sex varchar(20),ou

2017-10-06 16:48:51 865

原创 数据库分析的简单步骤

第一步 大概看一下拿到一张表,首先看一下它的字段第二步 确定数据规模确定数据规模 几行几列count第三步 确定分类字段对应的数据规模count(*) ..group by order by比如会员类型,性别,地点,时间地点城市如果字段中含有城市,一般不在Mysql中切割 因为耗时间,比如每个市名字字数不一样,语句会很复杂 通常找一张城市表进行多表查询按照年月(时间)日期格式化DATE_FOR

2017-10-06 16:39:27 1174

原创 MySQL查询语句练习题(50题版)

学生表:Student(编号sid,姓名sname,年龄sage,性别ssex) 课程表:Course(课程编号cid,课程名称cname,教师编号tid) 成绩表:Sc(学生编号sid,课程编号cid,成绩score) 教师表:Teacher(教师编号tid,姓名tname)1,插入学生数据 学号 姓名 年龄 性别 1001 张三 10 男 1002 李

2017-10-05 16:46:45 29290 13

原创 MySQL查询语句练习题45题版

整理了一些网上的练习题。 设有一数据库,包括四个表:学生表(Student)、课程表(Course)、成绩表(Score)以及教师信息表(Teacher)。表结构及数据如下,请完成题目。表(一)Student (学生表) : 属性名 数据类型 可否为空 含 义 Sno varchar (20) 否 学号(主码) Sname varchar (20) 否

2017-10-05 13:11:28 32984 28

原创 整理了部分数据分析用图表

整理了部分常见图表。 另外如何将excel转变为MarkDown能识别的表格? 直接将表格复制到下面这个网页转换即可。 http://pressbin.com/tools/excel_to_html_table/index.html 序号 图表名 做法 用途 描述 内容 1

2017-10-03 18:31:19 5667

原创 深入浅出MySQL笔记(三)

本笔记为学习该书所记,便于复习。 包含第五、六章笔记。 常用函数与图形化工具的使用。 [TOC]第一部分 基础篇第5章 常用函数字符串函数常用字符串函数CONCAT(S1,S2...Sn)INSERT(str,x,y,instr)LOWER(str)UPPER(str)LEFT(str,x)RIGHT(str,x)LPAD(str,n,pad)RPAD(str,n,pad)LT

2017-10-03 17:35:07 365

原创 深入浅出MySQL笔记(二)

本笔记为学习该书所记,便于复习。 包含第三、四章笔记。第一部分 基础篇第3章 Mysql支持的数据类型数值类型整数类型浮点数类型定点数类型位类型日期时间类型DATADATATIMETIMESTAMPTIMEYEAR查看时区字符串类型CHAR和VARCHAR类BINARY和VARBINARY类型ENUM类型SET类型第4章 Mysql中的运算符算数运算符比较

2017-10-03 17:23:53 302

原创 如何绑定阿里云域名

本来 应该不是很复杂的事情操作了半天,所以还是记下来吧。准备域名购买域名实名认证创建CNAME文件绑定域名万网DNS服务器添加域名解析DNSPOD服务器修改DNS服务器添加记录准备域名购买域名首先在阿里云买一个域名,.com的域名一年55,还有1块钱的域名呢。实名认证买好之后,进行实名认证。这一步我用mac自带浏览器上传身份证照片无数次都失败了,最后换了chrome浏览器才成功。

2017-10-01 18:40:51 5913

原创 如何用Mac+github pages +hexo搭建博客

实际上我是先用jekyll搭建博客的。后来发现没有找到好看的主题,看到大神用的hexo的主题,感觉很好看,所以尝试了用hexo来搭建博客,如果有需要用jekyll搭建的,可以参考如何利用Mac+Github pages+jekyll来编写博客。安装hexo安装Nodejs安装GIT安装hexo基本配置安装Hexo 插件本地浏览部署Git使用hexo安装NexT主题修改_conf

2017-10-01 12:54:55 437

原创 如何利用Mac+Github pages+jekyll来编写博客

如何利用Mac+Github pages+jekyll来编写博客在网上查看了很多步骤,汇总一个笔记,有一些疏漏,之后有机会补充。目录如何利用MacGithub pagesjekyll来编写博客目录第一部分 Github准备第二部分 jekyll准备更新源地址更新gem ruby第三部分 使用jekyll第四部分 使用github pages建立博客第五部分 申请个人域名其他第一部分

2017-09-30 14:35:38 1205 1

原创 深入浅出MySQL笔记(一)

深入浅出MySQL笔记本笔记为学习该书所记,便于复习。目录深入浅出MySQL笔记目录第一部分 基础篇第1章 mysql的安装与配置MySQL的下载 MySQL的安装MySQL的配置启动和关闭MySQL第2章 SQL基础SQL简介MySQL使用入门SQL分类DDL语句帮助的使用查询元数据信息第3章 MySQL支持的数据类型第4章 Mysql中的运算符第5章 常用函数第

2017-09-29 23:46:16 1152

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除