自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(60)
  • 资源 (2)
  • 收藏
  • 关注

转载 Google Machine Learning Course NoteBook--Data Preparation and Feature Engineering in ML

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Ma...

2018-11-12 15:34:10 654

转载 Why You Should Use Cross-Entropy Error Instead Of Classification Error Or Mean Squared Error For NN

Why You Should Use Cross-Entropy Error Instead Of Classification Error Or Mean Squared Error For Neural Network Classifier Training Posted on November 5, 2013 by jamesdmccaffrey When using a neural ...

2018-07-19 15:46:44 484

原创 C++ Primer Summary

About HeaderWe use headers to access classes defined for our own applications.Conventionally, header file names are derived from the name of a class defined in that header.The standard library heade

2016-01-31 23:06:19 821

原创 SAS 中double set, modify 和hash对象使用技巧区别

double set :根据大数据集表修改小数据集表;modify 和hash 都适合使用小数据集修改大数据集,但是modify的小数据集的量一般要比hash的要大一些,modify更适合处理从transaction 到 总表汇总的工作;

2015-11-30 11:55:15 2874

原创 R to access the MS Access

R to access the MS Access定义DSN(data source name)control panel ->Administrative Tools->Data Sources(ODBC)->System DSN;connect Rwith Accessinstall.packages("RODBC")libray(RODBC)channel<-odbcConnect(m

2015-11-20 13:47:31 746

原创 C++ primer 笔记

Class defines a type along with a collection of operations that are related to that type. A major design goal of C++ is to let programmers define their own types that are easy to use as the built –in

2015-09-09 10:28:03 614

原创 如何在Linux下使用Markdown进行文档工作

如何在Linux下使用Markdown进行文档工作在Linux系统中,编辑markdown可以用retext工具:sudo apt-get install retextretext Release-Notes.md要将markdown文件转换成html文件,可以用discountsudo apt-get install discount转换工作很简单:markdown -o Release-Not

2015-07-30 10:20:12 2576

转载 收益管理系统(PROS)缘何在中国水土不服?

收益管理系统缘于放松管制后的美国民航,更因美利坚航空(American Airlines, Inc.)借此击败人民捷运的战役而一举成名。曾经被看作先进管理经验的结晶而迅速广泛地被国内航空公司急切地引进。然而十余年过去了,结果是在国内航线的管理中被普遍放弃。为何?  一、中国民航运价管理历程  我国八十年代,坐飞机需要达到一定级别并凭介绍信购票,航空旅行可谓是一种身份的象征,这时的中国逐渐引

2015-06-29 09:40:47 5354

原创 人生的第一个MakeFile贴出来纪念一下

########################################## Makefile for building: Rostering# Author:howard# Project: Rostering#########################################Compiler and optionsCC =gccCXX =g++

2015-04-29 16:41:21 1075

原创 VIM使用总结

我的vim 配置:set number //显示行号 set showmatch //自动关联括号 set tabstop=4

2015-04-28 10:32:25 847

原创 vector--list--deque对比

stl提供了三个最基本的容器:vector,list,deque。vectorvector和built-in数组类似,它拥有一段连续的内存空间,并且起始地址不变,因此它能非常好的支持随即存取,即[]操作符,但由于它的内存空间是连续的,所以在中间进行插入和删除会造成内存块的拷贝,另外,当该数组后的内存空间不够时,需要重新申请一块足够大的内存并进行内存的拷贝。这些都大大影响了vecto

2015-04-20 16:22:10 1009

原创 航空计划术语

专用名词解释:FleetAssignment 是对航段选机型;Aircraftroutig是安排routing的;Crew paring是航班组环,不针对某个具体aircraft;针对给定的飞行员的资质和机型,以最小化成本(尽量使所有的成本都在飞行时间上)为目标,给出仅覆盖所有flight leg一次的pair (从base出发最后回到base)集合,l  以员工的种类为依据进行分

2015-03-20 14:38:43 4299 5

原创 常用git命令分享

create git space git initset the local cofig git config --global user.name "xx" git config --global user.email "[email protected]"set the remote url git remote add origin https://git.oschina.net/x

2015-02-25 14:34:28 988

转载 收益管理简介

收益管理起源于民用航空业,是美国的航空公司在上个世纪80 年代为解决激烈的市场竞争问题而提出的一种新的管理方法。随着科学技术的发展,特别是信息技术的飞速发展,再加上行业管制的逐渐放开,收益管理的理论与方法得到了更加广泛的应用。至今,收益管理已在航空、酒店、旅游服务、金融服务、货物运输以及制造业等领域得到了应用,对收益管理理论的研究也随之得到了不断的完善。一、收益管理的思想方法概括而言,

2015-02-02 16:18:55 6281

原创 makefile简介及编写之一

Makefile 是 Linux 下程序开发的自动化编译工具,用以识别编译目标、源文件、及其依赖关系,并且有着高效的编译效率。每次执行 make 时,就能够自动寻找 Makefile(makefile)文件,执行编译工作。Makefile拥有很多复杂的功能,为了简化问题的复杂性,本文仅和大家讨论针对单目录下的C/C++项目开发,如何写一个通用的 Makefile。关于程序的编译和链接

2015-01-28 13:59:12 1237

原创 基于cygwin学习linux 学习笔记之一:入门篇

最近开始学习linux ,不想折腾装过双系统或者虚拟机,就按照了一个cygwin在windows 模拟linux环境。首先安装一些常用的插件包:make 、gcc、g++、awk、 sed、vim等等。首先先修复下cygwin 下vim 方向键和后退键不能使用的问题:进入vim74文件夹(具体是vim73,74或者未来的更高版本是情况而定):$ cd /usr/share/vi

2015-01-27 12:58:58 2401

原创 C++ 编程思想(第一卷)阅读总结

最近工作闲翻阅了之前买f《C++编程思想》这里贴上我认为对我最有帮助的部分,一来留给自己复习看,另一方面也和小伙伴们分享下:1 OPP相关1.1、每个对象都有一个类型,OOP中class 和type是同义词,在面向对象的程序设计中,我们所做的工作实际上就是创造新的数据类型,程序员定义class 是为了与具体问题相适应,而不是被迫适用已存在的数据类型。1.2、当用方式进行寻找。2 C

2015-01-16 11:52:55 1745

原创 如何解决error C4996: 'fopen'问题

我们在程序中使用fopen等CRT函数,就会出现一些警告信息,很烦人,如下:error C4996: 'fopen': This function or variable may be unsafe. Consider using fopen_s instead. To disable deprecation, use _CRT_SECURE_NO_WARNINGS. See onli

2015-01-13 10:42:07 16748 2

原创 C++学习总结

1、C++中const有什么用?  不要一听到const就说是常量,这样给考官一种在和一个外行交谈的感觉。应该说const修饰的内容不可改变就行了, 定义常量只是一种使用方式而已,还有const数据成员,const参数, const返回值, const成员函数等, 被const修饰的东西都受到强制保护,可以预防意外的变动,能提高程序的健壮性。另外const优于c中的宏,const是

2015-01-08 14:23:33 752

转载 C++经典面试题之一

1、int a=5,则 ++(a++)的值是()A、5      B、   6          C、7       D、逻辑错误a++返回的是一个临时变量,这里是右值,不能再前面++了2、下面的代码输出什么?(取地址运算符比+运算符的优先级要高)[cpp] view plaincopyint main(void)  {

2015-01-08 13:41:49 658

原创 R语言与数据分析之十:购物篮分析

提到数据挖掘,我们第一反应就是之前听到的啤酒和尿不湿的故事,该故事就是典型的数据挖掘中的关联规则。购物篮分析区别于传统的线性回归的主要区别为,关联分析针对离散数据;常见关联规则:关联规则:牛奶=>鸡蛋【支持度=2%,置信度=60%】支持度:分析中的全部事务的2%同时购买了牛奶和鸡蛋,需设定域值,来限定规则的产生;置信度:购买了牛奶的筒子有60%也购买了鸡蛋,需设定域值,来限定规则的

2014-12-23 10:30:02 8994

原创 不同数据库分页总结

总结下主流的MYSQL,sqlSever 和oracle的数据库的分页代码,如下:MySQL:select * from TableName where …… limit start_th , count_num;  SqlSever:select top count_num from TableName where id not in (select top count_num fro

2014-12-22 16:49:56 1884

原创 R语言与数据分析之九:时间内序列--HoltWinters指数平滑法

今天继续就指数平滑法中最复杂的一种时间序列:有增长或者降低趋势并且存在季节性波动的时间序列的预测算法即Holt-Winters和大家分享。这种序列可以被分解为水平趋势部分、季节波动部分,因此这两个因素应该在算法中有对应的参数来控制。Holt-Winters算法中提供了alpha、beta和gamma 来分别对应当前点的水平、趋势部分和季节部分,参数的去执法范围都是0-1之间,并且参数接近0时,

2014-12-22 10:22:36 24965 5

原创 R语言与数据分析之八:时间序列--霍尔特指数平滑法

上篇我和小伙伴们分享了简单指数平滑法,简单指数平滑法只能预测那些处于恒定水平和没有季节变动的时间序列,今天和大家分享非恒定水平即有增长或者降低趋势的,没有季节性可相加模型的时间序列预测算法---霍尔特指数平滑法(Holt)。Holt 指数平滑法估计当前时间的水平和斜率。其平滑水平是由两个参数控制,alpha:估计当前点水平;beta:估计当前点趋势部分斜率。两个参数都介于0-1之间,当参数越接

2014-12-19 11:04:22 19299 7

原创 R语言与数据分析之七:时间序列简单指数平滑

上篇我们对时间序列数列有了整体的认识并将时间序列进行了分解,今天和小伙伴们分享常用预测算法中相对最简单的:简单指数平滑法。简单指数平滑适用于可用相加模型描述,并且处于恒定水平和没有季节变动的时间序列地短期预测。简单指数平滑法提供了一种方法估计当前时间点上的水平。为了更加准确的估计当前时间的水平,我们使用alpha参数来控制平滑,alpha的取值在0-1之间。当alpha越接近0,临近预测的观测

2014-12-18 11:20:52 21038 7

原创 R语言与数据分析之六:时间序列简单介绍

今年在某服装企业蹲点了4个多月,之间很长一段时间在探索其现货和期货预测,时间序列也是做销售预测的首选,今天和小伙伴分享下时间序列的基本性质和如何用R来挖据时间序列的相关属性。首先读入一个时间序列:从1946年1月到1959年12月的纽约每月出生人口数量(由牛顿最初收集)数据集可以从此链接下载(http://robjhyndman.com/tsdldata/data/nybirths.dat)。

2014-12-17 11:16:09 11129 3

原创 R语言与数据分析之五:主成分分析

主成份分析历史:Pearson于1901年提出,再由Hotelling(1933)加以发展的一种多变量统计方法。通过析取主成分显出最大的个别差异,也用来削减回归分析和聚类分析中变量的数目,可以使用样本协方差矩阵或相关系数矩阵作为出发点进行分析。通过对原始变量进行线性组合,得到优化的指标:把原先多个指标的计算降维为少量几个经过优化指标的计算(占去绝大部分份额)基本思想:设法将原先众多具有

2014-12-15 09:59:04 11092

原创 R语言与数据分析之四:聚类算法2

今天继续和小伙伴们分享聚类算法和R语言的实现,上篇和大家分享了聚类中的距离、类间距离和最古典的层次聚类法,今天和大家分享几个动态聚类算法。首先和大家分享被评为十大数据挖掘算法之一的K-means 算法(K为分类的个数,mean为平均值,该算法的难点即为K的指点)Step1:选择K个点作为初始质心;Step2:将剩余每个点指派到最近的质心,形成K个簇(聚类);Step3:重新计算簇的

2014-12-12 10:43:11 3305

原创 R语言与数据分析之四:聚类算法1

前面和大家分享的分类算法属于有监督学习的分类算法,今天继续和小伙伴们分享无监督学习分类算法---聚类算法。聚类算法也因此更具有大数据挖掘的味道聚类算法本质上是基于几何距离远近为标准的算法,最适合数据是球形的问题,首先罗列下常用的距离:绝对值距离(又称棋盘距离或城市街区距离)Euclide距离(欧几里德距离,通用距离)Minkowski 距离(闵可夫斯基距离),欧

2014-12-10 16:22:43 5675

原创 R语言与数据分析之三:分类算法2

上期与大家分享的传统分类算法都是建立在判别函数的基础上,通过判别函数值来确定目标样本所属的分类,这类算法有个最基本的假设:线性假设。今天继续和大家分享下比较现代的分类算法:决策树和神经网络。这两个算法都来源于人工智能和机器学习学科。首先和小伙伴介绍下数据挖掘领域比较经典的Knn(nearest neighbor)算法(最近邻算法)算法基本思想:Step1:计算出待测样本与学习集中所有点

2014-12-09 09:33:30 5254

原创 R语言与数据分析之三:分类算法1

分类算法与我们的生活息息相关,也是目前数据挖掘中应用最为广泛的算法,如:已知系列的温度、湿度的序列和历史的是否下雨的统计,我们需要利用历史的数据作为学习集来判断明天是否下雨;又如银行信用卡诈骗判别。分类问题都有一个学习集,根据学习集构造判别函数,最后根据判别函数计算我们所需要判别的个体属于哪一类的。常见的分类模型与算法传统方法1、线性判别法;2、距离判别法;3、贝叶斯分类器;现

2014-12-08 10:18:09 7929

原创 服装行业预测总结

经过了1个多月的探索与尝试,发觉服装行业的销售预测和一般零售行业的销售预测有着很大的差别,其本质原因是服装行业货品的销售pattern区别于一般零售行业,主要体现在以下两点:1、 服装行业货品销售受季节影响非常显著,主要体现在销售的主推季会受气候波动而变化;2、 服装行业货品的销售周期比传统零售要短很多,一年之内常常有2季:春夏和秋冬,货品不存在一般零售行业的原款升级换代的做法,一般零售行业的升级款会带有老款

2014-12-05 12:37:24 3007

原创 oracel cmd 命令总结

登录sqlplus/ as sysdba创建数据表空间 create tablespace zhbh_db logging datafile 'D:\app\HowardGe\oradata\zhbh_db.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local; 创建

2014-12-03 17:24:17 1373

原创 R语言与数据分析之二:绘图

图形展示是最高效且形象的数据描述手段,因此巧妙的图像展示是高质量数据分析报告的必备内容,因此强大的图形展示功能也是统计分析软件的必备功能。R语言提供了强大的吐血展示功能。今天我由简单到复杂分别和小伙伴们分享如何用R语言画出各位想要的图形

2014-12-02 17:22:03 10612

原创 R与数据分析学习总结之一:R语言基本操作

R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。

2014-11-29 19:22:16 10591

原创 基于OPL结合cutstock案例梳理Column Generation 算法

列生成算法的核心思想非常朴素,借鉴单纯形法迭代中的“进基”思想,实际的原始问题可能很多列向量,但是真正“入基”的列向量却只占很少的一部分,因此如果能人工干预挑选出那些“质量比较好”的列向量进行求解,将大大地提高求解效率。因此列生成就是利用子问题筛选出那些“高质量列”,加入主模型中,这样主模型只对质量较好的列进行优化。接下来以IBM ILOG CPLEX 内置的板材切割问题(cutstock)详细阐述(建模语言选用ILOG开发的OPL语言)

2014-11-24 16:49:57 6591 4

原创 单纯形算法与对偶论总结

重温影子价格、对偶对偶论

2014-11-23 13:50:29 6216

原创 OPL高效建模技巧

OPL是ILOG团队为运筹学专家量身定制的一种优化建模语言,语法相对简单,约束定义接近运筹学专家习惯的属性模型表达 。同时表达更为简洁,描述同样约束,OPL更为简单明了,易于检查排错。有助于开发者专注于模型的开发,而不必花很大精力将数学模型转换为复杂的程序语言。

2014-11-21 17:10:06 6104 2

原创 建模技巧总结

1、减少变量个数举例:如 12345110000200100301000400001500010

2014-09-16 15:23:31 881

原创 rJava安装及Java吊取R注意事项

R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言。

2014-08-26 21:49:26 7041

log4cplus 1 0 4

log4cplus是C++编写的开源的日志系统,前身是java编写的log4j系统.受Apache Software License保护。作者是Tad E. Smith。log4cplus具有线程安全、灵活、以及多粒度控制的特点,通过将信息划分优先级使其可以面向程序调试、运行、测试、和维护等全生命周期; 你可以选择将信息输出到屏幕、文件、NT event log、甚至是远程服务器;通过指定策略对日志进行定期备份等等。">log4cplus是C++编写的开源的日志系统,前身是java编写的log4j系统.受Apache Software License保护。作者是Tad E. Smith。log4cplus具有线程安全、灵活、以及多粒度控制的特点,通过将信息划分优先级使其可以面向程序调试、运行、测试、和维 [更多]

2015-01-19

我的命名规范

我的命名规范,结合了谷歌c++ 命名规范和“匈牙利”法则。

2014-01-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除