自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

tobeyourlover

keep run

  • 博客(25)
  • 收藏
  • 关注

转载 【机器学习】 之 xgboost python ubuntu部署

Ubuntu 安装 XGBoost-Python和RXGBoost is an optimized distributed gradient boosting library designed to be highly efficient, flexible and portable. It implements machine learning algorithms un

2016-11-20 20:49:20 4563

转载 【图像处理】Ubuntu安装OpenCV 3.0以及Python接口

系统环境Ubuntu系统版本:Ubuntu Kylin 14.04 (32位) OpenCV软件版本:opencv-3.0.0OpenCV下载进入OpenCV官网 在右侧选择 OpenCV for Linux/Mac安装步骤安装OpenCV所需的库(编译器、必须库、可选库)[compiler] sudo apt-get install build-essential [required] su

2016-11-16 17:55:17 513

转载 【图像处理】Ubuntu安装OpenCV 3.0以及Python接口

#系统环境Ubuntu系统版本:Ubuntu Kylin 14.04 (32位)OpenCV软件版本:opencv-3.0.0#OpenCV下载进入OpenCV官网在右侧选择 OpenCV for Linux/Mac#安装步骤##安装OpenCV所需的库(编译器、必须库、可选库)123[compiler] sudo ap

2016-10-19 15:53:42 654

原创 【R语言】【可视化】 之 Mosaic Plot(马赛克图)

Mosaic plot常常用来展示Categorical data(分类数据)(关于不同的数据类别,参照连接更严谨英文比较好的朋友可以看[1]),mosaic plot 强大的地方在于它能够很好的展示出2个或者多个分类型变量(categorical variable)的关系. 它也可以定义为用图像的方式展示分类型数据。当变量是类别变量时,且数目多于三个的时候,可使用马赛克图。马赛克图中,嵌套矩阵面积

2016-09-29 18:48:58 22573 3

转载 【R语言】【规范】编程规范

Google发布R语言格式规范内部指导原创                                                2016-09-06                                                数据科学                                                大数据应用    

2016-09-20 10:48:58 3062

原创 【R语言】【Rstudio】中文支持

方法一失败:sudo ln -s /usr/lib/$(dpkg-architecture -qDEB_BUILD_MULTIARCH)/qt5/plugins/platforminputcontexts/libfcitxplatforminputcontextplugin.so /usr/lib/rstudio/bin/plugins/platforminputcontexts/参考https:/

2016-09-19 19:15:16 9187

转载 【R语言】【版本】更新

1 添加新的源(命令行下)sudo gedit /etc/apt/sources.list添加:deb http://cran.stat.ucla.edu/bin/linux/ubuntutrusty/保存(trusty为Ubuntu的版本号)2 在命令行执行:sudo apt-get update (更新源)sudo apt-get install r-base r-recommended(安装)

2016-09-19 18:55:01 1727

原创 【linux】【装机】之 实战记录

1 硬盘分区与挂载fdisk -l #查看硬盘分区信息fdisk /dev/sdbmkfs -t ext3 -c /dev/sdb1vim /etc/fstab # 注意已有桌面用户后,不能重新挂载/home注意1: /etc/fstab格式说明:/dev/sdb1 代表哪个分区 ext3是该分区的格式 defaults 是挂载时所要设定的参数(只读,读写,启用quota等),输入defa

2016-09-10 17:38:00 739

转载 【shell语言】【sed】之 入门

sed编辑器逐行处理文件(或输入)(1).基本格式sed [-nefri] [动作] [Input_File]选项:-n :表示安静模式操作,也就是只将被更改的行输出,没更改的行不输出,默认sed 是输出所有的行-e Scrip:指定sed的执行命令可以指定多个这个选项-f Script_File:指定执行一个包含sed命令的脚本文件-r:支持扩展的正则表达式(默认只支持基础的正则表达式)-i

2016-09-05 20:15:26 431

原创 【linux】【inout】之 文件编码转换

识别文件编码类型 sudo apt-get install enca enca file_in结果:Simplified Chinese National Standard; GB2312 CRLF line terminators转化iconv -f GB2312 -t UTF-8 file_in -o file_out查看可转化的编码类型 iconv -l |grep GB2312

2016-09-05 18:08:44 321

原创 【shell语言】【例子】之 for

for i in $(ls *.csv)    do     echo `head -1 $i` >> head.csv done

2016-09-05 11:25:56 337

转载 【deeplearning】【框架】【caffe】之 caffe安装

参考: https://www.zybuluo.com/hanxiaoyang/note/364737关于caffe(by@寒小阳)caffe是深度学习在图像领域广泛使用的框架,其model zoo有大量的预训练好的模型提供使用。图像相关应用会大量使用到caffe。墙裂建议大家使用linux系统,原因如下。linux系统(大部分公司为CentOS或者Ubuntu),才是实际开发中用到的系统,提前熟

2016-09-01 18:18:58 384

原创 【机器学习】【base】 之 目标函数 损失函数 优化算法

目标函数定义最大似然方法最大似然估计,只是一种概率论在统计学的应用,它是参数估计的方法之一。说的是已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次试验,观察其结果,利用结果推出参数的大概值。最大似然估计是建立在这样的思想上:已知某个参数能使这个样本出现的概率最大,我们当然不会再去选择其他小概率的样本,所以干脆就把这个参数作为估计的真实值。求最大似然函数估计值的一般步

2016-08-30 21:19:44 5570

原创 【数据库】【mysql】 之 字符串处理

字符串拼接 concat('heha|', 'test')字符串匹配“DS贵州凯里-北京东路LILY店” regexp CONCAT(“[A-Za-z]+”, “贵州”, “.*”)== 修改 TRIM([[BOTH | LEADING | TRAILING] [remstr] FROM] str) 返回字符串str,其所有remstr前缀或后缀被删除了。如果没有修饰符BOTH、LEA

2016-08-27 11:26:45 529

原创 【机器学习】【base】 之 核函数

【机器学习】之 核函数

2016-08-24 21:23:13 461

转载 【机器学习】【base】 之 距离函数

如何度量两个对象之间的相似性呢?一般有两种方法,一种是对所有对象作特征投影,另一种则是距离计算。前者主要从直观的图像上反应对象之间的相似度关系,而后者则是通过衡量对象之间的差异度来反应对象之间的相似度关系。(1)欧氏距离:可以简单的描述为多维空间的点点之间的几何距离。        (2)曼哈顿距离如果欧式距离看成是多维空间对象点点的直线距离,那么曼哈顿距离就是

2016-08-24 19:03:10 831

原创 【理财】【定投】 之 卖在何时?

做任何投资都要设立一个止盈或止损线,定投也不例外。如果不顾市场行情,一味投入而不赎回,在熊市很可能将牛市中积累的盈利全部亏掉。一个完整的定投策略,一定要配备相应的赎回机制,在熊市来临前,及时止盈,保住前期牛市的胜利果实。说得更通俗一点,陪你到天荒地老的是你的另一半,而不是定投。会买的是徒弟,会卖的是师傅。定投要“傻傻地买,聪明地卖”,因为从中长期看定投的进入时机并不重要;但是,退出时机决定

2016-08-21 23:19:43 433

原创 【nlp】【base】 之 词向量

算了,落后太多都不好意思说自己是搞大数据的了,最近被项目缠身都没有好好进修技术,有时候做出工作成绩与保持饥饿学习状态不应该成为矛盾,至此,加油!自然语言理解的问题要转化为机器学习的问题,第一步肯定是要找一种方法把这些符号数学化。

2016-08-20 23:31:21 503

转载 【数据库】【Greenplum】 之 日期处理

PostgreSQL的常用时间函数使用整理如下:一、获取系统时间函数1.1 获取当前完整时间select now();复制代码 david=# select now(); now 2013-04-12 15:39:40.399711+08 (1 row)david=# 复制代码 current_timestamp 同 now() 函数等效

2016-08-19 18:17:08 2825

原创 【数据库】【mysql】 之 日期时间处理

日期生成日期拆分日期计算字符串转换日期生成– 当前日期select now(); -- 2008-08-08 22:20:46select curdate(); -- 2008-08-08curtime() -- 22:41:30– 拼凑日期select makedate(2001,31); -- '2001-01-31'select makedate(2001,32); -- '20

2016-08-17 16:56:05 456

原创 【数据库】【base】 之 乱码

一点点积累乱码现象与解决方案R语言数据库连接乱码解决con<- dbConnect(PostgreSQL(), host = "10.1.53.11", user= "hd", password="exedqghl", dbname="bwdb",options='--client_encoding=GBK')Kettle乱码方案之一 [Spoon.bat]

2016-08-17 15:45:10 494

原创 【R语言】【可视化】 之 维恩图

维恩图:也叫文氏图,用于显示元素集合重叠区域的图示。 本文展示2种方法:VennDiagram包VennDiagram包的缺点是区域大小不能与实际对比一致install.packages("VennDiagram")library("VennDiagram")Length_A <- 54.07Length_B <- 38.86Length_C <- 3.55Length_AB <-

2016-08-16 16:51:16 8167

转载 【linux】【base】 之 硬件配置获取&基础管理

查看CPU信息 Linux下CPU相关的参数保存在 /proc/cpuinfo 文件里 cat /proc/cpuinfo |more查看Mem信息 cat /proc/meminfo |more 查看磁盘信息 fdisk -l查看网卡信息 ethtool eth0

2016-08-16 15:03:28 445

转载 欢迎使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2016-08-15 18:18:23 176

原创 【R语言】【装包】 之 Error while loading rJava

> library(rJava)Error : .onLoad failed in loadNamespace() for 'rJava', details: call: dyn.load(file, DLLpath = DLLpath, ...) error: unable to load shared object '/home/cloudera/R/x86_64-redhat-linu

2016-08-15 18:00:03 880

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除