- 博客(7)
- 资源 (2)
- 收藏
- 关注
原创 手写数字识别(二)----SVM 实现Mnist-image 手写数字图像识别
前言前两天利用kNN实现了手写数字的识别,数据不是很多,训练数据1934个,测试数据946个。这两天把Mnist-image的手写数字数据down了下来,利用SVM进行识别一下。Mnist-image的手写数字数据有7万的图像数据(6万训练数据+1万测试数据),每个图像数据为 20px * 20px。
2016-11-07 19:49:37 50039 31
原创 Installing Xgboost for Anaconda on Windows
在Window7上为Anaconda安装Xgboost这两天在window7 64位上折腾了一下xgboost的安装,费了好大的劲,最终安装成功了,也算是没有白费力。(O_O)先上的效果: 准备工作在window上安装xgboost需要以下一些软件的支持:Python的环境,我选择的是Anaconda发行版(这个版本为安装各种第三方package提供了极大的方便,还有方便的Jupyter not
2016-11-26 12:05:17 7379 3
原创 大数据技术系列----副本更新策略
副本更新策略通常情况,大规模分布式存储系统会将一份数据在系统内复制多份并保存在不同的存储。一方面可以通过数据冗余来增加系统的可用性,另一方面也可以增加读操作的并发程度。在多副本的情况下,有3种可能的更新策略:同时更新策略、主从式更新策略和任意节点更新策略。
2015-09-16 14:22:45 1725
原创 Hive 简介及优化策略
简介Hive是一个基于Hadoop文件系统之上的数据仓库架构。为数据仓库管理提供了许多功能:数据ETL工具、数据存储管理和大型数据集的查询和分析能力。 高延迟性。不提供数据排序和查询cache功能,不提供在线事务处理,不提供实时查询和记录级的更新,但能更好地处理不变的大规模数据集上的批量任务。
2015-07-29 11:48:12 540
Crack code interview
2013-04-05
The Practice of Programming(英文版)
2013-04-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人