自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 资源 (10)
  • 收藏
  • 关注

转载 常见的大数据术语表

大数据的出现带来了许多新的术语,但这些术语往往比较难以理解。因此,我们通过本文给出一个常用的大数据术语表,抛砖引玉,供大家深入了解。其中部分定义参考了相应的博客文章。当然,这份术语表并没有100%包含所有的术语,如果你认为有任何遗漏之处,请告之我们。A聚合(Aggregation) – 搜索、合并、显示数据的过程算法(Algorithms) – 可以完成某种数据分析的数

2015-03-27 12:54:40 872

转载 【Github教程】史上最全github使用方法:github入门到精通

【初识Github】首先让我们大家一起喊一句“Hello Github”。YEAH!就是这样。原文 http://www.eoeandroid.com/thread-274556-1-1.htmlGit是一个分布式的版本控制系统,最初由Linus Torvalds编写,用作Linux内核代码的管理。在推出后,Git在其它项目中也取得了很大成功,尤其是在Ruby社区中。目前,包括Ru

2014-04-12 10:43:37 573

转载 数据库架构的演变

最近看了很多公司架构的演变的文章,发现其中的基本思路和架构演变都很类似,这里也总结一下数据库架构的演变以及演变背后的思路。单主机最开始网站一般都是由典型的LAMP架构演变而来的,一般都是一台linux主机,一台apache服务器,php执行环境以及mysql服务器,一般情况下,这些都在一台虚拟主机上,简称单主机模式。单主机模式缺点:1 web服务器和mysq

2014-02-08 20:19:50 500

转载 C++ linux

C++ linux 1. 段错误 http://www.cnblogs.com/hello--the-world/archive/2012/05/31/2528326.html

2014-01-17 10:42:20 608

转载 mysql 上手(mysql命令 + c++程序 + g++编译)

mysql命令  http://www.360doc.com/content/10/0608/01/276520_31866098.shtmlc++程序  http://www.cnblogs.com/lovebread/archive/2009/11/24/1609936.htmlg++参数 http://blog.csdn.net/zhuxiaoyang2000/article/det

2014-01-14 19:55:07 842

转载 银行卡收费标准

银行卡收费标准   银行名称    银行卡名称    年费    挂失手续费    损坏换卡手续费    中国银行    长城电子借记卡    10元    10元    5元    工商银行    牡丹灵通卡    10元    10元    5元    建设银行    龙卡储蓄卡    10元    10元    5元    农业银行    金穗

2013-12-11 23:09:46 1483

转载 Stanford Named Entity Recognition Tags

-LRB- -RRB- -RSB- -RSB- -LCB- -RCB- (The acronyms stand for (Left|Right) (Round|Square|Curly) Bracket.) 摘自:http://www.cis.upenn.edu/~treebank/tokenization.html

2013-12-02 22:38:33 883

原创 Part-of-Speech 标记 含义

一、33个Definitions of Chinese Part-of-Speech中文词性标注(33)[1]     AD    副词  Adverbs[2]     AS    语态词  --- 了[3]     BA    把[4]     CC    并列连接词(coordinating conj)[5]     CD    许多(many),若干(severa

2013-12-02 22:36:04 2776 1

原创 X230 装系统

前段时间装系统,遇到点小问题,解决了,记录下来 原来:X230 自带win8目标:win7原因:自带的win8,好多软件装不了,如VMware,Chrome,用着也不是很习惯,不能打DOTA 1.无法将系统安装到该分区GPT详见 GPT转MBR分区格式图文教程2.X230无法进入BIOS之前能进去的,否则也无法遇到问题1,后来发现,系统由更新,关机时提醒更新后关

2013-11-24 22:26:00 1768

转载 GPT转MBR分区格式图文教程

在转换之前,首先让我们了解一下什么是GPT?为什么要转换?GPT:GUID Partition Table (GUID 分区表 磁盘分区样式支持最大卷为 18 EB (exabytes) 并且每磁盘最多有 128 个分区)我们可以到“磁盘管理”里面,右键点击下方的磁盘型号,看弹出的菜单,若有“转换为GPT磁盘”字样,说明你的硬盘分区是MBR模式;若有“转换为MBR磁盘”字样,说明你的硬

2013-11-20 15:11:47 1070

转载 Linux基础-命令

************************************ls基本上,除去第一行,输出结果可以分成8个字段。1.文件属性字段    最左边的是文件属性字段总共有10个字母组成,第一个字母表示文件类型,        ”-”,普通文件.        ”d”目录,字母”d”,是dirtectory(目录)的缩写.   

2013-11-14 17:21:49 427

原创 书籍推荐

C++1.《The C++ Programming Language》Bjarne Stroustrup, 《C++程序设计语言(特别版)》,机械工业出版社(精度)2.《The Design and Evolution of C++》 Bjarne Stroustrup 《C++语言的设计和演化》,机械工业出版社(精度)3. 《Accelerated C++中文版》,4.《C++

2013-11-09 16:49:08 1114

转载 个性化推荐 简单介绍(协同过滤 入门)

“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。本文作为这个系列的第一篇文章,将深入介绍推荐引擎的工作原理,和其中涉及的各种推荐机制,以及它们各自的优缺点和适用场景,帮助

2013-10-31 22:32:25 751

转载 socket编程

“一切皆Socket!”话虽些许夸张,但是事实也是,现在的网络编程几乎都是用的socket。——有感于实际编程和开源项目研究。我们深谙信息交流的价值,那网络中进程之间如何通信,如我们每天打开浏览器浏览网页时,浏览器的进程怎么与web服务器通信的?当你用QQ聊天时,QQ进程怎么与服务器或你好友所在的QQ进程通信?这些都得靠socket?那什么是socket?socket的类型有哪些?还有

2013-10-30 01:49:20 441

转载 Floyd算法

Floyd算法(各对顶点之间的最短距离)                 Floyd算法(各对顶点之间的最短距离)         在上篇文章中谈论到了如何求算单源最短路径,因此要想求各对顶点之间的距离,只需循环求算n次即可。还有另外一种方法来求算各对顶点之间的最短距离,就是Floyd算法,由于其算法过程比Dijkstra更容易理解,并且代码更简洁,因此当求算各对顶点之间的最短距离

2013-10-27 21:33:40 756

转载 Dijkstra算法

Dijkstra算法(单源最短路径)      单源最短路径问题,即在图中求出给定顶点到其它任一顶点的最短路径。在弄清楚如何求算单源最短路径问题之前,必须弄清楚最短路径的最优子结构性质。一.最短路径的最优子结构性质   该性质描述为:如果P(i,j)={Vi....Vk..Vs...Vj}是从顶点i到j的最短路径,k和s是这条路径上的一个中间顶点,那么P(k,s)必定是从k到s的最短路

2013-10-27 21:02:30 428

转载 URL编码

一、问题的由来URL就是网址,只要上网,就一定会用到。一般来说,URL只能使用英文字母、阿拉伯数字和某些标点符号,不能使用其他文字和符号。比如,世界上有英文字母的网址“http://www.abc.com”,但是没有希腊字母的网址“http://www.aβγ.com”(读作阿尔法-贝塔-伽玛.com)。这是因为网络标准RFC 1738做了硬性规定:"...Only a

2013-10-26 19:32:21 473

原创 腾讯2014校招笔试--排队系统

public class People{private: int index;public: People() { index = -1; } int getIndex() { return index; } void InQueue(MyQueue queue) { queue.add(this); } void Out

2013-10-26 00:18:58 1031

转载 B树、B-树、B+树、B*树

B树       即二叉搜索树:       1.所有非叶子结点至多拥有两个儿子(Left和Right);       2.所有结点存储一个关键字;       3.非叶子结点的左指针指向小于其关键字的子树,右指针指向大于其关键字的子树;       如:              B树的搜索,从根结点开始,如果查询的关键字与结点的关键字相等,那么就命中;否则,

2013-10-16 22:14:57 454

转载 KMP

KMP算法        在介绍KMP算法之前,先介绍一下BF算法。一.BF算法    BF算法是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串P的第一个字符进行匹配,若相等,则继续比较S的第二个字符和P的第二个字符;若不相等,则比较S的第二个字符和P的第一个字符,依次比较下去,直到得出最后的匹配结果。    举例说明:    S:  ababcababa

2013-10-15 11:18:15 447

原创 资料整理

GBDT http://www.cnblogs.com/LeftNotEasy/archive/2011/03/07/random-forest-and-gbdt.html

2013-10-15 00:20:56 655

转载 网络游戏架构

网络游戏架构1、  一种架构是Peer-to-Peer 对等通信结构,如下图所示,即在多个玩家参与的游戏中,各玩家之间采用Peer-to-Peer的直接通信方式。在网络通信服务的形式上,一般采用浮动服务器的形式,即其中一个玩家的机器既是客户端,又扮演服务器的角色,一般由创建游戏局的玩家担任服务器(主机)。很多对战型的RTS网络游戏都采用这种结构。2、  另一种架构是基于游戏大厅

2013-10-14 00:15:08 1318

转载 C++虚函数的实现机制

C++中的虚函数的作用主要是实现了多态的机制。关于多态,简而言之就是用父类型别的指针指向其子类的实例,然后通过父类的指针调用实际子类的成员函数。这种技术可以让父类的指针有“多种形态”,这是一种泛型技术。所谓泛型技术,说白了就是试图使用不变的代码来实现可变的算法。比如:模板技术,RTTI技术,虚函数技术,要么是试图做到在编译时决议,要么试图做到运行时决议。关于虚函数的使用方法,我在这里不做过多的

2013-10-11 23:50:55 421

转载 c++ STL 容器

参考:STL源码分析(一)vector容器vector的数据安排以及操作方式,与array非常相似。两者的唯一区别在于空间的运用的灵活性。array是静态空间,一旦配置了就不能改变。vector是动态空间,随着元素的加入,它的内部机制会自行扩充空间以容纳新元素。因此,vector的运用对于内存的合理利用与运用的灵活性有很大的帮助,我们再也不必因为害怕空间不足而一开始要求一个大块的arr

2013-10-11 09:39:40 421

原创 atoi C++ 实现

测试用例库实现MyAtoi用例备注Returng_inputIllegalNULL未定义0True “”00True “   \n34”3434

2013-10-09 10:00:16 689

转载 malloc/free and new/delete 工作机制

malloc()是C语言中动态存储管理的一组标准库函数之一。其作用是在内存的动态存储区中分配一个长度为size的连续空间。其参数是一个无符号整形数,返回值是一个指向所分配的连续存储域的起始地址的指针。 当函数未能成功分配存储空间(如内存不足)就会返回一个NULL指针。所以在调用该函数时应该检测返回值是否为NULL并执行相应的操作。malloc()工作机制malloc函数的实质体现在

2013-10-08 17:05:59 703

转载 线段树(区间树)

线段树(区间树)Segment Tree实际上还是称为区间树更好理解一些。树:是一棵树,而且是一棵二叉树。线段:树上的每个节点对应于一个线段(还是叫“区间”更容易理解,区间的起点和终点通常为整数)同一层的节点所代表的区间,相互不会重叠。叶子节点的区间是单位长度,不能再分了。 线段树是一棵二叉树,树中的每一个结点表示了一个区间[a,b]。a,b通常是整数。每一

2013-10-07 19:16:28 706

转载 用户行为分析心得

最近对产品设计以及用户体验很感兴趣,对此进行较为深入的研究,用户行为分析是提高用户体验的基础,掌握了用户行为的数据才能真正的了解用户,提高用户体验。对于用户的行为分析主要是两点:1、用户视觉行为分析。2、用户操作行为分析。这里针对用户行为谈几点常用的用户行为分析方式:这里先介绍下视觉行为测试的方式。1、眼睛第一感觉测试这个测试是最为基础的测试,完全的视觉测试,当然这样的测试也不完全准确

2013-09-27 22:37:59 789

原创 NLP news

1.淘宝吴雪军:自然语言处理技术在搜索和广告中的应用http://www.csdn.net/article/2011-08-09/302848

2013-09-25 10:25:55 447

原创 NLP(资料整理)

一、新词发现1.《互联网时代的社会语言学:基于SNS的文本数据挖掘》:Matrix67在人人实习的研究 http://www.matrix67.com/blog/archives/50442.

2013-09-23 00:05:41 628

原创 排序算法C++实现

//*************************//1. Bubble sort O(n2)void bubbleSort(int data[], int len){    bool flag;    for(int i = len - 1; i > 0; --i)    {        flag = false;        for(int j = 0;

2013-09-19 23:59:00 418

转载 案例分析:校内网崛起原因及其发展前景

 案例分析:校内网崛起原因及其发展前景 案例分析:校内网崛起原因及其发展前景背景 创始人简介 内网创始人王兴:福建人,1997年被保送到清华大学电子工程系无线电专业,毕业后拿到全额奖学金去了美国特拉华大学(University of Delaware)电子与计算机工程系。导师是高光荣,第一位获得MIT计算机科学博士学位的大陆学者。  2003年的圣诞节,王兴带着明确的创

2009-03-27 08:09:00 1008

Programming WCF Services.chm

WCF 的一本较好的书,是英文版的,将的还可以,建议由一定WCF基础的读者阅读

2010-01-04

编程高手箴言.chm

本书是作者十余年编程生涯中的技术和经验的总结。内容涵盖了从认识CPU、Windows运行机理、编程语言的运行机理,到代码的规范和风格、分析方法、调试方法和内核优化,内有作者对许多问题的认知过程和透彻的分析,以及优秀和精彩的编程经验。

2009-03-27

XML 指南.chm

XML是EXtensible Markup Language的缩写 XML是一种类似于HTML的标记语言 XML是用来描述数据的 XML的标记不是在XML中预定义的,你必须定义自己的标记 XML使用文档类型定义(DTD)或者模式(Schema)来描述数据 XML使用DTD或者Schema后就是自描述的语言

2009-03-27

游戏引擎介绍.chm

引擎是一大好的设计,方便了大家。希望大家了解它,拓宽大家的技术视野

2009-03-26

PC游戏编程.chm

喜欢PC游戏编程的,下来看看吧!希望它能给你一些提示和方向,

2009-03-26

Java关键字及其作用.zip

一门编程语言的关键字必须很清楚,Java编程助手,忘了就查查,方便快捷。

2009-03-26

Winsock API手册.chm

Winsock API手册.chm 内容包括: 1、Winsock Functions [Winsock] 2、Winsock Structures [Winsock] 3、Windows Sockets Error Codes [Winsock]

2009-03-01

Linux_内核完全注释_V11.pdf

linux 源代码 加注释,易于阅读,更好的学习,开源世界

2009-01-01

UNIX用户手册2ed.part1.rar

UNIX面面接触,玩转UNIX,让工作更有效

2009-01-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除