自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

sure-fire的专栏

穷则变,变则通,通则久。

  • 博客(63)
  • 收藏
  • 关注

原创 一个完整的schema验证xml的例子

xml文件: 陈路瑶 信息文档结构信任模式的提取及逻辑描述 J 计算机应用研究 2010 27 4624-4629schema文件:

2015-07-22 21:29:54 2158

转载 集中式vs分布式

Linus一直痛恨的CVS及SVN都是集中式的版本控制系统,而Git是分布式版本控制系统,集中式和分布式版本控制系统有什么区别呢?先说集中式版本控制系统,版本库是集中存放在中央服务器的,而干活的时候,用的都是自己的电脑,所以要先从中央服务器取得最新的版本,然后开始干活,干完活了,再把自己的活推送给中央服务器。中央服务器就好比是一个图书馆,你要改一本书,必须先从图书馆借出来,然后回到家自己改

2015-07-01 12:05:43 805

原创 stanford-segmenter一个简单例子

1.简介stanford分词目前支持 Arabic 和 Chinese。它的原理是基于CRFs, CRFs分词的原理不难懂,就是把分词当作另一种形式的命名实体识别,利用特征建立概率图模型后,用Veterbi算法求最短路径。stanford nlp提供了源码demo,目前的版本是3.5.2。下载地址:http://nlp.stanford.edu/software/segmenter.s

2015-07-01 09:49:11 2571

转载 自然语言处理NLP工具包

1. Java自然语言处理 LingPipeLingPipe是一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named EntityRecognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Query

2015-06-30 15:49:41 2413

原创 决策树

1.      什么是决策树(Decision Tree)决策树是一种类似流程图的树形结构,每个内部节点表示一个测试(查询),该节点的每个分支表示该测试的一个结果,每个叶节点表示一个类别。决策树是一种简单但是广泛使用的分类器。通过训练数据构建决策树,可以高效的对未知数据进行分类。2.      例子ID拥有房产(是/否)婚姻情

2015-06-29 21:45:59 2008 2

原创 参考文献格式总结

不同文献类型其著录格式不同,因此按照文献类型对其进行划分并按照各著录项(可选项和必备项)进行著录格式检查(著录项目、著录顺序、著录用的符号、各著录项的著录方法)。本文根据《GB/T 7714-2005》文后参考文献著录规则整理而得,共分为六类。1.  专著(monographs)1)  包括:普通图书[M]、古籍、学位论文[D]、技术报告[R]、会议文集[C]、标准[S]、多卷书、丛书等。

2015-06-29 21:28:01 1638

原创 Weka – 分类

1.      weka简介1)  weka是新西兰怀卡托大学WEKA小组用JAVA开发的机器学习/数据挖掘开源软件。2)  相关资源链接         http://sourceforge.net/projects/weka/files/         http://www.cs.waikato.ac.nz/ml/weka/3)  主要特点集数据预处理、学习算

2015-06-29 21:22:33 6395

原创 Stanford Named Entity Recognizer (NER)简单应用实例

Stanford Named Entity Recognizer (NER)是斯坦福大学自然语言研究小组发布的成果之一,其主页是:http://nlp.stanford.edu/software/CRF-NER.shtmlStanford NER 是一个Java实现的命名实体识别(以下简称NER))程序。NER将文本中的实体按类标记出来,例如人名,公司名,地区,基因和蛋白质的名字等

2015-06-29 20:35:24 3564 1

转载 推荐方法总结

在推荐系统简介中,我们给出了推荐系统的一般框架。很明显,推荐方法是整个推荐系统中最核心、最关键的部分,很大程度上决定了推荐系统性能的优劣。目前,主要的推荐方法包括:基于内容推荐、协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐和组合推荐。一、基于内容推荐基于内容的推荐(Content-based Recommendation)是信息过滤技术的延续与发展,它是建立在项目的内

2015-06-26 17:12:03 813

转载 数据分析最常见的十个问题,感兴趣的可以看看!

原文作者:数据海洋1 Data Mining 和统计分析有什么不同?    硬要去区分Data Mining和Statistics的差异其实是没有太大意义的。一般将之定义为Data Mining技术的CART、CHAID或模糊计算等等理论方法,也都是由统计学者根据统计理论所发展衍生,换另一个角度看,Data Mining有相当大的比重是由高等统计学中的多变量分析所支撑。但是为什

2015-06-26 17:08:49 2187

转载 对新数据分析师同学几点分享

原文作者:数据海洋一、掌握基础、更新知识。基本技术怎么强调都不过分。这里的术更多是(计算机、统计知识), 多年做数据分析、数据挖掘的经历来看、以及业界朋友的交流来看,这点大家深有感触的。数据库查询—SQL数据分析师在计算机的层面的技能要求较低,主要是会SQL,因为这里解决一个数据提取的问题。有机会可以去逛逛一些专业的数据论坛(中国统计网:www.itongji.cn),学习一些

2015-06-26 16:49:02 579

转载 20条恋爱法则

1.      多半男人认为,女人晚上也要和白天一样有魅力。每天把自己打扮得漂亮可爱一点,投入地爱一次,大多数女人需要一次刻骨铭心地爱,这样可以尽早实现情感免疫,也可以为未来的日子留出更多理性的空间。2.      多读书、多思考。知识才能改善命运,其好处到你25岁以后会逐渐显现。到那时,无论如何你都找不回从前的青春感受,看到周围的年轻人,只有两个字:羡慕。这时候的女人气质最重要,气质离不开内

2014-01-16 15:05:57 962

原创 东北大学计算机专业(专业硕士)研究生入学考试2011年真题

/*-------------------------------------------------------C语言部分------------------------------------------------------------------*//*1.试编写一个程序,显示指定的文本文件中的内容,要求每行中显示的字符数不得超过30个字符。*//*2.试编写一个函数char *s

2014-01-16 15:00:53 1548

原创 东北大学计算机专业(专业硕士)研究生入学考试2010年真题

/*--------------------------------------------------------数据结构部分---------------------------------------------------------------*//*1.假设线性表L用带头结点的单链表存储,且至少有两个结点,每个结点的数据域为整型值。编写算法以判断该链表中每一个结点的值是否等于其后继

2014-01-16 14:58:52 1652

原创 东北大学计算机专业(专业硕士)研究生入学考试2009真题

/*--------------------------------------------------------数据结构部分---------------------------------------------------------------*//*1.写出将循环单链表中结点X的直接前驱删除的算法(X为指针,且从X指向的结点出发进行删除)。*/typedef struct LNod

2014-01-16 14:57:19 1367

原创 东北大学计算机专业研究生入学考试2008年真题

//http://www.cskaoyan.com/thread-756-1-1.html/*-------------------------------------------------------C语言部分------------------------------------------------------------------*//*二.输入N个数,编写一个递归函数,求出N

2014-01-16 14:54:42 1184

转载 东北大学计算机专业研究生入学考试2007年真题原题

2007年攻读硕士学位研究生试题东北大学考试科目:C语言程序设计与数据结构《C语言程序设计》部分(共75分)一、写出下列程序的运行结果(答案写在答卷上,共20分,每小题5分)1.int f(int *a){return(*a)++;}void main(){int a=2;int s=0;{int a=5;s+=f(&a);}

2014-01-16 14:52:10 1687 1

原创 东北大学计算机专业研究生入学考试2006年真题

/*-------------------------------------------------------C语言部分------------------------------------------------------------------*//*三.由键盘输入n(n<50)个英文单词,每个单词由空格分隔。试编写一个递归函数,判断这n个单词是否是按字典顺序排列的。*/#incl

2014-01-16 14:50:14 2407 2

原创 东北大学计算机专业研究生入学考试2005年真题

/*-------------------------------------------------------C语言部分------------------------------------------------------------------*//*1.将一个数的数码倒过来所得到的新数叫原数的反序数。如果一个数等于它的反序数,则称它为对称数。计算不超过1993的最大的二进制的对称数

2014-01-16 14:47:51 1880

转载 东北大学计算机专业研究生入学考试2005年真题原题

2014-01-16 14:46:22 1694

原创 东北大学计算机专业研究生入学考试2004年真题

/*-------------------------------------------------------C语言部分------------------------------------------------------------------*//*三.设有算术表达式,其中包含有大括号”{ " " }" 中括号"[" "]" 小括号 "(" ")",试编写一个递归函数,判断表达式

2014-01-16 14:37:53 1547

原创 东北大学计算机专业研究生入学考试2003年真题

/*-------------------------------------------------------C语言部分------------------------------------------------------------------*//*三.已知2000年1月1日为星期六,编程求任意给定年元月1日的星期*//*四.今有一英汉词典文件EC.txt(文件大小超过1MB),

2014-01-16 14:35:21 1428

原创 东北大学计算机专业研究生入学考试2002年真题

/*------------------------------C语言部分--------------------------------*//*四.1.如果矩阵A中的某元素A[I,J]是第I行中的最小值,而且是第J列中的最大值,则称A[I,J]为矩阵A中的一个鞍点,编写函数SEARCHAD(A,ROW,COL)来求矩阵A[ROW,COL]中的鞍点。*/void SEARCHAD(int a

2014-01-16 14:33:55 1918

原创 东北大学计算机专业研究生入学考试2001年真题

/*---------------------------------数据结构部分---------------------------------*//*二.设有一个正整数序列组成的有序单链表(按递增次序有序,且允许有相等的整数存在),试编写能实现下列功能的算法:(要求用最少的时间和最小的空间)(1)确定在序列中比正整数x大的数有几个(相同的数只计算一次,如序列(20,20,17,16,15

2014-01-16 14:32:03 2771

原创 东北大学计算机专业研究生入学考试2000年真题

/*--------------------数据结构部分------------------------*//*二.设有一个由正整数组成的无序单链表,编写完成下列功能的算法: 1.找出最小值结点,且打印该数值; 2.若该数值是奇数,则将其与直接后继结点的数值交换; 3.若该数值是偶数,则将其直接后继结点删除。*/#include#include#include#define

2014-01-16 14:29:57 2446

转载 良言

1、婚姻的成功取决于两点:一、找个好人;二、自己做个好人。    ——一位研究婚姻问题的学者(《知音》2004.2)评语:直观简明地告诉了人们幸福婚姻必需的两个因素。生活中,人们常常强调第一点,而忽视了第二点。2、一个人需要技巧和智慧,但最不能缺少的,是原则和信念。       ——陆勇强《最出色的地方》(《扬子晚报》2004.7.30)评语:它为我们指明了人生追求的层

2014-01-16 14:20:17 576

转载 修道士和野人

import java.util.*; import java.io.*;public class MACPS { final public class SolutionNotFoundException extends RuntimeException { private static final long serialVersionUID = 1L; } stat

2014-01-15 20:21:14 1228

转载 农夫过河

#include "iostream"using namespace std;#define Max 20 //最大顶点数 typedef struct //图顶点类型{ int R,H,T,C; }Ding;

2014-01-15 20:19:51 2110

原创 动态规划

/**********************************************************1.动态规划基本思想在做每一步决策时,列出各种可能的局部解,之后依据某种判定条件,舍弃那些肯定不能得到最优解的局部解。这样,在每一步都经过筛选,以每一步都是当前最优的来保证全局是最优的。2.最优性原理不论初始状态和第一步决策是什么,余下的决策相对于前一次决策所产生的

2014-01-15 20:14:53 692

原创 贪心算法

/**********************************************************贪心算法基本思想在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,他所做出的仅是在某种意义上的局部最优解。***********************************************************//*****

2014-01-15 20:13:26 572

原创 读一个文本文件,并用二进制方式生成相应的新文件,并比较两个文件的大小要求两个文件名从键盘输入

#include "iostream"#include "string"#include #include #include using namespace std;int main(){ string oriFilename,newFilename; cout<<"输入原文件名:"; cin>>oriFilename; cout<<"输入新文件名:"; cin

2014-01-15 20:11:03 1000

原创 N个元素的数组中找出出现多于N/2次的数(主元素)

/*N个元素的数组中找出出现多于N/2次的数(主元素)问题一:如何构造一个数组,此数组中有数字出现多于N/2次?随机生成一个数,将此数随机插入N/2+1次到数组中,其它空位再用随机生成数来填充问题二:如果存在多于N/2次的数,如何找到它?排序,中间的数应该是出现多于N/2次的数*/#include "iostream"#include "ctime"#include "cstdl

2014-01-05 19:08:13 2123

原创 在1-50万的编号里摇号,输出前n个尾号为55和77的编号

#include "iostream"#include "ctime"#include "cstdlib"using namespace std;#define N 10int main(){ int num[N] = {0}; int count = 0; //计数 int random = 0; //生成的随机数 bool flag = false; //随机数是否存在的

2014-01-05 16:23:31 701

转载 忘记该忘记的

如果不能“忘”,或者没有“忘”这个本能,那么痛苦就会时时刻刻都新鲜生动,时时刻刻像初产生时那样剧烈残酷地折磨着你。这是任何人都无法忍受下去的。然而,人能“忘”,渐渐地从剧烈到淡漠,再淡漠,终于只剩下一点点残痕;有人,特别是诗人,甚至爱抚这一点残痕,写出了动人心魄的诗篇,这样的例子,文学史上还少吗?  ——季羡林  当一个人走过50、60、70年……乃至更长的岁月后,忘记就成为生活中

2013-12-26 18:37:59 528

转载 宽恕别人,轻松自己

同我一起工作的同事一多半是十年浩劫中的对立面,批斗过我,污蔑过我,审讯过我,踢打过我。他们中的许多人好像有点愧悔之意。我认为,这些人都是好同志,同我一样,一时糊涂油蒙了心,干出了一些不太合乎理性的勾当。世界上没有不犯错误的人,这是大家都承认的一个真理。  ——季羡林

2013-12-26 18:12:07 829

转载 龙应台写给儿子安德烈的一段话

龙应台写给儿子安德烈的一段话:“孩子,我要求你读书用功,不是因为我要你跟别人比成绩,而是因为,我希望你将来会拥有选择的权利,选择有意义、有时间的工作,而不是被迫谋生。当你的工作在你心中有意义,你就有成就感。当你的工作给你时间,不剥夺你的生活,你就有尊严。成就感和尊严,给你快乐。"

2013-12-02 20:43:39 2339

转载 人生如戏,戏如人生

人生如戏,人生就像是一出没有彩排的舞台剧,没有设定好的剧本,也没有预演,一旦登上社会的舞台就是现场直播;戏如人生,一幕剧从开幕到落幕,就像人的生命一样从出生到死亡,只不过人生没有彩排、没有剧本。 在社会这个大舞台上,每个人都是主角,每个人用他们不同的方式来演绎着各自不同的人生。有的人能够在有限的生命岁月中将人生演绎成了一幕欢喜剧,有的人却在平庸中浑浑噩噩的度过一生抑或将人生

2013-12-01 12:34:04 797

原创 使用栈非递归实现复制二叉树

#include "iostream"using namespace std;#define max 20 //the number of nodetypedef struct BTNode{ char data; struct BTNode *lc,*rc;}BTree;#define STACK_INIT_SIZE 100#define STACK_INCR 10ty

2013-11-27 10:17:43 1530 1

原创 编写一个递归算法,实现将一棵二叉树的左右孩子互换。

#include "iostream"using namespace std;#define max 20//定义树的结点数typedef struct BTNode//定义二叉树结点类型{ char data;//结点数据类型 struct BTNode *lc,*rc;//左右指针}BTree;BTree *createtree(char *str,int i,int m)/

2013-11-26 15:43:08 7492 4

原创 MapReduce :Simpliyed Data Processing on Large Clusters 总结

MapReduce:Simpliyed Data Processing on Large Clusters(超大集群的简单数据处理)*一.背景1. 问题的提出面对海量数据,如何处理并行计算、如何分发数据、如何处理错误等问题引发关注,而原本简单的计算处理由于这些问题的存在变得复杂,是否能找到一种方法来解决这个问题?2. MapReduce的出现

2013-11-26 15:27:06 1122

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除