自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

To be simple but effective!

Don't think complex to simple,and never make simple to complex.

  • 博客(61)
  • 资源 (2)
  • 收藏
  • 关注

原创 孕妇好的软件有哪些 孕妇软件哪个好 孕妇软件

http://www.kangfuzi.cn/孕妇好的软件有哪些孕妇软件哪个好孕妇软件孕妇拍照软件孕妇手机软件哪个好孕妇照软件孕妇手机软件拍孕妇照的软件最好的孕妇软件关于孕妇的软件孕妇软件推荐当然推荐孕食助手!!【软件介绍】孕食助手是一款帮助孕妇在孕期健康饮食的软件,它基于大数据技术从权威的医疗文献中获取健康营养知识,并结合母婴专家指

2015-07-01 19:14:56 6647

原创 利用C语言获取网页源代码

当你想通过饮食来调理身体健康的时候,康夫子是你必备选择。利用C语言获取网页源代码#include  #include  #include  #pragma comment(lib, "ws2_32.lib") void geturl(char *url) { WSADATA WSAData={0}; SOCKET sockfd; struct soc

2015-03-14 14:36:43 3017

原创 康夫子:医疗人工智能、大数据信息技术提供商

北京康夫子科技有限公司是一家专注于人工智能技术在医疗健康领域应用研发的技术驱动型公司,成立于2015年,主要创始人来自百度自然语言处理部和国家卫生计生委疾病控制局。凭借国际领先的知识抽取和知识推理、表示等知识图谱构建技术,康夫子成功打造了“医疗大脑”和“饮食营养”两项重要的知识内核(知识图谱)。康夫子医疗大脑以数万本医学教科书、近百万份临床病历、千万篇医疗论文为基础以保证数据的科学性,同时以千万条通俗语言的实际问诊记录为拓展,建立口头医学与文献医学之间的词汇关联,将普通公众对症状的描述和对疾病的理解准确

2015-02-23 10:44:16 6116

原创 分词的那些事(二)

<br />September 23分词的那些事(二)分词的应用背景也是基于上面两种情况来说吧。<br />先说基于信息检索的。根据我们前面的了解,可以知道这个分词在除了切分精度之外,另外一个重要的特征就是保证切分的一致性。比如说:用户搜索时候输入的query中包含的某些词 和 这些词在网页中的环境是不一样的。所以,这个时候,为了能搜索到相关的网页,切词一定要保证一致性。比如“北京市长是谁”,用户的query为“北京 市长”,搜索引擎就切分成“北京”“市长”,如果在网页中“北京市长某某”切分成了“北

2010-09-23 15:01:00 2003

原创 分词的那些事

<br />September 21分词的那些事(一)分词的那些事<br />By Super.Jiju<br />好久没更新blog了,前天为了让群里面的技术气氛活跃点,以及也整理整理自己的一些知识以便与大家交流,所以我把分词的前前后后介绍一下,希望大家多多指教。<br /><br /><br /><br />分词是中文自然语言处理里面最基础的工作,因此大家说到中文信息处理的时候,都会说到中文分词。事实上,切分的思想是没有语言边界的,下面从我的理解分别说一说分词的前因后果。整个介绍分为分词的需求背景,分词

2010-09-23 14:59:00 2032

原创 Query Segmentation Demo Release!

My demo about query segmentation which is based on prior paper has been released!If you are interested in it, You can view it with the site below:http://cid-806c498ddee76b61.skydrive.live.com/self

2009-07-27 13:05:00 2033

原创 理论指导实践啊~~~~

理论指导实践! 近期一直想一个idea;本来是计算两个向量x,y的inner products,但是效果不是太好;所以我想,将这两个向量映射到某个空间上面去;然后再计算;感觉这个想法挺好的,差点就做实验了;今天忽然发现,不对;这是因为:Unitary matrices preserve the Euclidean inner product;也就是Unitary Matrix Q, (Qx,Q

2009-05-21 11:55:00 1887

原创 Latent Semantic Analysis(LSA)

Latent Semantic Analysis(LSA)这个东东效果还不错以前听过,可以理解将矩阵进行去噪;或者说把问题转换到这个矩阵的某个空间里面去用了SVD方法将特征向量空间进行推广;这里有个文档,不错,通俗易懂的描述了lsa;点击这里下载;http://3sztgg.blu.livefilestore.com/y1p7bK-BNxqs4NXZKCufRAPnts2J7oQ0RxI7Zv

2009-05-19 15:36:00 2149

原创 赞一下youdao搜索!

很久以前我在闲聊的时候说:在一个社区里面,有很多的link,如果对一个link添加上预览功能,是不是会起到很好的效果呢?刚才使用了youdao.com,发现youdao就有这个功能,哈哈,看来我还是有先见之明啊; 这样的好处很明显:1.极大地节省了用户的时间;2.很好的解决了snippets的不足;3.特别在网速慢的像屎一样的地方,这种优越性更是不言而喻的;最后再来个小结论:不久的日子,很

2009-05-17 20:21:00 2048 1

原创 如何提取一个query的concepts?

在一些基于object搜索,或者directory方面等等搜索,需要将一个query进行分割处理;比如:”Chineserestaurant at Bukit Timah Road“,有没有什么办法可以将这个query分成“Chinese restaurant”和“Bukit Timah Road”呢?然后再到数据库里面查找这两个concept对应的内容;  http://su

2009-05-17 19:25:00 2132

原创 说说拼写检查,spell checking

 说说拼写检查,spell checkinghttp://super-jiju.spaces.live.com/Google的拼写检查做的很神奇,以一个相当高的准确率来判断你的输入是不是正确的;但是其中如何做的,谁也不清楚;这篇文章http://www.norvig.com/spell-correct.html, 里面描述了一个简单的模型;  但是上面这个模型的准

2009-05-17 19:04:00 2359

原创 特征值与特征向量的数值计算; Matrix Eigenvalues and Eigenvectors Calculating

http://super-jiju.spaces.live.com/blog/cns!806C498DDEE76B61!590.entry特征值与特征向量的数值计算; Matrix Eigenvalues and Eigenvectors Calculating 这里给一个link,比较全面:http://3sztgg.blu.livefilestore.com/y1p2F8Lb8eNd

2009-05-17 19:03:00 2765

原创 如何使用搜索引擎 zZ

 搜索引擎为用户查找信息提供了极大的方便,你只需输入几个关键词,任何想要的资料都会从世界各个角落汇集到你的电脑前。然而如果操作不当,搜索效率也是会大打折扣的。 http://super-jiju.spaces.live.com/blog/cns!806C498DDEE76B61!564.entry 比方说你本想查询某方面的资料,可搜索引擎返回的却是大量无关的信息。这种情况

2009-05-17 19:01:00 3803

原创 GNU GDB Debugger Command Cheat Sheet

 GNU GDB Debugger Command Cheat Sheethttp://super-jiju.spaces.live.com/blog/cns!806C498DDEE76B61!565.entryGDB Command Line Arguments: Starting GDB:

2009-05-17 19:00:00 3039

原创 linux 下配置samba服务器参数详解

http://super-jiju.spaces.live.com/blog/cns!806C498DDEE76B61!568.entrylinux 下配置samba服务器参数详解FC8:为了能够让windows下的用户通过以太网访问Linux下的共享文件,需要开启Samba服务器,Samba服务器详细配置步骤如下:  1.打开samba的配置文件  vim /etc/samba/smb.

2009-05-17 18:59:00 2821

原创 AOL Seach query database

 AOL Seach query databasehttp://super-jiju.spaces.live.com/blog/cns!806C498DDEE76B61!570.entry500k User Session Collection----------------------------------------------This collection is distrib

2009-05-17 18:57:00 3193

原创 Summarizing about:String to Int, int To string

Summarizing about:String to Int, int To string 经常在c++里面用到int 和string之间的互相转换问题,方法有很多,这里做一个汇总;1.integer = atoi( my_string.c_str() );2.#include #include //用这个类;int main(){ using namespace st

2008-12-11 22:20:00 2675

原创 Linux远程登录XP系统

Linux远程登录XP系统Linux远程登录XP系统 1.首先要保证你在xp下可以登录目标xp系统;2.下载 rdesktop    rdesktop-1.5.0.tar.gz    http://www.filewatcher.com/m/rdesktop-1.5.0.tar.gz.245137.0.0.html3.安装: tar -zxvf rdesktop-1.5.0.tar.gzc

2008-12-04 14:45:00 3019

原创 利用C语言获取网页源代码

December 02利用C语言获取网页源代码 #include #include #include #pragma comment(lib, "ws2_32.lib") void geturl(char *url) { WSADATA WSAData={0}; SOCKET sockfd; struct sockaddr_in addr; struct hostent *pURL; cha

2008-12-02 10:58:00 10247 2

原创 Browse the Index

November 24Browse the Index 参考文档:http://lemur.wiki.sourceforge.net/Example+Applications+in+CPlusPlushttp://www.lemurproject.org/doxygen/lemur/html/classlemur_1_1api_1_1Index.html随便写一个测试程序:#include#inc

2008-11-24 18:25:00 1297

原创 Lemur的安装于初步使用

November 23Lemur的安装于初步使用 参考文档:Installing and Running Lemur(Version 4.7) 偶要补充几句:1.windows环境下,安装之后,在编译程序的时候呢,会有很多的link errors,在网上找了些相关的文档看,原因是安装版本中自带的lemur.lib是release模式下的,有2中选择,你编写的程序compile mode为r

2008-11-23 16:19:00 3645 1

原创 IR with Lemur,Step by step

IR with Lemur,Step by stepLemur真是个好东西。可以在我前面的blog里面看到它的基本介绍;作为一个新手,偶会一步一步的在此记录自己的Lemur的学习历程,一方面作为自己的知识索引,另一方面也可以作为Lemur爱好者的参考。Lemur的官方网址:Lemur Project里面的资料很多,但是感觉不是很系统化,有时候经常会为一个函数或者实现一个功能而束手无策;看来偶很有必

2008-11-22 14:41:00 1050

原创 Html to Txt in C++

  October 21Html to Txt in C++convert html to txthtml parserC++;本程序可以用来处理spider爬下来的网页,提取其文本,去除html的tag;本程序用于批量转换某个文件夹下面所有的html文件; 程序总共分为2部分,一部分是列出该文件夹下所有的文件(用C++遍历一个文件夹下面所有的文件 Zz

2008-11-05 16:04:00 2173

原创 有网盘啦,重新发自己写的Sudoku

 October 16有网盘啦,重新发自己写的Sudoku 比起目前网上的很多Sudoku还是有不少亮点的;呵呵 点击下载吧

2008-10-21 20:24:00 637

原创 用C++遍历一个文件夹下面所有的文件

 October 15用C++遍历一个文件夹下面所有的文件 Zz对指定的文件夹,遍历其内部所有的文件; 比较简单的办法就是在main()里面system("dir c://WT2G// /B >filelist.txt");  下面这种方法也不错,需要在VC7.1及其以后编译;   // findinfile.cpp : Defines the en

2008-10-21 20:23:00 5160 1

原创 C/C++ 语言中结构体的内存分配

 曾经贴过关于位域的相关文档,再以一个小例题补充之; 当未用 #pragma 指令指定编译器的对齐位数时,结构体按最长宽度的数据成员的宽度对齐;当使用了 #pragma 指令指定编译器的对齐位数时,结构体按最长宽度的数据成员的宽度和 #pragma 指令指定的位数中的较小值对齐。   #pragma 指令格式如下所示:  #pragma pack(4)     // 或者 #pragm

2008-10-21 20:22:00 650

转载 如何做好一个垂直搜索引擎 zZ

 先引用几句话: 1.“确解用户之意,切返用户之需。” 2.“门户网站都想着是怎样省钱,而不是怎样花钱来买技术。” 3.“搜索引擎不是人人都能做的领域,进入的门槛比较高。” 4.“只是优秀还不够,最好的方式是将一件事情做到极致。”(google十大真理) 5.“做搜索引擎需要专注” “对于一项排到第四的业务,门户很难做到专注。” 6.“用户无法描述道他要找什么,除非让他

2008-10-21 20:20:00 1024

转载 国内搜索引擎技术现状 zZ

 当你登录某一个网站,在互联网上搜索各个网站的某一类内容,比如,输入“WTO”,希望得到最新、最全面的信息,你能等待多长时间? 几年前,人们希望十几秒,最多30秒钟就能得到结果,而现在的期望值是1~2秒,也就是说,伴随点击鼠标的“咔哒”一声,显示屏的页面已经变了,排在最前面的十几、二十条信息的标题已经出现在你的面前。 哪个网站的搜索速度明显地变快了,那它一定是使用了先进的搜索引

2008-10-21 20:19:00 1239

原创 Random Number Generation and Single-Server Simulation

 排队,随机,模拟;Note that the theoretical answer for the mean queue length seen by an arriving customerin this system is given by h/(a–h) where h is the mean service time of a customer, and a is the mea

2008-10-21 20:18:00 682

原创 Kruskal算法C++

 #include using namespace std;const int n=6; //图的顶点数 const int e=10; //图的边数 n-1=typedef int adjmatrix[n][n]; typedef struct{ //生成树的边结点 int fromvex,endvex; //边的起点与终点 int weight; //边

2008-10-21 20:17:00 2487

原创 Radix Sort 基数排序

1.基本思想 实现排序主要是通过关键字间的比较和移动记录这两种操作,而实现基数排序不需要进行记录关键字间的比较,它是一种利用多关键字排序的思想,即借助"分配"和"收集"两种操作对单逻辑关键字进行排序的方法。 基数排序的方法是:一个逻辑关键字可以看成由若干个关键字复合而成的,可把每个排序关键字看成是一个d元组: 例如,如果关键字是数值,且其值在0~99范围内,则可把每一个十进制数

2008-10-21 20:14:00 778

转载 Talking about 正则表达式30分钟入门教程

 正则表达式30分钟入门教程目录 本文目标 如何使用本教程 正则表达式到底是什么东西? 入门 测试正则表达式 元字符 字符转义 重复 字符类 分枝条件 反义 分组 后向引用 零宽断言 负向零宽断言 注释 贪婪与懒惰 处理选项 平衡组/递归匹配 还有些什么东西没提到 联系作者 最后,来点广告...

2008-10-21 20:11:00 526

原创 Vector Iterator

在csdn看见一个帖子说:   int main(){ int a[]={1,5,4,7,8}; vector x(a,a+5); int x22=0; for(vector ::iterator y=x.end()-1;y>=x.begin();y--) cout system("pa

2008-08-25 17:14:00 546

原创 Stay Hungry. Stay Foolish

  史蒂夫 乔布斯(Steve Paul Jobs)苹果电脑公司和皮克斯动画公司(Pixar)首席执行官。以下是Steve Jobs在2005年6月12日斯坦福大学毕业典礼上的演讲。 "Stay Hungry, Stay Foolish."求知若饥,虚心若愚 Thank you. Im honored to be with you today for your co

2008-06-20 22:53:00 888

原创 打表法解 1012 -- Joseph

Joseph Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 16411 Accepted: 6092 Description The Josephs problem is notoriously known. For those who are not familiar with the origin

2008-05-05 15:52:00 764

原创 MSRA相关考题

MSRA相关考题 在网上找到了MSRA相关考题,大多是没有答案的,偶给整理一下,给出偶的答案,要是有错误,希望与我交流。 1.打印"Welcome MSR Asia" #include #include char * GetName (void) { //To return "MSR Asia" String char name[]="MSR Asia";

2008-04-28 19:53:00 1146

原创 分享智商小游戏----Sudoku

谁玩sudoku(数独)游戏呢?偶写了一个里面可以很好的进行解题帮助有不同的游戏难度可以定义数独题目进行求解有积分和等级功能 需要的留下邮箱,偶发给你 或者mail to:[email protected]如果发现bug,请与我联系 http://disk.52yy.net/ContentPane.aspx?down=ok&filepath=Jiju%2fSuperSudoku_Public.rar

2008-04-21 14:13:00 822 3

原创 分享智商小游戏----Sudoku

谁玩sudoku(数独)游戏呢?偶写了一个里面可以很好的进行解题帮助有不同的游戏难度可以定义数独题目进行求解有积分和等级功能 需要的留下邮箱,偶发给你 或者mail to:[email protected]如果发现bug,请与我联系

2008-04-20 14:55:00 1163 4

原创 二叉搜索树C++实现

这个数据结构思想很易懂,对任意数据放入ADT中,如果比某个节点的值大,则向右面递归放入,反之~本来没打算写这个程序,但是在看书的时候,感觉书上有的地方好像有问题来才发现,我是彻彻底底地错了~!纸上得来终觉浅,绝知此事要躬行!实现程序如下: #include using namespace

2008-04-14 22:31:00 749 1

原创 THE DRUNK JAILER POJ1218

Description A certain prison contains a long hall of n cells, each right next to each other. Each cell has a prisoner in it, and each cell is locked. One night, the jailer gets bored and decides to pl

2008-04-14 00:19:00 1064

query Segmentation

query Segmentation based on eigenspace similarity Demo.

2009-08-01

数独 sudoku

添加了不少功能,比如积分,自定义游戏啊等等

2008-04-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除