自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

zjjhit的专栏

Nlp、数据挖掘

  • 博客(12)
  • 资源 (3)
  • 收藏
  • 关注

转载 NUMPY-精华讲义

转载自:http://reverland.org/python/2012/08/22/numpy目录toc {: toc }先决条件在阅读这个教程之前,你多少需要知道点python。如果你想重新回忆下,请看看Python Tutorial.如果你想要运行教程中的示例,你至少需要在你的电脑上安装了以下一些软件:Python NumPy这些是可能对你有帮助的:ipytho...

2019-08-22 19:21:33 194

转载 【NLP】【深度学习】-Word2Vec(经典解释)

转载自:http://blog.csdn.net/itplus/article/details/37999613

2019-06-26 20:18:33 129

转载 【深度学习】--基础(Softmax理解)

原文转载自:https://www.jianshu.com/p/ffa51250ba2e这几天学习了一下softmax激活函数,以及它的梯度求导过程,整理一下便于分享和交流!softmax函数softmax用于多分类过程中,它将多个神经元的输出,映射到(0,1)区间内,可以看成概率来理解,从而来进行多分类!假设我们有一个数组,V,Vi表示V中的第i个元素,那么这个元素的softma...

2019-06-26 11:33:37 2745

转载 SVN 使用小计

来源:http://blog.csdn.net/wwwsq/article/details/48241369开发相关1.        每天至少获取一次所有相关代码,以降低代码冲突的概率。2.        本地自动生成的文件不要提交到svn去。svn有个ignore的功能可以屏蔽特定文件。3.        多提交,每次提交的时候内容少一点。4.        不要提交不

2015-09-06 11:56:54 343

转载 Nginx搭建———LNMP环境搭建篇

1.Nginx配置文件测试root@kallen:/usr/local/nginx/sbin# nginx -t nginx: the configuration file /etc/nginx/nginx.conf syntax is ok nginx: configuration file /etc/nginx/nginx.conf test is successful1232

2015-06-30 11:04:48 516

转载 分布式爬虫入门

来源:http://www.cnblogs.com/yueyue_jwfm/archive/2010/04/11/1709821.html一、 研究所属范围分布式网络爬虫包含多个爬虫,每个爬虫需要完成的任务和单个的爬行器类似,它们从互联网上下载网页,并把网页保存在本地的磁盘,从中抽取URL并沿着这些URL的指向继续爬行。由于并行爬行器需要分割下载任务,可能爬虫会将自己抽取的URL发送给

2015-06-25 11:09:03 785 1

转载 软件架构之-架构视图

转载:http://blog.csdn.net/dreambeibei/article/details/9387989软件架构设计运用RUP4+1视图方法进行设计。4+1架构视图模型是1995年Philippe kruchen在《IEEE software》上发表的题为《The 4+1 View Model of Architecture》文。主要包括的架构视图如下:

2015-06-17 20:11:39 627

转载 软件架构之 - Tier和Layer

来源:http://blog.csdn.net/dinglang_2009/article/details/38636151在实际开发工作中,我们经常听到“架构设计”和“架构师”这样的名词,它并不新鲜和神秘,但是却很少有人对“架构”有全面的了解和认识,更谈不上掌握了。事实上,也只有极少数人能成为或者被冠以“架构师”这样的title。为此,笔者总结了实践中对架构的一些理解,希望能够补充很

2015-06-17 20:04:39 1499

转载 Redis 起步

来源:http://www.cnblogs.com/shanyou/archive/2012/01/28/2330451.htmlRedis 起步Rdis和JQuery一样是纯粹为应用而产生的,这里记录的是在CentOS 5.7上学习入门文章:1.Redis简介 Redis是一个key-value存储系统。和Memcached类似,但是解决了断电后数据完全丢

2015-06-08 18:31:35 388

转载 常见面试排序算法总结

选择排序 |____简单选择排序 |____堆排序 |____归并排序* 交换排序 |____冒泡排序 |____快速排序* 插入排序 |____直接插入排序 |____折半排序 |____希尔排序* 分配排序 |____箱排序 |____基数排序============================================================

2015-05-26 19:12:45 657 1

转载 SVD浅析

本文来源:http://blog.csdn.net/abcjennifer/article/details/8131087在自然语言处理中,最常见的两类的分类问题分别是,将文本按主题归类(比如将所有介绍亚运会的新闻归到体育类)和将词汇表中的字词按意思归类(比如将各种体育运动的名称个归成一类)。这两种分类问题都可用通过矩阵运算来圆满地、同时解决。为了说明如何用矩阵这个工具类解决这两个问题

2015-05-23 23:13:23 434

原创 下定决心:算法+机器学习+专业背景

拜读了李航博士的统计机器学习,受益颇多,向搞自言语言处理的同仁们强烈推荐这本书!

2012-05-08 23:17:06 264

中文信息检索系统的模糊匹配算法研究和实现

介绍了中文字符串模糊匹配的方法 值得一看

2013-11-07

欧洲的ACL论文

最新的ACL论文,详细阐述了目前自然语言处理领域的最新研究动态、

2012-07-06

基于最大熵模型的分词技术研究

挺好的,基于最大熵模型的分词技术研究基于最大熵模型的分词技术研究

2011-12-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除