自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (2)
  • 收藏
  • 关注

原创 非主流自然语言处理——遗忘算法系列(六):语义模型

【前言】1、语义体系的建立对人工智能的意义,相信不用多说。2、公开此文的目的,是因为此文所设计的语义模型包含的待解决任务量很大,寻求同好共同讨论交流。3、版权说明   3.1、本文的版权归作者所有。   3.2、本文中所提及的问题的解决方案,归研究者所有。【正文】==============================【原理】词的语义可以通过与其相关联的词表征【定义】词的语义:用该词的词翼及其...

2018-04-11 12:53:06 1455 1

原创 非主流自然语言处理——遗忘算法系列(五):文本相似度

前文介绍了词权重的计算方法,本篇介绍词权重的另一种应用:文本相似度计算。

2015-12-07 09:38:12 3672 1

原创 非主流自然语言处理——遗忘算法系列(四):关键词提取

前文介绍了利用词库进行分词,本文介绍词库的另一个应用:词权重计算。

2015-11-30 10:17:12 4365

原创 非主流自然语言处理——遗忘算法系列(三):分词

前面介绍了词库的自动生成的方法,本文介绍如何利用前文所生成的词库进行分词。

2015-11-28 17:40:21 3781 2

原创 非主流自然语言处理——遗忘算法系列(二):大规模语料词库生成

一、前言  写这篇文时,突然想到一个问题,大家的词库都是从哪来的?  之所以会这么有些意外的问,是因为从没把词库当成个事儿:平时处理微博,就用程序跑一下微博语料获得微博词库;处理新闻,程序跑一下新闻语料获得新闻词库。甚至没有把跑出来的词库存下来的习惯,谁知道过两天是不是又出什么新词,与其用可能过时的,不如随手生成个新鲜出炉的。  好吧,我承认我这是在显摆。如果你也想和我一样,想要随用随丢,任性它一把,那随我来。

2015-11-23 22:06:18 6763 5

原创 非主流自然语言处理——遗忘算法系列(一):算法概述

一、前言   这里“遗忘”不是笔误,这个系列要讲的“遗忘算法”,是以牛顿冷却公式模拟遗忘为基础、用于自然语言处理(NLP)的一类方法的统称,而不是大名鼎鼎的“遗传算法”!  在“遗忘”这条非主流自然语言处理路上,不知不觉已经摸索了三年有余,遗忘算法也算略成体系,虽然仍觉时机未到,还是决定先停一下,将脑中所积梳理成文,交由NLP的同好们点评交流。  曾与前总编刘江有过一面之缘,竟能围绕遗忘这个算法相谈甚欢,回想起来极是难得,本系列文章、基础算法源码、演示程序都将在CSDN首发,算

2015-11-23 11:31:52 7917 2

遗忘算法(新闻相似度)演示程序.rar

遗忘算法演示程序及源码,功能包括词库生成、分词、词权重计算。是CSDN博文《非主流自然语言处理——遗忘算法系列》的配套资源。作者老憨欢迎交流讨论。

2015-12-07

遗忘算法(词库生成、分词、词权重)演示程序.rar

遗忘算法演示程序及源码,功能包括词库生成、分词、词权重计算。是CSDN博文《非主流自然语言处理——遗忘算法系列》的配套资源。作者老憨欢迎交流讨论。

2015-11-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除