自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 资源 (12)
  • 收藏
  • 关注

转载 位图索引的一个应用实例

bitmap 是索引最长常见的一种实现方式。就是bit位的每一位,来作为表示要索引的对象。通常位图索引通常表达取值维度取值较少的数据.,最好是布尔值 比如        男1       婚否0       是否有房0       是否

2015-12-06 10:19:12 776

原创 位图的索引的一个应用

     bitmap 是索引最长常见的一种实现方式。就是bit位的每一位,来作为表示要索引的对象。通常位图索引通常表达取值维度取值较少的数据.,最好是布尔值 比如                男1       婚否0       是否有房0       是否有车0 ...

2015-12-06 01:14:05 166

原创 美食和美景一样需要偶遇

今天天气难得的好,从戒台寺回来,到鼓楼中绦胡同,找一家小小的炙子烤肉吃,但是那家居然关门大吉了。当时颇感饥饿。就在附近游荡找什么吃的没有。发现一家一家刷肉管,人挺多的。大众点评了一下,居然是超火的馆子。门帘不大,应该家庭经营。涮肉是可以,起码不亚于东来顺,这家主打似乎是清汤羊蝎子,不过还是选择涮肉。肉是不错的,小料不能自己调,味道还行,比较好的能吃到,很多老北京的吃食,而且是很搭涮肉,比如松肉,麻

2014-10-28 11:24:07 985

原创 将博客搬至CSDN

将博客搬至CSDN》

2014-10-28 11:24:04 282

原创 也说原生广告(一)

所谓原生广告就是相对普通的的广告而言广告而言的,比如下图这种啊,就是红果果的硬广告的。除了网页,在手机aap和看视频的时候都会遇到的各种广告(优酷那个倒计时伤不起的,你看人家youtube不是会员都能跳过去)。                                                  搜索广告                 

2014-10-28 11:24:01 1041

原创 被折腾家乡

这次回家,记忆中开封已经被折腾不像样,鼓楼广场在重建的鼓楼,纯粹的钢筋混凝土建筑,没有一点古代砖木建筑的味道。据父母讲,也没有记忆中的老鼓楼好看。鼓楼广场 本来就狭小,重建鼓楼了,夜市怎么办,没有人民大楼大的四面钟下夜市。还叫开封么 ?书店街门口那个饺子馆拆掉了,还有那个卖书画,好歹是木质阁楼,我小时候就一直在。真不到为为什么拆掉,搞了个水泥的,拆掉古建筑建仿古。

2014-10-28 11:23:58 309

转载 Mallet之源文件结构

原文地址:Mallet之源文件结构作者:hzbachMallet源文件中重要的子目录:classify:监督式的分类算法types:重要的数据结构类型,像Instance实例,FeatureVector特征向量pipe:特征选择,变换实例每个分类方法用两个类实现:trainer和classifiertrainer把训练数据做为输入,创建classifier做为输出。每一个traine

2014-10-28 11:23:56 511 1

原创 java调用libsvm

最近要做文本分类的实现,大概搜了一下发现。java 调用的文章比较少,参考下 libsvm文件夹下面的几个类。随便写一下。首先把libsvm .jar 加入环境变量和把几个类考到src下面 svm_train 和 Svm_predict 的main()函数改下名字。就可以调用他们呢train,preModel下面是具体代码 public class TestLibsSvm {publi

2014-10-28 11:23:53 537

原创 2011年06月20日

转载我的javaeye久链接: http://kobe00712.iteye.com/blog/1088455tfidf 做自然语言理解的经常用。文档的作为权重计算,许多初学者搞不清楚,权重计算特征选择。针对文本分类而言 作为很简单的说明,特征选择都跟 类别有关比如 卡方 信息增益而权重计算则与类别无关 比如 tfidf,tf具体公式请参看 http://zh.wikipedia.org

2014-10-28 11:23:50 286

原创 java实现 tfidf

转载我的javaeye久链接: http://kobe00712.iteye.com/blog/1088455tfidf 做自然语言理解的经常用。文档的作为权重计算,许多初学者搞不清楚,权重计算特征选择。针对文本分类而言 作为很简单的说明,特征选择都跟 类别有关比如 卡方 信息增益而权重计算则与类别无关 比如 tfidf,tf具体公式请参看 http://zh.wikipedia.org

2014-10-28 11:23:48 390

原创 用监听器listener获得工程的跟路径

工程中很多时候都会用到根路径,特别很多人一起写项目的时候,每个人获得根路径的方法不一样,为了统一方便的获得根路径,不知道大家是怎样做的呢,我在写项目的时候就用listener初始化一个根路径的变量,也不知道这种方法怎样,给大家参考下!监听器 :在web.xml中配置          org.springframework.web.context.ContextLoaderL

2014-10-28 11:23:45 2108

原创 如何在Struts2中实现系统的初始化…

通常web系统在启动时需要做一些初始化的工作,比如初始化系统全局变量,加载自定义配置文件,启动定时任务等。  在Struts中实现系统的初始化工作在Struts中,我们可以写一个Servlet让它继承于ActionServlet并覆盖其init()方法,然后修改web.xml文件的Struts启动相关配置来达到目的。  Java代码 package fangwei.servle

2014-10-28 11:23:43 366

转载 雅克比(Jacobian)矩阵

原文地址:雅克比(Jacobian)矩阵作者:彭乾坤 雅可比矩阵 在向量微积分中,雅可比矩阵是一阶偏导数以一定方式排列成的矩阵,其行列式称为雅可比行列式。还有,在代数几何中,代数曲线的雅可比量表示雅可比簇:伴随该曲线的一个群簇,曲线可以嵌入其中。它们全部都以数学家卡尔·雅可比命名;英文雅可比量"Jacobian"可以发音为[ja?ko bi ?n]或者[?? ?ko bi

2014-10-28 11:23:40 2882 1

原创 nutch elipse 配置的一些事项

再往网上follow很多教程老是出错,终于发现。 Add Class Folder和Add project 'conf' to build path,设置一个 ,设置了一个就不能再设另一个。反正意思吧conf 加到 path里如果按照网上的教程修改了TestRTFParser.java和RTFParseFactory.javautil 包 DomainStatistics。java和i

2014-10-28 11:23:37 267

原创 java正则表达式入门文档

引言   正则表达式(regularexpression)描述了一种字符串匹配的模式,可以用来:(1)检查一个串中是否含有符合某个规则的子串,并且可以得到这个子串;(2)根据匹配规则对字符串进行灵活的替换操作。   正则表达式学习起来其实是很简单的,不多的几个较为抽象的概念也很容易理解。之所以很多人感觉正则表达式比较复杂,一方面是因为大多数的文档没有做到由浅入深地讲解,概念上没有注意先后

2014-10-28 11:23:35 320

原创 多项分布 多项式分布

摘要纠错编辑摘要二项分布的典型例子是扔硬币,硬币正面朝上概率为p,重复扔n次硬币,k次为正面的概率即为一个二项分布概率。(严格定义见伯努利实验定义)  把二项分布公式再推广,就得到了多项分布。比如扔骰子,不同于扔硬币,骰子有6个面对应6个不同的点数,这样单次每个点数朝上的概率都是1/6(对应p1~p6,它们的值不一定都是1/6,只要和为1且互斥即可,比如一个形状不规则的骰子),重复扔n

2014-10-28 11:23:32 700

原创 LDA导读

[论文导读][教程][介绍]文本处理、图像标注中的一篇重要论文Latent Dirichlet Allocation原文信息Latent Dirichlet AllocationDavid.M.BleiAndrew.Y.NgMichael.I.JordanJMLR2003(可google到)原文的主要内容有两种方法设计分类器:1. discriminative

2014-10-28 11:23:29 498

转载 Pipe类与Instance类介绍

原文地址:Pipe类与Instance类介绍作者:章芝青抽象类pipe,是所有pipe类的父类,这些类的作用就是将数据从一种形式转成另一种形式。在特征提取阶段,pipe类是最常用的。pipe类操纵Instance类,Instance类是描述数据的类,也是十分重要的一个类。 每一个Instance包括四个预定义的域,分别是:"data","target", "name", 和"sour

2014-10-28 11:23:27 530

转载 mallet之命令行工具

谢谢 分享能不能在详细点原文地址:mallet之命令行工具作者:章芝青mallet在目录/bin下面提供的是shellscripts,本文介绍的是在MyEclipse中使用命令行工具运行分类程序。 一、运行类Text2Vectors在run的Arguments中的Program arguments中写入--inpute:/mallet/20_newsgroups/talk.politic

2014-10-28 11:23:24 898

原创 欢迎您在新浪博客安家

亲爱的朋友:    欢迎您在新浪博客安家,您的博客地址是:http://blog.sina.com.cn/u/1306847877    您可以用文字、图片、视频记录和展示最真实的自我,与网友交流,与线上好友聊天,还能通过手机发表博文和上传图片,随时随地记录心情和身边趣闻。    我们为您提供了丰富的炫酷模板来装点您在网上的家园,强大的音乐播放功能更能陪伴您的网络生活。准备好了吗?现在就开始精彩的

2014-10-28 11:23:22 262

httpCLient 4.2 实现basic认证

httclient的实现basic认证的方式,和以前的版本不同。形式如下public static String setSetting1() throws ClientProtocolException, IOException, URISyntaxException { DefaultHttpClient client = new DefaultHttpClient(); ...

2012-09-29 17:40:38 191

libsvm java 简单调用,

 1,最近做文本分类的实验。关于这方面代码实现的文章还是比较少的。针对任何的东西动手,写第一个程序蛮重要的。但是 很多看点参考的东西还是蛮有帮助,但是最终还是有自己读文档。随便写一下自我娱乐,牛人绕道 晚上大概看了libsvm的几个类,svm_predict.java,svm_train.java 这个两个类的主函数 改个名字就可以向主函数名字 ,就可以像在windows 里一样调用它们pub...

2011-06-20 17:15:17 164

java 实现tfidf

tfidf 做自然语言理解的经常用。文档的作为权重计算, 许多初学者搞不清楚,权重计算特征选择。 针对文本分类而言 作为很简单的说明,特征选择都跟 类别有关比如 卡方 信息增益 而权重计算则与类别无关 比如 tfidf,tf 具体公式请参看 http://zh.wikipedia.org/wiki/TF-IDF 下面代码 写的比较粗陋。高手请避开。,,,,, 训练集可以上搜狗数据集上下载 写完以后...

2011-06-14 20:38:29 182

原创 uplaodify动态修改上传路径

其实很简单,就是动态修改参数。第一次写东西,还是晒一下[code="java"] 开始上传 | 清除队列 [/code]下面是js[code="java"]$(document).ready(function() { var loadpath=...

2011-01-16 17:07:15 131

java 实现的tfidf

自己实现的tfidf 自娱自乐,高手请闪开。谢谢

2011-06-14

luke工具 索引查看的工具

lucene 索引查看的工具,研究搜索引擎 必须的工具

2011-06-13

java 元搜索 调用百度 doc 文件示例

利用元搜索下在百度 doc 文件。示例 利用httpclient 模拟像百度发请求

2011-05-30

ik 分词3.2 支持lucene 3.0以上

ik 分词支持lucene3.0以上,只有ik支持paoding要check out

2010-12-03

数据挖掘工具和行业应用

数据挖掘入门读物,数据挖掘工具和行业应用

2010-12-03

spring任务调度(Quartz )

spring任务调度(Quartz )非常基础,

2010-09-13

hibernate3.2中文文档 pdf

hibernate 3.2 中文 pdf 格式。

2010-07-07

贝叶斯线性回归介绍 高斯回归基础

贝叶斯线性回归,高斯过程回归的基础研究gpr 的人 共勉

2010-06-04

SVM入门,机器学习经典

svm 入门 机器学习中方的经典文章,浅析移动

2010-06-04

google,lucene分词包

google ,lucene分词应该是最好的分词工具

2010-03-29

超级巡警U盘专杀

如果你U盘,双击后出现.请选择打开程序,肯定是中了病毒<br>就用它把

2007-07-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除