自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(482)
  • 资源 (7)
  • 收藏
  • 关注

转载 logrotate机制和原理

原文地址:http://www.lightxue.com/how-logrotate-works日志实在是太有用了,它记录了程序运行时各种信息。通过日志可以分析用户行为,记录运行轨迹,查找程序问题。可惜磁盘的空间是有限的,就像飞机里的黑匣子,记录的信息再重要也只能记录最后一段时间发生的事。为了节省空间和整理方便,日志文件经常需要按时间或大小等维度分成多份,删除时间久远的日志文件。这就是通常

2017-08-15 13:07:20 1918

转载 IO负载高的来源定位

原文地址:http://www.cnblogs.com/cenalulu/archive/2013/04/12/3016714.html前言:在一般运维工作中经常会遇到这么一个场景,服务器的IO负载很高(iostat中的util),但是无法快速的定位到IO负载的来源进程和来源文件导致无法进行相应的策略来解决问题。这个现象在MySQL上更为常见,在5.6(performa

2016-05-26 09:14:28 1197

转载 pdflush进程详解

原文地址:http://blog.chinaunix.net/uid-9543173-id-3568408.html一、简介     由于页高速缓存的缓存作用,写操作实际上会被延迟。当页高速缓存中的数据比后台存储的数据更新时,那么该数据就被称做脏数据。在内存中累积起来的脏页最终必须被写回磁盘。在以下两种情况发生时,脏页被写回磁盘:1、当空闲内存低于一个特定的阈值时,内核必须

2015-11-23 19:27:01 949

转载 详解coredump

原文地址:http://blog.csdn.net/tenfyguo/article/details/8159176一,什么是coredump        我们经常听到大家说到程序core掉了,需要定位解决,这里说的大部分是指对应程序由于各种异常或者bug导致在运行过程中异常退出或者中止,并且在满足一定条件下(这里为什么说需要满足一定的条件呢?下面会分析)会产生一个叫

2015-11-23 16:26:39 825

转载 linux之fstab文件详解

原文地址:http://blog.csdn.net/richerg85/article/details/17917129/etc/fstab是用来存放文件系统的静态信息的文件。位于/etc/目录下,可以用命令less /etc/fstab 来查看,如果要修改的话,则用命令 vi /etc/fstab 来修改。       当系统启动的时候,系统会自动地从这个文件读取信息,并

2015-11-16 11:26:51 765

转载 Linux SendMail总结

原文地址:http://20101218.blog.51cto.com/283611/701794  Internet上最基本的服务,现在应该大部分人都有自己的邮箱吧,用的人多,但理解的人估计没多少,我自己以前也是常常用,但对其原理并不操心。今天就来操心下,进行个小总结   一.邮件服务的基本流程    邮件服务器构成了电子邮件系统的核心。每个收信人都有一个位于

2015-10-13 10:24:23 4778

转载 配置vim Python IDE 开发环境

原文地址:http://blog.chinaunix.net/uid-25719044-id-3026457.html在 Linux 下对 vim 进行一些配置,使之支持如下特性:1. 加强的 Python 语法高亮显示;2. 对脚本、项目生成 ctag 序列;3. 在 vim 中显示 ctag 序列列表;4. Python 函数、类的自动补全;

2015-09-20 16:48:24 892

转载 nohup命令

原文地址:nohup用途:LINUX命令用法,不挂断地运行命令。   语法:nohup Command [ Arg ... ] [ & ]   描述:nohup 命令运行由 Command 参数和任何相关的 Arg 参数指定的命令,忽略所有挂断(SIGHUP)信号。在注销后使用 nohup 命令运行后台中的程序。要运行后台中的 n

2015-09-18 09:08:50 637

转载 vim的taglist插件的使用和配置

原文地址:http://blog.csdn.net/jk110333/article/details/8638020今天看代码突然想起来以前使用的taglist插件,而我这个虚拟机又没装,所以干脆装上好了!也花不了多少时间!这个插件大部分的linux代码老鸟都会装,也都用过,所以请老鸟绕道!1、介绍taglist是基于ctags的一个vim插件,使用它可以很

2015-09-08 20:02:59 530

转载 linux下svn 增加 ignore 属性(忽略文件的处理)

原文地址:http://www.gowhich.com/blog/545一直不知道svn的忽略命令如何使用,经过google的查找,使用方法还是有的,做个记录好了。如果想在SVN提交时,忽略某个文件,也就是某个文件不提交,可以使用svn propedit svn:ignore命令。下面详细介绍一下使用步骤。单纯的看svn官方文档和一些网上搜索的资

2015-08-13 11:54:48 3596

转载 欢迎使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2015-07-24 08:50:13 595

转载 ZooKeeper原理及使用

原文地址:http://www.wuzesheng.com/?p=2609ZooKeeper是Hadoop Ecosystem中非常重要的组件,它的主要功能是为分布式系统提供一致性协调(Coordination)服务,与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper,第一部分介绍ZooKeeper的基本原理,第二部分介绍ZooKe

2015-07-22 17:20:47 507

转载 在iTerm2中使用Zmodem的方法

原文地址:http://openexz.sinaapp.com/2012/08/29/%E5%9C%A8iterm2%E4%B8%AD%E4%BD%BF%E7%94%A8zmodem%E7%9A%84%E6%96%B9%E6%B3%95/iTerm通过trigger的方式可以使用sz、rz命令方便的通过Terminal在远程主机文件传输。设置方法首先需要安装

2015-07-10 20:16:47 4805

转载 在 Mac OS X 终端里使用 Solarized 配色方案

原文地址:http://www.vpsee.com/2013/09/use-the-solarized-color-theme-on-mac-os-x-terminal/相信长期浸泡在终端和代码的小伙伴们都有一套自己喜爱的配色方案。以前一直在用简单、适合阅读的 Terminal.app 配色方案,换到 MacBook Pro with Retina display 后发现这

2015-07-10 19:57:31 2494

转载 ssh 免密码登录

原文地址:http://chenlb.iteye.com/blog/211809ssh 无密码登录要使用公钥与私钥。linux下可以用用ssh-keygen生成公钥/私钥对,下面我以CentOS为例。有机器A(192.168.1.155),B(192.168.1.181)。现想A通过ssh免密码登录到B。1.在A机下生成公钥/私钥对。[chenlb@A 

2015-05-13 13:50:40 461

转载 Boost 库 Enable_shared_from_this 实现原理分析

原文地址:http://www.cnblogs.com/lzjsky/archive/2011/05/05/2037363.html使用情景:当类对象被 shared_ptr 管理时,需要在类自己定义的函数里把当前类对象作为参数传给其他函数时,这时需要传递一个 shared_ptr ,否则就不能保持 shared_ptr 管理这个类对象的语义(因为有一个 raw point

2015-04-04 10:24:20 513

转载 Linux 中的计时

原文地址:http://www.ibm.com/developerworks/cn/linux/l-time/实际上,可能还会有其它一些方法可以完成本文讨论的任务。我仅讨论了我所使用的方法,这并不意味着除此之外的其它方法就很差劲,只不过对我来说这些方法相对简单有效而已。Linux中的时间在Linux系统中,时间扮演着一个非常重要的角色,它几乎无处不在。开机时,会

2014-12-15 11:15:09 609

转载 Set up SSH for Git and Mercurial on Mac OSX/Linux

原文地址:https://confluence.atlassian.com/pages/viewpage.action?pageId=270827678d by manthony, last modified by John Garcia [Atlassian] on Aug 06, 2014Go to start of metadataUp unt

2014-11-19 09:16:19 2970

转载 GDB调试手册

原文地址:http://www.programlife.net/gdb-manual.htmlLinux 包含了一个叫gdb 的GNU 调试程序。gdb 是一个用来调试C和C++程序的强力调试器。它使你能在程序运行时观察程序的内部结构和内存的使用情况。以下是 gdb 所提供的一些功能:它使你能监视你程序中变量的值、它使你能设置断点以使程序在指定的代码行上停止执行、它使你能一行行的执

2014-11-16 13:17:08 679

转载 protobf docs category

2014-11-05 22:45:51 722

转载 Protocol Buffer Basics: C++

Protocol Buffer Basics: C++This tutorial provides a basic C++ programmer's introduction to working with protocol buffers. By walking through creating a simple example application, it shows you h

2014-11-05 22:42:30 920

转载 Style Guide

Style GuideThis document provides a style guide for .proto files. By following these conventions, you'll make your protocol buffer message definitions and their corresponding classes consistent

2014-11-05 22:42:26 532

转载 Encoding

EncodingA Simple MessageBase 128 VarintsMessage StructureMore Value TypesEmbedded MessagesOptional And Repeated ElementsField OrderThis document describes the b

2014-11-05 22:41:57 632

转载 Language Guide

Language GuideDefining A Message TypeScalar Value TypesOptional And Default ValuesEnumerationsUsing Other Message TypesNested TypesUpdating A Message TypeExtensions

2014-11-05 22:40:01 1002

转载 Developer Guide

Developer GuideWelcome to the developer documentation for protocol buffers – a language-neutral, platform-neutral, extensible way of serializing structured data for use in communications protoco

2014-11-05 22:39:25 541

转载 java_generator.h

java_generator.h#include namespace google::protobuf::compiler::javaGenerates Java code for a given .proto file.Classes in this fileJavaGeneratorCodeGenerator im

2014-11-05 22:37:30 600

转载 python_generator.h

python_generator.h#include namespace google::protobuf::compiler::pythonGenerates Python code for a given .proto file.Classes in this fileGeneratorCodeGenerator 

2014-11-05 22:37:14 555

转载 cpp_generator.h

cpp_generator.h#include namespace google::protobuf::compiler::cppGenerates C++ code for a given .proto file.Classes in this fileCppGeneratorCodeGenerator implem

2014-11-05 22:36:22 644

转载 plugin.pb.h

plugin.pb.h#include namespace google::protobuf::compilerAPI for protoc plugins.This file defines a set of protocol message classes which make up the API to protoc code generator plugin

2014-11-05 22:35:59 1607

转载 plugin.h

plugin.h#include namespace google::protobuf::compilerFront-end for protoc code generator plugins written in C++.To implement a protoc plugin in C++, simply write an implementation of C

2014-11-05 22:35:30 968

转载 parser.h

parser.h#include namespace google::protobuf::compilerImplements parsing of .proto files to FileDescriptorProtos.Classes in this fileParserImplements parsing of

2014-11-05 22:35:07 1700

转载 command_line_interface.h

command_line_interface.h#include namespace google::protobuf::compilerImplements the Protocol Compiler front-end such that it may be reused by custom compilers written to support other lang

2014-11-05 22:34:48 1487

转载 importer.h

importer.h#include namespace google::protobuf::compilerThis file is the public interface to the .proto file parser.Classes in this fileSourceTreeDescriptorDatabase

2014-11-05 22:34:38 921

转载 code_generator.h

code_generator.h#include namespace google::protobuf::compilerDefines the abstract interface implemented by each of the language-specific code generators.Classes in this file

2014-11-05 22:33:33 801

转载 zero_copy_stream.h

zero_copy_stream.h#include namespace google::protobuf::ioThis file contains the ZeroCopyInputStream and ZeroCopyOutputStream interfaces, which represent abstract I/O streams to and from

2014-11-04 21:44:02 2044

转载 zero_copy_stream_impl.h

zero_copy_stream_impl.h#include namespace google::protobuf::ioThis file contains common implementations of the interfaces defined in zero_copy_stream.h which are only included in the ful

2014-11-04 21:43:51 1634

转载 tokenizer.h

tokenizer.h#include namespace google::protobuf::ioClass for parsing tokenized text from a ZeroCopyInputStream.Classes in this fileErrorCollectorAbstract interfa

2014-11-04 21:43:28 905

转载 printer.h

printer.h#include namespace google::protobuf::ioUtility class for writing text to a ZeroCopyOutputStream.Classes in this filePrinterThis simple utility class as

2014-11-04 21:42:13 740

转载 gzip_stream.h

gzip_stream.h#include namespace google::protobuf::ioThis file contains the definition for classes GzipInputStream and GzipOutputStream.GzipInputStream decompresses data from an under

2014-11-04 21:41:43 1421

转载 coded_stream.h

coded_stream.h#include namespace google::protobuf::ioThis file contains the CodedInputStream and CodedOutputStream classes, which wrap a ZeroCopyInputStream or ZeroCopyOutputStream, re

2014-11-04 21:41:02 3174

[JavaScript权威指南(第6版)].(JavaScript:The.Definitive.Guide).David.Flanagan.文字版.pdf

关于Javascript很权威的一本书,内含目录书签,共1000多页

2013-11-29

Kinect应用开发实战用最自然的方式与机器对话(带书签)

Kinect开发上最全面的的中文资料,值得一看

2013-09-30

信息检索导论(Christopher D. Manning Prabhakar Raghavan)

信息检索导论(Christopher D. Manning Prabhakar Raghavan等著 王斌 译) 最经典的搜索引擎入门书籍,由浅入深的带领读者进入搜索引擎世界。 目录: 第 1 章 布尔检索...............................................1 1.1 一个信息检索的例子..................................2 1.2 构建倒排索引的初体验..............................5 1.3 布尔查询的处理..........................................8 1.4 扩展的布尔检索模型及有序检索............11 1.5 参考文献及补充读物................................13 第 2 章 词项词典及倒排记录表...................14 2.1 文档分析及编码转换................................14 2.1.1 字符序列的生成............................14 2.1.2 文档单位的选择............................15 2.2 词项集合的确定........................................16 2.2.1 词条化............................................16 2.2.2 去除停用词....................................19 2.2.3 词项归一化....................................20 2.2.4 词干还原和词形归并....................23 2.3 基于跳表的倒排记录表快速合并算法....26 2.4 含位置信息的倒排记录表及短语查询....28 2.4.1 二元词索引....................................28 2.4.2 位置信息索引................................29 2.4.3 混合索引机制................................31 2.5 参考文献及补充读物................................32 第 3 章 词典及容错式检索............................34 3.1 词典搜索的数据结构................................34 3.2 通配符查询...............................................36 3.2.1 一般的通配符查询........................36 3.2.2 支持通配符查询的k-gram索引.....37 3.3 拼写校正...................................................39 3.3.1 拼写校正的实现............................39 3.3.2 拼写校正的方法............................40 3.3.3 编辑距离........................................40 3.3.4 拼写校正中的 k-gram索引............41 3.3.5 上下文敏感的拼写校正................42 3.4 基于发音的校正技术................................43 3.5 参考文献及补充读物................................44 第 4 章 索引构建.............................................46 4.1 硬件基础....................................................46 4.2 基于块的排序索引方法............................47 4.3 内存式单遍扫描索引构建方法................50 4.4 分布式索引构建方法................................51 4.5 动态索引构建方法....................................54 4.6 其他索引类型............................................56 4.7 参考文献及补充读物................................57 第 5 章 索引压缩.............................................59 5.1 信息检索中词项的统计特性....................59 5.1.1 Heaps定律:词项数目的估计......61 5.1.2 Zipf定律:对词项的分布建模.....62 5.2 词典压缩....................................................63 5.2.1 将词典看成单一字符串的 压缩方法........................................63 5.2.2 按块存储........................................64 5.3 倒排记录表的压缩....................................66 5.3.1 可变字节码....................................67 5.3.2 γ 编码.............................................68 5.4 参考文献及补充读物................................74 第 6 章 文档评分、词项权重计算及 向量空间模型....................................76 6.1 参数化索引及域索引................................76 6.1.1 域加权评分....................................78 6.1.2 权重学习........................................79 6.1.3 最优权重g的计算..........................80 6.2 词项频率及权重计算................................81 6.2.1 逆文档频率....................................81 6.2.2 tf-idf权重计算................................82 6.3 向量空间模型............................................83 6.3.1 内积................................................83 6.3.2 查询向量........................................85 6.3.3 向量相似度计算............................87 6.4 其他tf-idf权重计算方法...........................88 6.4.1 tf的亚线性尺度变换方法.............88 6.4.2 基于最大值的tf归一化.................88 6.4.3 文档权重和查询权重机制............89 6.4.4 文档长度的回转归一化................89 6.5 参考文献及补充读物................................92 第 7 章 一个完整搜索系统中的评分 计算......................................................93 7.1 快速评分及排序.......................................93 7.1.1 非精确返回前K篇文档的方法.....94 7.1.2 索引去除技术................................94 7.1.3 胜者表...........................................95 7.1.4 静态得分和排序............................95 7.1.5 影响度排序....................................96 7.1.6 簇剪枝方法....................................97 7.2 信息检索系统的组成................................98 7.2.1 层次型索引....................................98 7.2.2 查询词项的邻近性........................98 7.2.3 查询分析及文档评分函数的 设计...............................................99 7.2.4 搜索系统的组成..........................100 7.3 向量空间评分方法及各种查询操作 符的关联.................................................101 7.3.1 布尔检索......................................101 7.3.2 通配查询......................................102 7.3.3 短语查询......................................102 7.4 参考文献及补充读物..............................102 第 8 章 信息检索的评价..............................103 8.1 信息检索系统的评价..............................103 8.2 标准测试集.............................................104 8.3 无序检索结果集合的评价......................105 8.4 有序检索结果的评价方法......................108 8.5 相关性判定.............................................112 8.6 更广的视角看评价:系统质量及 用户效用.................................................115 8.6.1 系统相关问题..............................115 8.6.2 用户效用......................................115 8.6.3 对已有系统的改进......................116 8.7 结果片段.................................................116 8.8 参考文献及补充读物..............................118 第 9 章 相关反馈及查询扩展.....................120 9.1 相关反馈及伪相关反馈..........................120 9.1.1 Rocchio相关反馈算法.................122 9.1.2 基于概率的相关反馈方法..........125 9.1.3 相关反馈的作用时机..................125 9.1.4 Web上的相关反馈......................126 9.1.5 相关反馈策略的评价..................127 9.1.6 伪相关反馈..................................127 9.1.7 间接相关反馈..............................128 9.1.8 小结..............................................128 9.2 查询重构的全局方法..............................128 9.2.1 查询重构的词汇表工具..............128 9.2.2 查询扩展......................................129 9.2.3 同义词词典的自动构建..............130 9.3 参考文献及补充读物..............................131 第 10 章 相关反馈及查询扩展...................133 10.1 XML的基本概念...................................134 10.2 XML检索中的挑战性问题...................137 10.3 基于向量空间模型的XML检索...........140 10.4 XML检索的评价...................................144 10.5 XML检索:以文本为中心与以数据 为中心的对比.......................................146 10.6 参考文献及补充读物............................148 第 11 章 概率检索模型.................................150 11.1 概率论基础知识....................................150 11.2 概率排序原理........................................151 11.2.1 1/0风险的情况.........................151 11.2.2 基于检索代价的概率排序 原理..........................................152 11.3 二值独立模型........................................152 11.3.1 排序函数的推导......................153 11.3.2 理论上的概率估计方法..........155 11.3.3 实际中的概率估计方法..........156 11.3.4 基于概率的相关反馈方法......157 11.4 概率模型的相关评论及扩展................158 11.4.1 概率模型的评论......................158 11.4.2 词项之间的树型依赖..............159 11.4.3 Okapi BM25: 一个非二值的 模型..........................................160 11.4.4 IR中的贝叶斯网络 方法..........................................161 11.5 参考文献及补充读物............................162 第 12 章 基于语言建模的信息检索 模型..................................................163 12.1 语言模型...............................................163 12.1.1 有穷自动机和语言模型..........163 12.1.2 语言模型的种类......................165 12.1.3 词的多项式分布......................166 12.2 查询似然模型.......................................167 12.2.1 IR中的查询似然模型..............167 12.2.2 查询生成概率的估计..............167 12.2.3 Ponte和Croft进行的实验........169 12.3 语言建模的方法与其他检索方法 的比较...................................................171 12.4 扩展的LM方法......................................172 12.5 参考文献及补充读物............................173 第 13 章 文本分类及朴素贝叶斯方法......175 13.1 文本分类问题.......................................177 13.2 朴素贝叶斯文本分类............................178 13.3 贝努利模型...........................................182 13.4 NB的性质..............................................183 13.5 特征选择...............................................188 13.5.1 互信息.....................................188 13.5.2 2 χ 统计量................................191 13.5.3 基于频率的特征选择方法......192 13.5.4 多类问题的特征选择方法......193 13.5.5 不同特征选择方法的比较......193 13.6 文本分类的评价....................................194 13.7 参考文献及补充读物............................198 第 14 章 基于向量空间模型的文本 分类..................................................200 14.1 文档表示及向量空间中的关联度 计算.......................................................201 14.2 Rocchio分类方法..................................202 14.3 k近邻分类器..........................................205 14.4 线性及非线性分类器............................209 14.5 多类问题的分类....................................212 14.6 偏差—方差折衷准则..............................214 14.7 参考文献及补充读物............................219 第 15 章 支持向量机及文档机器学习 方法..................................................221 15.1 二类线性可分条件下的支持向量机....221 15.2 支持向量机的扩展................................226 15.2.1 软间隔分类..............................226 15.2.2 多类情况下的支持向量机......228 15.2.3 非线性支持向量机..................228 15.2.4 实验结果..................................230 15.3 有关文本文档分类的考虑....................231 15.3.1 分类器类型的选择..................231 15.3.2 分类器效果的提高..................233 15.4 ad hoc检索中的机器学习方法.............236 15.4.1 基于机器学习评分的简单 例子.........................................236 15.4.2 基于机器学习的检索结果 排序.........................................238 15.5 参考文献及补充读物............................239 第 16 章 扁平聚类.........................................241 16.1 信息检索中的聚类应用........................242 16.2 问题描述................................................244 16.3 聚类算法的评价....................................246 16.4 K-均值算法............................................248 16.5 基于模型的聚类....................................254 16.6 参考文献及补充读物............................258 第 17 章 层次聚类.........................................260 17.1 凝聚式层次聚类....................................260 17.2 单连接及全连接聚类算法....................263 17.3 组平均凝聚式聚类................................268 17.4 质心聚类................................................269 17.5 层次凝聚式聚类的最优性....................270 17.6 分裂式聚类............................................272 17.7 簇标签生成............................................273 17.8 实施中的注意事项................................274 17.9 参考文献及补充读物............................275 第 18 章 矩阵分解及隐性语义索引..........277 18.1 线性代数基础........................................277 18.2 词项—文档矩阵及SVD..........................280 18.3 低秩逼近................................................282 18.4 LSI.........................................................284 18.5 参考文献及补充读物............................287

2013-04-12

吉林大学人工智能2012课件

吉林大学2012年人工智能课件。 非常不错的资源

2013-04-09

汇编语言chm版(吉大内部资料)

绝对是汇编语言入门级的宝书! 容易上手,易学!

2010-10-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除