自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (1)
  • 收藏
  • 关注

原创 UNICODE程序写文件出现乱码

在程序中使用的是UNICODE编码,写入文件时如果存在中文就会出现乱码,原因是写入文件内容变成了ANSI编码,解决的办法是将需要写入文件的内容首先转换成宽字符然后再转换UTF-8编码。代码如下:std::string WideToUTF8(const std::wstring& _src){ int nBufSize = WideCharToMultiByte(CP_UTF8, 0

2011-12-07 10:01:37 604

转载 LNK2001错误

<br />习VC++时经常会遇到链接错误LNK2001,该错误非常讨厌,因为对于 <br />编程者来说,最好改的错误莫过于编译错误,而一般说来发生连接错误时, <br />编译都已通过。产生连接错误的原因非常多,尤其LNK2001错误,常常使人不 <br />明其所以然。如果不深入地学习和理解VC++,要想改正连接错误LNK2001非 <br />常困难。 <br />  初学者在学习VC++的过程中,遇到的LNK2001错误的错误消息主要为: <br />  unresolved   external

2010-06-23 09:07:00 370

原创 mysql+phpadmin

       毕业设计已经开始进行具体工作,需要使用mysql+phpmyadmin,貌似很简单的安装使用就浪费了我很长时间,不过现在回过头去看,也不能说是浪费时间毕竟现在已经可以使用我也了解到了以前不知道的一些东西,所以就感觉难易都是相对的,其实这些东西没什么技术含量,但要是不知道 下一步的工作就没法进行,我想这也是经验的重要性吧。       现在总结一下遇到的问题。       首先

2008-03-27 12:29:00 1162

转载 站内搜索引擎真伪鉴别

有很多网站都在网页上加个“站内搜索引擎”、“搜索引擎”、“全文检索”等等相关字样。     用户一用,结果发现,既不能多关键组合查询,也不能支持国际语法,甚至不能支持全文检索,就更别谈不支持相关性排序等真正的搜索引擎具备的功能了。这些搜索和真正的站内搜索引擎有和区别呢?     真正的全文检索应具备 相关性排序技术 和 分词索引功能。 如果需要进行互联网的信息抓取和采集那么还需要网络蜘蛛模块。 分

2008-03-07 23:25:00 488

转载 信息检索的核心支撑技术

(Information Retrieval),通常指文本信息检索,包括信息的存储、组织、表现、查询、存取等各个方面,其核心为文本信息的索引和检索。从历史上看,信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发展阶段。   目前,信息检索已经发展到网络化和智能化的阶段。信息检索的对象从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新快、分布广泛、管理松散的W

2008-03-07 23:24:00 1138

转载 网站站内搜索的重要性

 我们在评估一个网站的时候,往往所做的第一个工作就是分析该网站站内搜索的有效性。但据我们观察,50%以上的网站搜索结果都不能达到访问者的预期目的。   以下几点是站内搜索对于网站投资回报至为关键性的因素:   1、并不是每个网站都需要站内搜索   很多网站访问仅通过标准栏目导航就能完全达到目的。尤其是一些内容页面不多的小网站。   2、对误拼搜索词的处理   如果去WalMart.com网站输入

2008-03-07 23:23:00 464

转载 搜索引擎的商业模式将发生重大突破

经过多年的发展,互联网的应用正在发生着结构性变化,一个大而全的门户已经不可能完全与用户各种各样需求的飞速发展合拍,社会分工、专业化细分已经衍生出了专业门户来提供专业信息服务以及电子商务,专业门户正 在积极拓展信息增值利用的渠道和方法。这其中,专业的信息搜集与检索是提供专业特色服务的必备的基础设施。      同时,在当代复杂的商业环境下,信息资源开发、管理、利用已经成为企业塑造竞争优势不可或缺的工

2008-03-07 23:22:00 1280

转载 全套垂直搜索引擎技术

一、互联网信息采集与处理检索系统 1.         新闻搜索引擎SPIDER2.         网页搜索引擎SPIDER3.         定向专业搜索SPIDER4.        基于视觉的正文智能提取模块(自动正文提取)5.         智能摘要提取模块6.         去重模块7.         智能分类模块

2008-03-07 23:16:00 602

原创 如何做好一个垂直搜索引擎

本文先引用几句话:1.“确解用户之意,切返用户之需。”2.“门户网站都想着是怎样省钱,而不是怎样花钱来买技术。”3.“搜索引擎不是人人都能做的领域,进入的门槛比较高。”4.“只是优秀还不够,最好的方式是将一件事情做到极致。”(google十大真理)5.“做搜索引擎需要专注” “对于一项排到第四的业务,门户很难做到专注。”6.“用户无法描述道他要找什么,除非让他看到想找的东西。”7. “所谓楔形,其

2008-03-07 23:13:00 721

转载 垂直搜索引擎的选型

 网页搜索引擎的存在有他存在的土壤,土壤环境是怎么样的呢?1.海量的数据,互联网上有海量的数据,并且这些数据在快速增长、不断更新2.分散的数据,这些数据存在于成千上万个网站中3.多样化的数据4.用户多样化的数据搜索需求5.用户对搜索数据的实时性要求不是非常强6.用户对这些数据有整合使用的需求,并且这种需求量很大7.能够很好的对整合来的数据进行处理,能够完整的满足用户的这种需求,提供完整的信息检

2008-03-07 23:12:00 405

转载 搜索引擎优化

 搜索引擎优化是指通过了解各类搜索引擎如何抓取互联网页面,如何进行排序来对网页进行相关的优化工作,使网站整体网页和部分网页的相关的关键字获得好的搜索引擎排名,从而提高网站访问量,最终提升网站的销售能力或宣传能力。搜索引擎优化的英文名是SEO(search engine optimization),与搜索引擎定位(Search Engine Positioning)和搜索引擎排名(Search En

2008-03-07 23:10:00 441

转载 全文检索概念

全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。全文检索的方法主要分为按字检索和按词检索两种。按字检索是指对于文章中的每一个字都建立索引,检索时将词分解为字的组合。对于各种不同的语言而言,字有不同

2008-03-07 23:09:00 683

转载 中文分词和搜索引擎

作者: Winter搜索引擎,上网的人基本上都不陌生了,CNNIC的第17次《 互联网调查报告》显示,使用搜索引擎服务的网民,仅次于电子邮件。中文分词,估计了解的人并不多,毕竟太技术,太底层。但中文分词是中文搜索引擎系统中的非常重要的模块,这里之所以强调是中文搜索引擎,是针对英文搜索引擎来讲,因为对于英文来说,空格代表词和词之间的分隔,也就不存在分词问题。和中文搜索引擎类似还有日文、韩文、泰文

2008-03-07 22:59:00 450

原创 中文搜索引擎技术揭密:系统架构

 作者Winter首发于e800.com.cn 【e800.com.cn 编者按】互联网发展的今天,一方面离 不开其开放、共享的特性带给人们的全新体验,另一方面也离不开数以亿计的为其提供各类丰富内容的网络节点。互联网被普及前,人们查阅资料第一想到的便是拥 有大量书籍资料的图书馆,到了今天你怎么想?或许今天的很多人都会选择一种更方便、快捷、全面、准确的方式——互联网。你可以坐在家里轻点几下鼠标就查到

2008-03-07 22:57:00 553 1

原创 中文搜索引擎技术揭密:网络蜘蛛

作者Winter 首发于e800.com.cn 【e800.com.cn 编者按】随着搜索经济的崛起,人 们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;作为普通网民,会根据搜索引 擎的性能和技术来选择自己喜欢的引擎查找资料;作为学者,会把有代表性的搜索引擎作为研究对象……而作为一个网站的经营者,其更关心的或许是如何通过网络

2008-03-07 22:55:00 270

原创 中文搜索引擎技术揭密:中文分词

作者Winter首发于:e800.com.cn 前言 信息的飞速增长,使搜索引擎成为人们查找信息的首选工具,Google、百度、yisou、中搜等大型搜索引擎一直人们讨论的话题。随着搜索市场价值的不断增加,越来越多的公司开发出自己的搜索引擎,阿里巴巴的商机搜索、8848的购物搜索等也陆续面世,自然,搜索引擎技术也成为技术人员关注的热点。搜索引擎技术的研究,国外比中国要早近十年,从最早的

2008-03-07 22:49:00 364

K-Means动态聚类算法

K-Means动态聚类算法,经典算法

2008-05-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除