- 博客(2)
- 收藏
- 关注
原创 网页爬虫(WebCrawler)更新策略
互联网是实时变化的,具有很强的动态性。网页更行策略主要用来决定何时更新之前已经下载的页面。常见的更新策略有以下三种:1、历史参考策略 顾明思议,历史参考策略是指根据页面以往的历史更新数据,预测该页面未来何时会发生变化。。一般来说,是通过泊松过程进行建模来预测的。2、用户体检策略 尽管搜索引擎针对某个查询条件能够返回数量巨大的结果,...
2019-05-05 19:15:18 1034 1
原创 欢迎使用CSDN-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2016-11-26 16:16:57 562 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人