自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(0)
  • 资源 (6)
  • 收藏
  • 关注

空空如也

百度百科爬取攻击

该工具需要使用需要使用mysql,redis等使用方法如下: 使用scrapy爬取百度百科 包括词、词摘要、基本信息、摘要链接、内容等保存到根目录下的baike.json文件中 1.需要安装myslq数据库 然后运行 baike/mysql/test.py文件创建数据库表格 2.进入命令行运行 scrapy crawl baike 即可 3.所有的相关信息保存到./baike.log中,为后续的使用,控制台不在显示运行信息 4.输出数据保存在baike/spiders/baike.json下,每行一个词条为,例如多义词信息如下: {"title": "百度百科:多义词", "url": "https://baike.baidu.com/item/百度百科:多义词", "summary": "\n百度百科里,当同一个词条名可指代含义概念不同的事物时,这个词条称为多义词。如词条“苹果”,既可以代表一种水果,也可以指代苹果公司,因此“苹果”是一个多义词。\n", "summarylinks": [["百度百科"], ["/item/百度百科"]], "basicinfo": [[], []], "content": "", "contentlinks": [["义项"], ["/item/义项"]]} 5.在baike/mysql/json_test.py有队生成baike.json的相关调试

2018-01-02

android docs中的例子

从google上下载的 android docs上的例子,有需要的可以联系我!我这还有几个压缩包,里面的例子都有

2014-12-16

jquery 源码分析

深入学习jquery的及js的好资料

2014-09-12

bochs虚拟环境用于操作系统的开发

虚拟环境,用于操作系统开发很有用的一种工具,目前本人学习中

2011-05-12

\电脑超级技巧5000招

电脑/技巧电脑/技巧脑/技巧电脑/技巧电脑/技巧电脑/技巧脑/技巧电脑/技巧电脑/技巧电脑/技巧脑/技巧电脑/技巧电脑/技巧电脑/技巧脑/技巧电脑/技巧

2010-10-18

黑客零起点 看看

黑客书籍黑客书籍黑客书籍黑客黑客书籍书黑客书籍黑客书籍籍黑客书籍黑客书籍

2010-04-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除