自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(13)
  • 问答 (2)
  • 收藏
  • 关注

转载 python判断文件和文件夹是否存在、创建文件夹

Python中对文件、文件夹的操作需要涉及到os模块和shutil模块。创建文件:1) os.mknod(“test.txt”) 创建空文件2) open(“test.txt”,w) 直接打开一个文件,如果文件不存在则创建文件创建目录:os.mkdir(“file”) 创建目录复制文件:shutil.copyfile(“oldfile”,”newfile”) oldfil...

2019-06-10 15:18:40 191

转载 彻底理解Python中的yield

原文 https://www.jianshu.com/p/d09778f4e055通常的for...in...循环中,in后面是一个数组,这个数组就是一个可迭代对象,类似的还有链表,字符串,文件。它可以是mylist = [1, 2, 3],也可以是mylist = [x*x for x in range(3)]。它的缺陷是所有数据都在内存中,如果有海量数据的话将会非常耗内存。

2018-01-18 10:19:52 233

原创 php远程连接MongoDB用户认证错误问题

php mongo扩展安装好了之后,本地调试没问题,结果远程连接别的电脑上mongodb数据库时候,始终出现问题try{ $m = new MongoClient("10.100.0.159:27017"); $db = $m->smaap; $db-> authenticate("xxxx","xxxx"); }catch (Exception $e){

2017-11-13 09:59:39 1770

原创 Yii框架查询Mongodb并页面显示问题

上一篇文章记录了一下php装mongodb驱动的问题,接下来记录一下查询并显示的问题,代码如下:$m = new MongoClient();$db = $m->mlab;$collection = $db->whois;$cursor = $collection->find();这样一个简单的查询就完成了,后面就是要显示的问题了。$arrayDataProvider = new

2017-11-10 10:17:02 654

原创 yii框架中使用php(xampp)的mongodb扩展和应用总结

最近要用到Yii框架,要求访问mongodb数据库,查询结果后在页面显示。本以为就和访问Mysql一样方便,没想到却有如此多的坑。害怕以后忘掉了,所以记录一下。一开始没啥经验,直接在百度搜“Yii框架 mongodb”字样,结果搜出来了“Yii框架 使用Mongodb扩展—YiiMongoDbSuite”。就按照教程把压缩包下载下来,配置配好了,整个步骤如下:(1)下载好插件后解压到pro

2017-11-10 09:05:26 639

转载 Python中的str与unicode处理方法

由于要经常爬取一些网页信息,因此网页编解码问题经常遇到。以前经常一知半解,现在又把编解码问题重新了解了一下,顺便做个笔记。在Python2中,str类型和unicode类型转换问题会经常遇到。记住一点,str类型就是字节流,我们从网页爬的内容都是以字节流的存在在网络上传输的。那么在python2中,编码(encode)就是unicode->str,解码(decode)就是从str->unicode

2017-11-10 08:36:25 2417

转载 Python 错误和异常小结

1.Python异常类 Python是面向对象语言,所以程序抛出的异常也是类。常见的Python异常有以下几个,大家只要大致扫一眼,有个映像,等到编程的时候,相信大家肯定会不只一次跟他们照面(除非你不用Python了)。异常描述NameError尝试访问一个没有申明的变量ZeroDivisionError除数为0Synta

2017-06-24 10:08:04 321

转载 Scrapy之settings设置篇

定义SettingsSettings提供了key-value映射的全局命名空间,代码中可以获取配置的值。settings.py是scrapy项目的标准配置文件,也可通过命令行选项,spider类中等方式定义。ROBOTSTXT_OBEY = False1是否遵循robots.txt协议COOKIES_ENABLED = False1防止了网站使用cookies识别爬虫ITE

2017-06-15 11:07:34 393

转载 python判断文件和文件夹是否存在、创建文件夹

Python中对文件、文件夹的操作需要涉及到os模块和shutil模块。创建文件:1) os.mknod(“test.txt”) 创建空文件 2) open(“test.txt”,w) 直接打开一个文件,如果文件不存在则创建文件创建目录:os.mkdir(“file”) 创建目录复制文件:shutil.copyfile(“oldfile”,”newfile”) oldf

2017-06-14 15:22:02 361

转载 python3使用urllib模块制作网络爬虫

urlliburllib模块是python3的URL处理包其中:1、urllib.request主要是打开和阅读urls个人平时主要用的1:打开对应的URL:urllib.request.open(url)用urllib.request.build_opener([handler, ...]),来伪装成对应的浏览器import urllib#要伪装成的浏览器(

2017-06-14 14:48:49 399

转载 Python3中内置类型bytes和str用法及byte和string之间各种编码转换

Python3中内置类型bytes和str用法及byte和string之间各种编码转换    Python 3最重要的新特性大概要算是对文本和二进制数据作了更为清晰的区分。文本总是Unicode,由str类型表示,二进制数据则由bytes类型表示。Python 3不会以任意隐式的方式混用str和bytes,正是这使得两者的区分特别清晰。你不能拼接字符串和字节包,也无法在字节包里搜索字符

2017-06-14 14:38:27 2777

转载 Scrapy工作原理(流程)

官方教程说当你写好自己的spiders如douban之后,你可以通过scrapy runspider/crawl douban启动你的爬虫。于是一开始的时候你就知道通过这个命令行来启动爬虫,但是你有没有想过当你敲下这行命令后,scrapy到底做了什么呢?命令入口:cmdline.py当你运行 scrapy command arg 这样的命令时,这里的 scrapy 实质是一个 python

2017-06-14 10:26:55 1010

原创 记录利用Scrapy获取优酷分类地址和页面地址提取规则

分类,例如‘综艺类’response.xpath('//*[contains(concat( " ", @class, " " ), concat( " ", "yk-filter-item", " " ))]//a').xpath("./@href").extract()页面urllinks = response.xpath('//@href').re("http://v.y

2017-06-14 09:30:24 513

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除