- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 python+xpath爬取苏宁商品品类
学习爬虫实战二#encoding=utf-8from lxml import etreeimport requests"""爬取苏宁上的家具第一层:爬取大分类1.总入口:https://list.suning.com/?safp=d488778a.46601.0.4786e76351链接:/html/body/div[5]/div[2]/div[1]/div/div[@class...
2019-09-10 16:27:03 405
原创 python + selenium爬取品牌信息
学习爬虫,走了很多弯路,记录下python+selenium的测试,直接上代码#encoding=utf-8from selenium.webdriver import Chromefrom bs4 import BeautifulSoup driver = Chrome("C:\Program Files (x86)\Google\Chrome\Application\chromedri...
2019-09-10 16:21:10 270
原创 ubuntu 定时用python执行svn update操作
如果只有user用户权限去执行代码目录的更新,更新后还需要重启某个服务,且重启服务需要用sudo权限运行,涉及到权限会稍微复杂,直接看代码;#encoding=utf-8import ossudopwd=‘xxxx’dir=’/home/trunk’whoami = os.popen(“whoami”)if whoami.read().strip() ==‘root’:ret = o...
2019-08-20 16:58:56 772
原创 Git大文件提交问题
往Git上提交大文件时遇到:this exceeds file size limit of xx MB remote: error: hook declined to update refs/heads/master尝试清理缓存和log都不行,最后用git lfs首先安装:https://github.com/git-lfs/git-lfs/wiki/Installation然后打开gi...
2019-07-25 11:36:11 361
原创 Linux常用命令总结
1、远程拷贝scp filename [email protected]:/destdir :从本地拷贝到远程scp -r [email protected]:/srcdir destdir :从远程拷贝到本地2、查看文件目录readlink -f filename3、查看当前目录pwd4、堆栈命令当要切换目录时可以先保存当前目录cd /home/hccpushd ./切换到其他目录,c...
2019-07-19 11:24:25 527
原创 win10 GTX1060 tensorflow-gpu环境部署
win10+GTX1060+cuda9+vs2017+cudnn7+tensorflow-gpu1.5为了跑神经网络模型新购了一张GT1060,搭建环境碰到一些坑,记下来分享给大家安装顺序(很重要)!!!显卡驱动-vs2017->cuda驱动->cudann(复制)annaconda3.5,(python3.6) tensorflow1.5这两个顺序没要求1.先安装显卡驱动i...
2019-07-19 10:50:56 732
十二个类别商品评论数据集.csv
2020-04-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人