自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 python简单模拟站内搜索引擎第一步(创建数据集)

为了模拟购物网站的站内搜索引擎,需要建立数据集。我们先去抓取jd的部分图书数据。#!/usr/bin/env python3 import urllib.requestfrom bs4 import BeautifulSoupfrom lxml import etreeimport pymysqldef get_url(content):    xml =  etree.HT...

2018-07-26 19:27:57 1186

原创 利用python的物流轨迹抓取(二)

在整个跨境出口电商的的圈子里,有两家提供跨境物流轨迹服务的厂,具体就不说了,大家都知道的,今天来简单的爬下其中一家的数据。附上代码,比较简单。import jsonimport requestsimport reimport urllib.requestdef track():    num=input('请输入单号:')    url = 'https://www.trac...

2018-07-18 19:12:25 4368

原创 17track包裹单个物流轨迹抓取(一)

近期正在学习python ,结合自己过往的工作,所以闲来无事,试下爬17track 的轨迹。爬取途径是:利用静态页面爬取,需要了解前端网页知识。三方包:pyquery话不多说,看代码吧:#!/usr/bin/env python3#coding=utf-8from pyquery import PyQuery as pqimport pymysqldef get_time(...

2018-07-08 19:47:48 6771 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除