lixiao-flowyourheart-CSDN博客

原创 python简单模拟站内搜索引擎第一步(创建数据集)

为了模拟购物网站的站内搜索引擎，需要建立数据集。我们先去抓取jd的部分图书数据。#!/usr/bin/env python3 import urllib.requestfrom bs4 import BeautifulSoupfrom lxml import etreeimport pymysqldef get_url(content): xml = etree.HT...

2018-07-26 19:27:57 1186

原创利用python的物流轨迹抓取（二）

在整个跨境出口电商的的圈子里，有两家提供跨境物流轨迹服务的厂，具体就不说了，大家都知道的，今天来简单的爬下其中一家的数据。附上代码，比较简单。import jsonimport requestsimport reimport urllib.requestdef track(): num=input('请输入单号：') url = 'https://www.trac...

2018-07-18 19:12:25 4368

原创 17track包裹单个物流轨迹抓取（一）

近期正在学习python ，结合自己过往的工作，所以闲来无事，试下爬17track 的轨迹。爬取途径是：利用静态页面爬取，需要了解前端网页知识。三方包：pyquery话不多说，看代码吧：#!/usr/bin/env python3#coding=utf-8from pyquery import PyQuery as pqimport pymysqldef get_time(...

2018-07-08 19:47:48 6771 5

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 python简单模拟站内搜索引擎第一步(创建数据集)

原创 利用python的物流轨迹抓取（二）

原创 17track包裹单个物流轨迹抓取（一）

空空如也

空空如也

原创利用python的物流轨迹抓取（二）