自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 案例:淘宝用户行为数据分析(SQL实现)

案例:淘宝用户行为数据分析(SQL实现)一、项目介绍分析思路二、数据处理1.数据来源及数据说明2.数据清洗三、分析正文1. 用户购物情况整体分析2. 用户行为转化漏斗分析1) 获客:每日新增用户情况2)留存:新增用户的留存情况3)转化:转化及流失情况4)变现:复购分析漏斗图分析3.用户行为时间维度分析1) 月时段下用户行为分布2) 周时段下用户行为分布3) 日时段下用户行为分布4.用户RFM模型分析四、结论与建议1.用户购物情况整体分析2.通过漏斗模型分析用户行为转化3.研究用户在不同时间尺度下的行为规律,

2020-08-14 00:11:42 3381

原创 爬虫学习day04

爬虫学习day04AJAX实战:获取某精选AJAX即异步的 JavaScript 和 XML。AJAX 是一种用于创建快速动态网页的技术。AJAX 最大的优点是在不重新加载整个页面的情况下,可以与服务器交换数据并更新部分网页内容。通过在后台与服务器进行少量数据交换,AJAX 可以使网页实现异步更新。这意味着可以在不重新加载整个网页的情况下,对网页的某部分进行更新。传统的网页(不使用 AJA...

2020-04-28 16:07:24 189

原创 爬虫学习day03

爬虫学习day03IP介绍实例:获取代理IP地址selenium介绍测试session和cookie动态网页和静态网页session和cookiessessioncookies实战:模拟登录163小项目:模拟登录丁香园,并抓取论坛页面所有的人员基本信息与回复帖子内容IP介绍为什么会出现IP被封网站为了防止被爬取,会有反爬机制,对于同一个IP地址的大量同类型的访问,会封锁IP,过一段时间...

2020-04-25 22:49:15 197

原创 爬虫学习day02

爬虫学习day02XPathXPath 是一门在 XML 文档中查找信息的语言。XPath语法包括选取节点、谓语、通配符、组合路径等。组合路径实战:使用XPath获取丁香园论坛回复内容from lxml import etreeimport requests#1.获取url的htmlurl = "http://www.dxy.cn/bbs/thread/626626#6...

2020-04-23 22:07:22 292

原创 爬虫学习day01

爬虫学习day01互联网、HTTP概念互联网HTTP网页基础网页组成网页结构HTML DOMFLowchart流程图导出与导入导出导入互联网、HTTP概念互联网互联网也叫因特网(Internet),是指网络与网络所串联成的庞大网络,这些网络以一组标准的网络协议族相连,连接全世界几十亿个设备,形成逻辑上的单一巨大国际网络。它由从地方到全球范围内几百万个私人的、学术界的、企业的和政府的网络所构成...

2020-04-21 22:28:15 309

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除