自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 SQL查询性能优化

通过对一些查询方式和细节的调整,有时能大大提高查询的效率,本次文章整理自《SQL进阶教程》,这本书为大家提供了很多简单易行的查询优化方法,即使你不具备数据库理论知识,也能够很容易的掌握到。笔记纲要:1、使用高效的查询方式2、避免排序3、善用索引4、减少中间表1、使用高效的查询方式①在子查询中,用EXISTS代替INexists只要查到一行数据满足条件就会终止查询。不用像使用in时...

2018-12-04 21:34:10 231

原创 会员(用户)数据化运营——分析模型

在上篇文章中,介绍了《python数据分析与数据化运营》一书中会员数据化运营的相关指标,本次将继续介绍部分分析模型。会员数据化运营指标的文章请点击https://blog.csdn.net/Taozidede/article/details/84659371 二、会员数据化运营分析模型2.1 会员细分模型①基于属性的细分人口学:性别、年龄、受教育程度等;地理学:南北方、城市规模、中西...

2018-11-30 16:38:20 3122 2

原创 会员(用户)数据化运营——指标介绍

最近看了《python数据分析与数据化运营》一书,受益良多,在这里整理部分笔记,也把自己的一些所得分享给大家。会员(用户)数据化运营是企业运营的重要基础,了解会员数据化运营的角度、相关指标、方法、模型等,建立较为系统的思考逻辑,是非常重要的,本次笔记介绍的是第一部分:会员数据化运营的相关指标。笔记纲要:~~·会员数据化运营指标··········会员整体指标··········会员营销指...

2018-11-30 16:34:30 3729 1

原创 dataframe行列查询

一、可以通过df.shape查询行列数import pandas as pddf = pd.DataFrame([[1,2,3], [7,5,7], [9,7,4], [8,4,6]])# 维度查询>>> df.shape(4, 3)# 获取行数>>> df.shape[0]4# 获取列数>>> df.shape[...

2018-08-21 19:08:54 4653

原创 pandas之创建DataFrame

pandas创建DataFrame的方式主要有两种,通过列表创建与通过字典创建,下面一一演示一下。import pandas as pddf1 = pd.DataFrame([[1,2,3],[7,5,7],[9,7,4]])>>> df1 0 1 20 1 2 31 7 5 72 9 7 4df2 = pd.DataFrame(...

2018-08-21 18:54:18 436

原创 python连接数据库——pymysql

在数据库内很多复杂的操作会受到限制,此时可用python连接到数据库,将数据在py中进行相关处理,可提高运行效率。本文以pymysql模块为例连接数据库。# 导入模块import pymysql# 建立一个字典存储数据库的相关信息db_infor = { 'host': '127.0.0.1', 'user': 'root', 'passwd': '*****...

2018-07-24 19:05:39 280

原创 爬虫案例——淘宝图片爬虫

在淘宝网中搜索某种商品之后会跳转到新的网页,网页的底部有可以进行换页,爬虫之前我们需要找出不同页码之间是否存在某种规律。https://s.taobao.com/search?q=%E7%9F%AD%E8%A3%99&imgfile=&commend=all&ssid=s5-e&search_type=item&sourceId=tb.index&s...

2018-03-25 20:09:17 3884 1

原创 爬虫案例——新浪新闻

爬取新浪新闻并存储在本地。import urllib.requestimport redata=urllib.request.urlopen('http://news.sina.com.cn/').read()data=data.decode('utf-8','ignore') #编码出现问题自动忽略pat='href="(http://news.sina.com.cn/.*?)"'a...

2018-03-14 15:29:53 368 2

原创 爬虫案例——豆瓣出版商

爬取豆瓣出版商名称,并存储在本地文件中。import urllib.requestdata=urllib.request.urlopen('https://read.douban.com/provider/all').read()data=data.decode('utf-8')import repat='<div class="name">(.*?)</div>'...

2018-03-14 15:27:53 285

原创 爬虫——正则表达式

1、原子import re#普通字符作为原子pat='yu' #2个原子string='http://yun.iqianyue.com' a=re.search(pat,string) print(a)#非打印字符作为原子 pat='\n' string='''kalsjflakaksf...

2018-03-14 15:23:48 251

原创 爬虫基础

在之前两篇文章中已经为大家介绍了urllib模块的基础知识及使用方法,本次文章将介绍发送请求,爬虫的异常处理和伪装浏览器三个部分的知识。1、发送请求以百度检索为例:https://www.baidu.com/s?wd=python&ie=UTF-8                                                                      wd...

2018-03-14 14:49:54 265

原创 Python基础知识——urllib模块在爬虫中的应用

以一个小例子引入urllib模块import urllib.request#urlretrieve('要爬取的网址','想要将网页保存在本地的地址'),该方法可将网页直接保存在本地,无需read()及写入操作a=urllib.request.urlretrieve('http://www.hellobi.com',filename='D:/python学习/1.html') #urlclea...

2018-03-14 14:32:13 237

原创 Python基础知识——作用域、函数、模块

本次文章将为大家简单介绍介绍一下题目中的三个概念,下次将会对urllib模块进行详细讲解。1、作用域:全局变量和局部变量i=100print(i) #i为全局变量,在之后仍可继续引用def func1(): j=10 print(j) #j为局部变量,只在我们调用func1()时可用print(j) #此时j不存在,无法打印def func2(): global...

2018-03-14 14:15:01 165

原创 Python基础知识——文件操作和异常处理

文件操作是数据处理中的基础操作,包括读取、写入、存储/关闭等#文件不存在时自动创建a=open('D:/1python学习/重新学习python/file.txt','w')b='hello,python'a.write(b)a.write('\nhi,girl')a.close()#文件存在时a=open('D:/1python/file2.txt','r')b=a.read()...

2018-03-12 20:52:24 632

原创 Python基础知识——控制流

控制流可分为顺序结构,条件分支结构,循环结构,中断结构,这里介绍几种常用语句。1.if语句a=3if(a<4): print('CLASS1')elif(a>10): print('CLASS2')else: print('CLASS3')2.while语句a=3while (a<8): print('Hi') a+=13

2018-03-08 18:02:19 209

原创 初识Python

python极简基础知识

2018-03-08 17:57:18 183

原创 Learn Python the Hard Way(“笨办法”学python) 第四版 例39笔记

39 列表的操作 python菜鸟最近在学Learn Python the Hard Way这本书,将笔记分享出来和大家一起学习! 小点解析(来自脚本之家和陶子自己的理解): **1.**str.split(str=”“,num=string.count(str)) str——分隔符,默认为所有的空字符,包括空格,换行(\n), 制表符(\t)等,上面的例子中用的是空格 num—

2017-10-19 20:25:56 395

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除