自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 问答 (1)
  • 收藏
  • 关注

原创 使用Pandas 绘制带样式的Excel

import pandas as pdimport openpyxl#生成一个DataFramedata= pd.DataFrame(data=np.random.randn(6,3),columns=["a",'b','c'])#filename 保存的文件名filename = 'test.xlsx'writer = pd.ExcelWriter(filename,engine...

2019-11-14 12:13:16 1751

原创 python无监督学习,k-means算法

K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。 K-Means算法的思想很简单,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。 样本: 要求通过客户消费频率与金额为客户群体分3类import pandas as pdimport numpy as npimport m...

2019-01-13 14:54:59 753

原创 python监督式学习--分类标签,实现1-9的手写数字识别

监督式学习,由已有的数据包括输入输出,训练模型函数;然后把新的输入数据带入模型函数,预测数据输出;函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)使用knn算法样本:样本拥有两类,一部分是训练样本,一部分是测试样本,可以从文本中大概看出这是数字0,以0和1 表示,文件名‘-’前表示数字内容,后面表示样本的名字一,处理样本import pandas ...

2019-01-12 16:38:53 888 1

原创 实用pandas进行数据预处理

(1)数据合并的原理与方法;(2)数据清洗的基本方法;(3)数据标准化的方法(4)常用数据转化的方法;

2019-01-09 20:17:11 674

原创 pandas中 透视表与交叉表常用属性

pandas中透视表与交叉表使用pivot_table()和crosstab()实现透视表pivot_table()import pandas as pdimport numpy as npdetail=detail=pd.Dataframe({'order_id':[1,2,3,4,5], 'counts':[1,2,1,3,1], ...

2019-01-08 19:48:12 449 1

原创 pandas的基础应用

Pandas提供了一套名为DataFrame的数据结构,比较契合统计分析中的表结构,并且提供了计算接口,可用Numpy或其它方式进行计算。1 文件读取import pandas as pddataframe=pd.read_csv(r'C:\Users\Administrator\Desktop\mealcsv',encoding='gbk')'''读取 read_csvread...

2019-01-08 19:30:08 239

原创 matplotlib的基本绘图

基本绘图流程常用函数绘制折线图import matplotlib.pyplot as pltimport numpy as np#创建画布:plt.figure()#更改字体,让图片可以显示中文plt.rcParams['font.sans-serif'] = 'SimHei'plt.rcParams['axes.unicode_minus'] = False#设定x,...

2019-01-05 11:01:38 315

原创 Numpy的基本使用

数组的创建:import numpy as np#一维数组的创建:arr1 = np.array([1,2,3,4])#二维数组:arr2 = np.array([[1,2,3,4],[4,5,6,7],[7,8,9,10]])数组的属性:print('数组结构:',arr2.shape)print('数组元素个数:',arr2.size)print('数组元素类型:',a...

2019-01-03 20:02:22 191

原创 axis=0 或 1属性的定义

我们可以用正方形简单理解:axis=0,是对正方形的长短进行操作axis=1,是对正方形的宽窄进行操作

2018-12-28 20:52:24 571

原创 理解Scrapy架构图

Scrapy 使用了 Twisted['twɪstɪd](其主要对手是 Tornado)异步网络框架来处理网络通讯,可以加快我们的下载速度,不用自己去实现异步框架,并且包含了各种中间件接口,可以灵活的完成各种需求Scrapy Engine: 负责 Spider、ItemPipeline、Downloader、Scheduler 中间的通讯,信号、数据传递等Scheduler(调度器): 它负...

2018-12-28 19:59:11 373 1

原创 python,css渲染的雪碧图加密文字

有些网站的文字内容使用雪碧图加密,网站显示的内容源代码的内容雪碧图css网站根据css精灵图坐标渲染页面,首先我们要把css拿下来存到本地,然后筛选自己需要的import re,requestsfrom lxml import etreewith open('111.css','r',encoding='utf-8') as f: a = f.read()b=...

2018-12-26 23:21:40 343

原创 UnicodeEncodeError: 'ascii' codec can't encode characters in position 10-13: ordinal not in range(12

环境:win10 + AnacondaUrllib中请求网址中带有中文报错:UnicodeEncodeError: 'ascii' codec can't encode characters in position 10-13: ordinal not in range(128)使用urllib.parse.quote()把文字转码from urllib import requesti...

2018-12-21 16:27:00 3518 1

原创 Cookie 和 Session 基础知识

一、二者的定义:具体来说 cookie 机制采用的是在客户端保持状态的方案,而 session 机制采用的是在服务器端保持状态的方案。Session是建立在cookie上使用的。*cookie 机制是一种客户端的机制,cookie 的内容主要包括:名字,值,过期时间,路径和域。若不设置过期时间,则表示这个 cookie 的生命期为浏览器会话期间,关闭浏览器窗口,cookie 就消失。s...

2018-12-20 20:01:08 515

原创 Urllib中反爬

Urllib中反爬环境:win10+Anaconda3.5+pycharm1,加headersfrom urllib import request#导入库url='https://www.baidu.com/'#网址headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.3...

2018-12-20 19:45:34 202

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除