自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 我的pyhon数据分析之路(3)——Pandas数值运算的方法

数值运算即:对pandas里的数据进行加减乘除运算和高级函数运算。当使用sub、add等通用函数运算时,panda的索引(index)有两个特点:(1)保留索引和列标签(2) 索引自动对齐特点1:索引的保留`我们通过一个series列子演示:rng=np.random.RandomState(42)ser = pd.Series(rng.randint(0,10,4))0 6...

2019-04-27 22:08:38 580

原创 我的pyhon数据分析之路(2)——series和datafram的数据选择

Series的数据选择data = pd .Series([0.25,0.5,0.75,1],index=['a','b','c','d'])a 0.25b 0.50c 0.75方法1:将series 看作字典,通过index进行索引print(data['a':'c'])b 0.50c 0.75方法2:根据行数进行切片,即隐式索引print...

2019-04-12 23:05:47 147

原创 我的python数据分析之路(1)——Series和Dataframe创建

SeriesSeries是一种一维的数组,由一组数据(numpy数据类型)和一组索引构成。pd.Series([2,4,6])0 21 42 6#0,1,2 为index,可以通过series.index查看#2,4,6为值,可以通过series.values查看print(s1.index)RangeIndex(start=0, stop=3, step...

2019-04-12 22:01:54 503

原创 使用reques+正则表达式t爬取猫眼电影

import requestsfrom requests.exceptions import RequestExceptionimport reimport json获取top100的html代码 status_code 网页状态码,200表示正常打开网页def get_one_page(url): try: response=requests.get(ur...

2018-09-12 13:20:49 197

原创 nurllib.request 爬取猫眼top100

加载必要模块import urllib.requestimport reimport json定义一个函数爬取网页,offset参数为网页页码参数def main(offset):设立爬虫网址 url='http://maoyan.com/board/4?offset='+str(offset)设立headers,模拟浏览器 headers={'Us...

2018-08-18 00:02:11 256

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除