- 博客(5)
- 收藏
- 关注
原创 我的pyhon数据分析之路(3)——Pandas数值运算的方法
数值运算即:对pandas里的数据进行加减乘除运算和高级函数运算。当使用sub、add等通用函数运算时,panda的索引(index)有两个特点:(1)保留索引和列标签(2) 索引自动对齐特点1:索引的保留`我们通过一个series列子演示:rng=np.random.RandomState(42)ser = pd.Series(rng.randint(0,10,4))0 6...
2019-04-27 22:08:38 580
原创 我的pyhon数据分析之路(2)——series和datafram的数据选择
Series的数据选择data = pd .Series([0.25,0.5,0.75,1],index=['a','b','c','d'])a 0.25b 0.50c 0.75方法1:将series 看作字典,通过index进行索引print(data['a':'c'])b 0.50c 0.75方法2:根据行数进行切片,即隐式索引print...
2019-04-12 23:05:47 147
原创 我的python数据分析之路(1)——Series和Dataframe创建
SeriesSeries是一种一维的数组,由一组数据(numpy数据类型)和一组索引构成。pd.Series([2,4,6])0 21 42 6#0,1,2 为index,可以通过series.index查看#2,4,6为值,可以通过series.values查看print(s1.index)RangeIndex(start=0, stop=3, step...
2019-04-12 22:01:54 503
原创 使用reques+正则表达式t爬取猫眼电影
import requestsfrom requests.exceptions import RequestExceptionimport reimport json获取top100的html代码 status_code 网页状态码,200表示正常打开网页def get_one_page(url): try: response=requests.get(ur...
2018-09-12 13:20:49 197
原创 nurllib.request 爬取猫眼top100
加载必要模块import urllib.requestimport reimport json定义一个函数爬取网页,offset参数为网页页码参数def main(offset):设立爬虫网址 url='http://maoyan.com/board/4?offset='+str(offset)设立headers,模拟浏览器 headers={'Us...
2018-08-18 00:02:11 256
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人