自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 泰坦尼克

# coding: utf-8# In[25]:import osimport pandas as pdimport numpy as npimport matplotlib.pyplot as plt# In[26]:plt.rcParams['axes.unicode_minus'] = False #允许坐标轴上显示负数plt.rcParams['font.s...

2018-09-07 22:17:02 463

原创 杭州数据分析师

# coding: utf-8# ## 目录# * 连接数据库# * 获取job表及company表的信息并进行清洗# * 分析职位工资# * 分析职位所处行业# * 分析学历、工作经验与工资的关系# * 分析公司待遇、位置及招聘要求# In[50]:#导入所用模块import pandas as pd#读取数据库from sqlalchemy import cr...

2018-09-07 20:08:34 454

原创 python问题

argsort函数是Numpy模块中的函数:返回的是数组值从小到大的索引值如:>>> x = np.array([3, 1, 2]) >>> np.argsort(x) array([1, 2, 0])

2018-06-11 17:04:00 191

转载 Python 中改变和获取当前工作目录

import osos.chdir("目标目录")   #修改当前工作目录os.getcwd()    #获取当前工作目录

2018-06-11 14:00:21 4442

转载 数据竞赛参考

https://www.zhihu.com/question/30494274/answer/59199678https://blog.csdn.net/bryan__https://github.com/wepe020优惠券:https://tianchi.aliyun.com/competition/information.htm?spm=5176.11165320.5678.2.45b92e...

2018-06-09 16:57:16 281

原创 向量、矩阵、数组、列表、数据框关系

向量:矩阵:,矩阵matrix是一个二维数组。数组:数据框: R中和python中类似。

2018-06-01 16:58:32 4123

转载 如何将多个excel文件合成一个文件

https://zhidao.baidu.com/question/96195372.html1.需要把多个excel表都放在同一个文件夹里面,并在这个文件夹里面新建一个excel。2.用microsoft excel打开新建的excel表,并右键单击sheet1,找到“查看代码”,单击进去。进去之后就看到了宏计算界面。3.然后把下面这些宏计算的代码复制进去,然后找到工具栏上面的“运行”下的“运行...

2018-05-21 12:24:18 10766

原创 python数据分析小练习----科赛

https://www.kesci.com/apps/home/project/5a8afe517f2d695222327e14 练习1-开始了解你的数据步骤6 数据集中有多少个列(columns):chipo.shape[1]步骤9 被下单数最多商品(item)是什么:chipo.item_name.value_counts().head(1)  value_counts 默认从大到小排序步骤1...

2018-04-19 15:42:03 8316

原创 数据可视化-------excel

数据可视化(1)  常见图表类型与应用1.      散点图:散点图、气泡图、单轴散点图   2.      折线图:折线图、面积图  3.      柱形图:柱形图、直方图4.      饼图5.      漏斗图6.      雷达图 (2)  高级图表类型与应用1.      树形图2.      桑基图3.      热力图4.      关系图5.      箱线图6.      标靶图...

2018-04-19 10:50:56 512

原创 MySQL

1.      as……:起别名。字段,表,子查询都可以起别名。在select中起别名之后,在当前select子句不能使用别名,在非当前select子句可以使用。2.      子查询:子查询后相当于一个新表。         ①  起别名后,在当前select子句中不能使用别名,可在外套一个select再用,子查询可命名为t。如:应用case….时,要使用别名只能在外套一个select。    ...

2018-04-19 10:41:56 143

原创 excel总结

Excel函数:(1)文本清洗类                  (2)关联函数类                  (3)逻辑运算类                  (4)计算统计类                  (5)时间序列类  (1)      文本清洗类Find() left()  right()  MID()  &(拼接,=concatenate()) 替换(=repl...

2018-04-18 20:18:53 1132

原创 正则表达式

正则表达式常用:    \d:匹配任意数字,等价于[0,9]    *:匹配0个或多个的表达式    +:匹配1个或多个的表达式    ?:匹配0个或1个由前面的正则表达式定义的片断,非贪婪方式    .:出\n之外的任意字符    .*:非懒惰模式    .*?:懒惰模式    ^:匹配字符串开头    $:匹配字符串末尾    re.S:'.'匹配包括换行在内的所有字符后边多一个?表示懒惰模式...

2018-04-05 11:51:05 122

转载 草稿

python strip()函数 去空格\n\r\t>>> a = ' 123'>>> a.strip()'123'>>> a='\t\tabc''abc'>>> a = 'sdff\r\n'>>> a.strip()'sdff'import json data = {'username':'李华',

2018-04-05 11:38:54 115

原创 爬《针锋对决》

from bs4 import BeautifulSoupimport reimport requests,sysclass downloader(object): #定义一个类(包含属性和方法) def __init__(self): self.urls = [] #链接数 def get_pageone_content(self): #获得第一...

2018-04-02 21:13:24 15451

转载 爬小说

from bs4 import BeautifulSoupimport requests,sysclass downloader(object): #定义一个downloader类 def __init__(self): #当前类的实例 self.server = 'http://www.biqukan.com/' self.target = '...

2018-04-02 17:14:22 594

原创 列表

for循环和while循环里的else,是执行完for循环和while循环后,再执行else里的代码块不同于if.....else...中选择其中之一进行执行列表a=[1,2,3]a.append()   a.insert()    a.pop()    a.remove() 等列表在执行方法后,列表id不变,但列表里变化的内容的id变了所以返回值仍用 print(a)...

2018-02-23 14:41:34 125

原创 eval函数

a = input('please enter your info:')b = eval(a)print(type(b))若不用eval()函数,则所有结果都为字符串,eval()可以去掉' '

2018-02-23 12:19:06 247

转载 一张图入门python

2018-02-21 12:22:56 3415

原创 name 'k' is not defined

k = float(input(k))e = 0.0041859*k没有对k设置初始值,提示name 'k' is not defined改为:k = float(input(‘plaese enter your height:’))e = 0.0041859*kinput()中若已有内容,则会相当于用print()一样先将内容print出来,而后input()发挥作用,输入值后返回的是字符串。如...

2018-02-21 12:04:57 4129

原创 美国国旗

import turtle  #快速绘图turtle.speed(10)#绘图速度 turtle.penup()#隐藏画笔画出的线  def draw_bluerectangle(start_x,start_y,len_x,len_y):#画蓝色框 turtle.goto(start_x,start_y) turtle.color('black') turtle.fillcolor('blue')...

2018-02-17 11:29:21 1275

原创 第一次爬虫

from bs4 import BeautifulSoupimport requestsimport timedef get_item_info(url): #如何从详情页里面要爬取的内容 #url = 'http://zhuanzhuan.58.com/detail/958892567109058567z.shtml?fullCate=5%2C38484%2C23094&am...

2018-02-10 17:48:00 246

转载 find_all

在爬取网页中有用的信息时,通常是对存在于网页中的文本或各种不同标签的属性值进行查找,Beautiful Soup中内置了一些查找方式,最常用的是find()和find_all()函数。 同时通过soup.find_all()得到的所有符合条件的结果和soup.select()一样都是列表list,而soup.find()只返回第一个符合条件的结果,所以soup.find()后面可以直接接.text...

2018-02-08 16:56:25 747

原创 SyntaxError: unexpected EOF while parsing

可能少了括号

2018-01-28 14:33:50 4672 1

原创 IndentationError: unindent does not match any outer indentation level

代码对齐中,混用tab 和 空格键,python不支持

2018-01-28 14:04:43 159

原创 报错 Non-ASCII character'\xc7' in file

前面加上 #coding:utf-8

2018-01-19 09:00:49 1041

原创 最近的收获

1.今天准备了将近两个月的BEC出成绩了,差五分及格,最后只拿到了B2。口语成绩大大出乎我的意料,竟然这么低!虽然搭档不算太给力,但自己还没尽全力是主要方面。2.我有一个毛病,也算优点,比如看论文的时候看到一个我不懂或不了解的知识点,我就会去查资料,书上、网上、各大论坛一通找,但在这个过程中我又会碰到很多我不了解的知识点,导致整个过程消耗了我相当长的时间,而且结合找到的资料再回过头思考,我可能

2017-12-16 20:51:46 119

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除