自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 2017秋季数据挖掘、大数据相关职业于北上广深的职位需求报告

俗话说金9银10,秋季无论对校园招聘、社会招聘的求职者都是一个很不错的时机,我对这类问题比较感兴趣,就专门开了一个如上的项目。针对国内的超一线城市:北京、上海、广州、深圳,从国内的大型招聘网站分别于9、10、11月采集了有关数据挖掘、大数据相关的近25900条职位信息以及其他25个岗位近264100条职位信息,来看看这段时间的人才需求状况,也对各位对数据职业感兴趣的朋友们提供些相关的信息。

2017-12-25 20:33:11 5397 5

原创 pandas数据框,统计某列或者某行数据元素的个数

在《pandas数据框,统计某列数据与其他文件对应关系的个数》之后,我发觉简单版的元素个数统计问题没有说清楚,就在这里介绍两个统计pandas数据框里面列、行元素个数的方法:代码如下:import pandas as pdimport numpy as npdf = pd.DataFrame(np.zeros((8,4)))#新建一个数据框df.iloc[2:6,0]=1#将第0列的第3行...

2018-05-23 10:02:55 75415 6

原创 pandas 添加最大值的列名

在我们处理表格数据的时候,有时候只有几个列和其对应的个数,我们想得到这几个列里面最大值的列名,该怎么做呢?数据样式:我的解决方式是对每一行进行处理,再用pandas里面的apply函数#!/bin/python#-*-coding:UTF-8-*-import osfrom sys import argvimport pandas as pdimport numpy

2018-01-10 10:33:06 4759

原创 pandas数据框,统计某列数据与其他文件对应关系的个数

现在要解决的问题如下:我们有一个数据的表第7列有许多数字,但是数字又有一个对应的关系:我们要得到第7列对应关系的统计,就是每一行的第7列a有多少个,b有多少个好了,我给的解决方法如下:#!/bin/python#-*-coding:UTF-8-*-import pandas as pdimport numpy as npdfid

2017-09-12 15:30:26 8344

原创 小工具:得到目标文件夹中文件名 python

在Windows 系统里面,如果一个文件夹下面的文件太多,我又想得到文件列表,怎么办呢?可以用一下我下面的Python小工具:#!/bin/python#-*-coding:UTF-8-*-#filename: get_name_Aug17.pyimport osfrom sys import argvfiles1 = []for f in os.listdir(argv[1

2017-09-07 09:47:27 341

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除