自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 租房分期产品用户风险识别与分析

租金分期产品好坏用户分析主要内容背景介绍数据抓取1.了解一下网络连接远离和爬虫原理,方便大家理解网页爬去!2.知道用哪些工具爬取网页数据。3.熟悉主要的爬虫流程数据分析性别与年龄区域订单状态芝麻分分值分布授信额度和借款期限结论应用主要内容本案例主要从背景、数据抓取、数据分析和结论四个部分进行介绍租房分期产品好坏用户识别与分析。背景介绍租房分期产品是基于租赁场景下,根据租客资质给予一笔消费额...

2019-04-22 23:48:19 510

原创 学习笔记(01):零基础搞定Python数据分析与挖掘-爬虫案例2-- 链家二手房

新课上新,原价199,限时立减100元!!! 60讲+源码+5门300元课程+讲师社群1V1答疑+社群闭门分享会=99元 【超实用课程内容】本课程将从实际业务出发,基于Python3落地工作中经常碰到的分析与挖掘方法。内容涉及Python基础语法介绍、数据预处理、数据可视化以及数据分析与挖掘;使用到的技术包含Python3中的...

2020-05-17 17:34:13 152

原创 统计学第十周学习

本周是统计学学习【假设检验】,涉及到的二级知识点有两个,分别是:1、基本概念:原假设、备择假设、两类错误、显著性水平、P值、单侧检验、双侧检验2、假设检验的分类:一个总体参数的检验、总体均值的检验、总体比例的检验、总体方差的检验;两个总体参数的检验、两个总体均值之差的检验,两个总体比例之差的检验,两个总体方差比的检验...

2020-01-12 23:58:39 164

原创 统计学第九周学习

这周的学习内容是参数估计实践,主要是使用python对我们上周学习的理论知识进行实践。正态分布下的置信区间def norm_conf (data,confidence=0.95): # https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.norm.html sample_mean = np.mean(...

2020-01-12 23:54:55 131

原创 统计学学习第八周

本周学习d的内容是【参数估计】,主要有以下知识点1、点估计:矩估计法2、区间估计:总体均值的区间估计、总体比例的区间估计、总体方差的区间估计、两个总体均值之差的区间估计、两个总体比例之差的区间估计、两个总体方差比的区间估计3、样本量的确定:估计总体均值时样本量的确定、估计总体比例时样本量的确定...

2020-01-05 23:14:04 105

原创 统计学第七周学习

统计学第七周统计学import pandas as pdimport numpy as nppath = ‘E:\english\data.xlsx’data=pd.read_excel(path)######按照港口分类,计算数据的统计量embark = data.groupby([‘Embarked’])embark_basic=data.groupby([‘Embarked’]...

2019-12-29 22:54:59 166

原创 统计学学习第六周

本周学习了统计学第六章:统计量及其抽样分布1、常用统计量:样本均值、样本方差、样本变异系数、样本K阶矩、样本k阶中心距、样本偏度、样本峰度、次序统计量、充分统计量2、常用抽样分布:卡方分布、T分布、F分布、中心极限定理(其他重要抽样分布)、样本比例的抽样分布、两个样本平均值之差的分布、样本方差的分布、两个样本方差比的分布。...

2019-12-21 09:07:34 109

原创 统计学学习第五周

本周使用Python实现常见的离散型变量分布与连续型变量分布。二项分布import numpy as npimport matplotlib.pyplot as pltlist_a = np.random.binomial(n=10,p=0.5,size=10000)#取样1000次,每次进行十组试验,单组试验成功概率为0.2,list_a为每组试验中成功的组数plt.hist(l...

2019-12-01 00:08:43 183

原创 统计学学习第四周

本周学习了统计学中随机变量与概率定义与分布的相关知识。随机变量有离散变量和连续变量,概率分布有离散变量分布与连续变量分布,离散变量分布有二项分布、伯努利分布、泊松分布 ;连续变量分布有均匀分布、正态分布、指数分布。下面总结了自己对本章节知识的理解。【概率】概率就是一个事件在实验中出现的可能性大小的度量,可能性大小的数值就是概率值,值越大代表该事件发生的可能性越大。【随机变量】在同一组条件...

2019-11-29 22:23:24 199

原创 统计学学习第三周

由于练习数据百度网盘链接失效,所以自己生成训练数据,目的在于练习Python对数据进行描述性统计。首先,穿件训练数据import pandas as pddata = {"第1列":[22,62,43,47,52,96,37,28],"第2列":[63,74,32,41,66,88,40,38],"第3列":[12,32,46,37,62,86,17,38],"第4列":[63,74,54...

2019-11-26 23:08:15 139

原创 统计学学习第二周

第二周:描述性统计数据分布的特征从三个方面进行测度和描述:分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;分布的离散趋势,反映各数据远离其中心值的趋势;分布的偏态和峰态,反映数据分布的形状。1、集中趋势众数:一组数中出现次数最多的变量值。中位数:一组数中排序后,处于中间位置上的变量值。分位数:一组数排序后,处于25%与75%的位置上的数值,成为四分位数,前者称为上四分位,后者...

2019-11-16 21:25:28 166 1

原创 统计学学习第一周

@统计学(第七版)数据整理与展示本节梳理不同类型的数据如何处理、整理与展示。数据预处理在数据整理与展示之前要进行数据的预处理,预处理包括数据的审核、筛选和排序操作。数据审核指从数据完整性与准确性两个方面进行审核,例如,检查数据是否有遗漏、有错误、有异常值,而针对这些情况如何处理,如发现异常值是保留、修改还是剔除。说到数据的剔除操作,这就涉及到数据的筛选。数据筛选就是把符合标准的数据保留...

2019-11-03 16:48:41 360

原创 3种数据标准化方法

常用的3种数据标准化方法1.均值方差标准化(Z-Score标准化)计算过程:对每个属性/每列分别进行一下操作,将数据按属性/按列减去其均值,并除以其方差,最终使每个属性/每列的所有数据都聚集在均值为0,方差为1附近。公式:(x-mean(x))/std(x)使用sklearn.processing()方法from sklearn import preprocessingscaled ...

2019-05-04 08:13:13 2841

原创 关于BOSS直聘产品用户增长的三条建议

聊聊招聘APP!

2019-05-04 00:45:27 3273

原创 Python基本的数据结构与算法

1.二分法二分法查找是一种算法,其输入是一个有序的元素列表,如果要查找的元素包含在列表当中,二分查找返回其位置;否则返回null。查找元素时每次都会从中间位置开始判断查找,每查找一次都会排除一半元素。特点(1)从n个有序元素中查找目标元素,使用简单查找方法,最多需要查找n步,查找n个元素,而使用二分查找算法最多查找log(n)步,查找log(n)个元素;(2)二分查找的前提列表元素是有序的...

2019-04-27 14:16:52 378

原创 数组和链表

数组和链表术语在讲述数组和链表之前,我们先了解一个术语——索引和大O表示法。索引指元素的位置,因此我们不说“元素20的位置为1”,而说“元素20位于索引1处”。大O表示法指出算法的速度有多快,算法运行时间的增速。如O(n)中的n指的是“操作数”,也就是算法执行时操作了几次。有鉴于此,我们不仅要知道算法需要多长时间才能运行完毕,还需要知道运行时间如何随列表增长而增加。常见的用大O表示法...

2019-04-26 23:41:54 95

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除