自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 Hive SQL进阶案例(一):使用LAG函数判断日期连续性

LAG函数是一个常用的窗口函数,作用是取当前行之后的数据,即把该列数据向上错位。

2021-12-02 18:31:09 4977

原创 PostgreSQL存储过程(六):结构控制和循环

结构控制和循环介绍: 作为编程语言中极为重要的知识,控制和循环可以降低代码量和减少人的工作量。在PL/PGSQL中实现了常用的控制结构和循环方法,灵活使用确实可以用来提高数据库查询的效率。结构控制:1. 结构:IF ... THEN ... ELSIF ... THEN ... ELSE ... END IFCREATE OR REPLACE FUNCTION mydb.mysc.learn_conditional01(IN num integer,OUT result_st...

2021-04-13 00:42:38 3657 1

原创 PostgreSQL存储过程(五):函数返回值

返回值介绍: PostgreSQL函数提供了OUT关键字和RETURNS两种语法来实现返回值的定义,其中RETURNS关键字需要在函数体中使用RETURN关键字指明返回的变量,示例脚本如下:1. 通过OUT关键字指定返回值-------------------CREATE OR REPLACE FUNCTION mydb.mysc.add(IN p_a integer,IN p_b integer,OUT p_sum integer) AS $BODY$ BEG...

2021-04-11 15:05:08 7791 4

原创 PostgreSQL存储过程(四):追加指定日期区间数据

需求介绍: 本次的目标是实现追加指定区间内的历史数据,且仅保存指定日期区间内月份月末一天的数据的函数。在文章三中介绍了方便一次性使用的匿名代码块,但匿名代码块对脚本的封装能力有限,本次使用普通的函数进行实现。【注:函数设计应该尽量解耦合,因此本文实现的代码更优的方式是拆分为插入一个月数据的函数及一个负责调用的循环函数。】使用函数追加指定日期区间数据的函数实现: 示例脚本使用的数据表依旧是文章三中创建的learn01表。start_dt:起始日期end_dt:...

2021-04-06 00:40:14 1287

原创 PostgreSQL存储过程(三):使用匿名代码块

匿名代码块介绍: 匿名代码块是在PostgreSQL 9.X版本引入的新功能【注:9.0以下不支持,可通过select version()脚本确认自己使用的数据库版本】,通过DO关键字指定执行代码块,其功能和函数类似,相当于轻量版的函数,但不能传参数和返回值。适合进行一些较为复杂的一次性查询,在日常中使用可以大大降低一些重复脚本的执行的人力成本。准备工作——创建数据表: 在开始使用匿名代码块之前,首先创建一张要操作的数据表作为函数中的操作对象。create ta...

2021-04-04 22:41:33 2812

原创 PostgreSQL存储过程(二):创建函数入门

创建简单自定义函数示例: pl/sql语法比较灵活,但在创建函数时还是要尽量符合语言约定的规范写法,比如参数名称使用可读性较好的写法(驼峰式、短横线式等写法),在示例脚本中尽量使用符合约定的写法。创建加法计算函数:创建一个实现两数相加的自定义函数,具体脚本如下,p_a:计算参数1p_b:计算参数2p_sum:返回结果变量-------------------CREATE OR REPLACE FUNCTION mydb.mysc.add(IN p_a integer,I...

2021-04-04 01:55:35 3146 3

原创 PostgreSQL存储过程(一):概念简介

通用概念介绍:SQL:全称叫结构化查询语言(Structured Query Language),是用来访问关系型数据库一种通用语言,因为语法更接近自然语言所以学习门槛较低。属于非过程化语言,即可以直接通过简单的调用相应语句来直接取得结果,目前流行的SQL语言标准为可读性较好的ANSISQL-99标准。PL/SQL:全称叫过程化SQL语言(Procedural Language/SQL),它是一种过程化语言。PL/SQL增加了逻辑判断、循环等功能,使其具有Java、C++、Python等高级语言所.

2021-04-02 00:24:48 1726

原创 点估计和区间估计——统计学概念

概念简介: 点估计和区间估计是通过样本统计量估计总体参数的两种方法。点估计是在抽样推断中不考虑抽样误差,直接以抽样指标代替全体指标的一种推断方法。因为个别样本的抽样指标不等于全体指标,所以,用抽样指标直接代替全体指标,不可避免的会有误差。区间估计是抽样推断中根据抽样指标和抽样误差去估计全体指标的可能范围的一种推断方法。在从抽样指标推断全体指标时,用一定概率保证误差不超出某一给定范围。点估计: 点估计是使用抽样数据得到总体有样本参数。比如,针对某市房租平均价格的统计,全...

2021-01-24 15:33:15 6017

原创 自如房源爬取及简单分析——python语言实现

背景及任务简介 自如作为在长租公寓行业的头部公司,目前已覆盖国内一线城市和部分新一线城市,因其在租房间种类丰富,装修美观,有大量的“管家”形成了线上线下闭环,且租户具有极高粘性。本次任务通过python抓取符合要求的房源进行简单分析,本次抓取数据是以北京市某区域的“通勤找房”为例,获取当前工作地骑行35分钟内的全部房源,并使用脚本语言对数据进行获取及处理。数据获取 业务分析 在自如主页使用地图找房后,通勤时间筛选条件设置后,发现符合条件的房源有三个区,如下图: 编...

2021-01-17 21:18:11 946 9

原创 基于AIC评价指标的逐步回归Python语言实现

本文主要介绍了逻辑回归的评价指标和逻辑回归中常用的三种变量筛选方法,并介绍了三种变量筛选方法的原理及运行效率问题,在文章最后给出了一种基于AIC评价指标的逐步回归的Python实现。

2020-12-31 19:30:55 4111 3

原创 基于AIC评价指标的向后回归法Python语言实现

本文主要介绍了逻辑回归的评价指标和逻辑回归中常用的三种变量筛选方法,并介绍了三种变量筛选方法的原理及运行效率问题,在文章最后给出了一种基于AIC评价指标的向后回归法的Python实现。

2020-12-27 22:42:19 3248 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除