自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(44)
  • 收藏
  • 关注

原创 湿度计算常数(psychrometric constant)

湿度计算常数简介

2023-07-06 16:52:46 620

原创 R语言rle()函数

计算向量x中等值游程的长度和值。rle显示一个向量x中每一个连续重复元素及该元素对应的值。x可以是不同的格式,如数值,字符串,逻辑变量等。适合用于游程理论的一些编程。例子1,x为数值向量x <- rev(rep(6:10, 1:5))## x<-c(10,10,10,10,10,9,9,9,9,8,8,8,7,7,6)rle(x)## lengths [1:5] 5 4 3 2 1## values [1:5] 10 9 8 7 6例子1,x为逻辑向量z &lt

2021-08-13 22:55:08 2015

原创 ggplot2实现色阶散点图+曲线拟合图

library(ggplot2)library(scales)# humidity以百分比的形式出现T=sort(runif(500,min=24,max=38))O3=8*10^(-11)*T^7.99O3=jitter(O3,amount=30)O3=O3-min(O3)+10# 保证O3没有负值Humidity=sort(runif(500,0,1),decreasing = TRUE)df=data.frame(T=T,O3=O3,Humidity=Humidity)#你有自己的数据

2021-04-06 08:52:33 1082

转载 范剑青--机器是怎么学习金融的

2020年8月7日-9日,第五届CCF-GAIR全球人工智能与机器人峰会,于深圳隆重举办。此次峰会由中国计算机学会主办,雷锋网(公众号:雷锋网)、香港中文大学(深圳)联合承办,鹏城实验室、深圳市人工智能与机器人研究院协办。在大会第三日的「AI金融专场」中,著名统计学家、普林斯顿大学金融讲座教授范剑青,从大数据与人工智能、稳健因子学习及其应用、债券风险溢价预测、高频交易预测、文本分析与金融投资,这五大板块,向与会者报告近些年他的研究团队的部分工作成果。 范剑青是国际数理统计学会创办70年以来第一位华

2021-03-02 22:49:30 530

原创 测量标准误(Standard Error of Measurement;SEm)

举例:分数不能代表一切,也就是说分数不能完全反映一个学生对知识的掌握情况。没休息好,身体不舒服都可能影响书面成绩,那么考试的分数和学生真实分数存在偏差。如何量化考试(测量手段)说明的学生水平误差就用到了测量标准误。心理领域定义:对特定的一组考生来说,与考试分数有关的测量误差的标准差。测量标准误是衡量测量中误差大小的客观指标。它广泛应用在教育、心理等领域。计算公式如(1),SEm=S1−rxx(1)SEm=S \sqrt{1-r_{xx}} \tag1SEm=S1−rxx​​(1)其中,SSS代表

2021-01-27 11:42:17 5811

原创 贝叶斯自举法(BayesianBootstrap)简介

本文有目录自举法Bootstrap分类频率派自举法贝叶斯自举法为什么贝叶斯自举法贝叶斯自举法的工作原理参考文献自举法Bootstrap分类在对数据的统计分析时,一般首先假设参数形式的概率密度分布。但是如果我们的统计模型对这个预先假设很敏感,那么如何决定假设的内容就很重要了。避免对数据特征的事先假设似乎可以解决上述问题,事实上它也一直是一个重要课题。确定模型的不确定区间可以很好地评价我们模型的可靠度,同时也可以告诉我们模型不知道的范围。自举法概念清晰,执行简单,是一种很好地非参数方法。按照频率派和贝叶

2021-01-22 11:35:27 4250 1

原创 Diebold-Mariano检验

给定两个预测的预测结果,我们希望比较他们的预测结果,以用于预测模型精度的比较。Diebold-Mariano检验本质是一个t检验,用于检验替代预测的两个损失序列的平均值是否相等。即,它是一系列损失差的零均值的t检验。在存在自相关的情况下,它使用损失差分时间序列标准差的自相关一致性估计。注意,在使用DM检验式时,假设损失序列是平稳的。另外,DM检验在小样本数据时往往会拒绝零假设。对于小样本数据,推荐Harvey, Leybourne and Newbold (HLN)检验【1】;参考文献【1】htt

2021-01-20 16:07:39 4904 4

原创 SCI写作助手网站收集

免费PPT模板语法检测英文同义词句子组成推荐英文润色英文同义句替代英文降重英文降重英文降重英文降重参考文献【1】https://zhuanlan.zhihu.com/p/90150195

2021-01-18 19:05:03 322 1

原创 R语言无法从GitLAB/GITHUB远程安装

问题描述我以ggeconodist包安装为例,一般地,安装的命令可如下形式。install.packages("ggeconodist", repos = "https://cinc.rud.is")# orremotes::install_git("https://git.rud.is/hrbrmstr/ggeconodist.git")# orremotes::install_git("https://git.sr.ht/~hrbrmstr/ggeconodist")# orremote

2021-01-08 16:40:07 1092 1

原创 HEC-RAS批处理的实现

简要说明利用MATLAB控制HECRAS的输入输出操作可以实现批处理功能,大幅节约人为操作时间。文献【1】的2.3.3小节有一个详细的方法介绍;文献【2,3】里有代码有下载网址,但现在貌似要60美刀。文献【4】给出了python脚本。因此可以参照文献【1】和【4】的思路完成代码设计,实现HEC_RAS的MATLAB操作。注意:利用MATLAB的actxserver命令创建 COM 服务器。记住这里要确认软件COM组件安装成功,并开放了许可。挖个坑,急用可参考python,现在寒潮。。。冷。

2021-01-07 22:37:35 2589 2

原创 Van der Waerden‘s Normal Scores检验

文章目录简介计算过程参考文献简介Van der Waerden’s Normal Scores检验是一种非参数检验方法。在计算过程中,它首先把数据转换秩序,然后再转换成标准的正态分布分位数。因此它可以适用于非正态分布。零假设H0H_0H0​:所有k个总体分布函数都是相等的;备择假设H1H_1H1​:在k个总体分布函数中,至少有一个与其它分布不相等,并且倾向对其他分布函数产生更大的观测值。计算过程正态得分AijA_{ij}Aij​可按下式计算,Aij=Φ−1(R(Xij)N+1)A_{ij} =

2020-09-30 21:21:48 842

原创 t Location-Scale Distribution

文章目录1. Location-Scale t简介1.1.分布形式1.2.分布性质2. t Location-Scale Distribution与标准学生t分布区别3.参考文献1. Location-Scale t简介1.1.分布形式Location-Scale t 分布的概率密度函数f(x)f(x)f(x)可写作如下形式,f(x)=Γ(ν+12)σνπΓ(ν2)[ν+(x−μσ)2ν]−ν+12f(x)=\frac{Γ(\frac{ν+1}2)}{σ\sqrt{νπ}Γ(\frac{ν}2)

2020-09-27 11:40:54 3994 1

转载 地学SCI期刊2018-2020年影响因子一览

地学SCI期刊2019年影响因子一览

2020-09-22 20:54:51 2784

原创 变分自编码器入门(Variational Auto Encoder, VAE)

学习体会如下图,我们假设头像图片的有三个特征X=(x1,x2,x3)X=(x_1,x_2,x_3)X=(x1​,x2​,x3​),(比如说x1x_1x1​代表脸型,x2x_2x2​代表眼睛,x3x_3x3​代表嘴巴,这里选三个只是方便理解),确定值描述就是中间的坐标轴,每个特征都有确定的值;但在VAE中每个固定值是不存在的,而是以概率密度的形式存在。XXX为隐变量ZZZ可能的值的一个。所谓道生一,一衍万物,不外如是。一组确定的值限制了我们的想象空间,通过隐函数的空间,大千变化才有了可能。所谓隐函数参照

2020-09-08 17:08:40 558

原创 LATEX-拉泰赫编辑数学公式效果展示

Ⅰ上下标1.简单上下标。Aij=2i+jA_{ij} = 2 ^ {i+j}Aij​=2i+j2.上下标符号的先后顺序不影响表达 。Aik=BikA_i^k=B^k_iAik​=Bik​3.\cdot代表点4⋅⋅34^{\cdot{\cdot^3}}4⋅⋅34.符号’等价于(^\prime)。注意\prime没有上下标之说。a=a′a=a^\primea=a′同a=a′a=a'a=a′c′2{c'}^2c′25.角度符号\circ,注意实际应用中加上上标符号^。A=90∘A=90^\

2020-09-01 21:51:10 1706

原创 MATLAB删除图例中的多余线条

1代码方法allChildren = get(gca, 'Children'); % list of all objects on axesdisplayNames = get(allChildren, 'DisplayName'); % 显示所有图例的名称% 显示只需要的图例名称legend(allChildren([1 2 3]))2 GUI界面手动删除1.右击图例–显示属性编辑器–更多属性–点String属性进行修改...

2020-08-28 09:59:10 11074 3

原创 matlab在三维图侧面添加二维图

红色为月均值。蓝线代表每年的月序列。主要命令通过plot3实现,在画侧面图的时候,仍采用plot3命令,但是年份轴要取一个恒定值(2019)。代码有时间再整理。【1】添加置信区间

2020-08-25 22:33:46 2282

原创 交叉小波分析的解读

通过交叉小波分析,不仅能够分析出信号间的相互关系程度,还可以得到信号在时频空间的相位关系。在变换系数较大的区域代表两信号具有较强的相关性。云图代表周期,箭头代表相位关系。黑色粗轮廓表示95%显著性水平,黑色线条为影响锥。向右箭头表示两信号相同时,向左箭头表示反相信号;向下箭头表示指数领先于指数,向上箭头表示指数落后于指数。...

2020-08-24 15:34:48 10698 7

原创 去趋势波动分析 (Detrended fluctuation analysis ;DFA)

DFA是一种由Peng等人(1994)引入用于DNA研究的长期幂律关系技术;它也适用于非平稳时间序列数据集。该技术已广泛应用于分析连续发展后的自然环境之间的长期关系。从动力学角度看, 这种方法中变换的序列仍残留着原序列的痕迹, 与原序列保持着相同的持久性 (或反持久性) 。同时, 变换可较好地“滤除”其自身演化的趋势成分, 剩下的离差序列主要就是波动成分【3】。计算方法与步骤参照参考文献【3】。这里补充一下DFA指数(a)代表的意义,如果a等于0.5,表示过程是随机分布的,有独立随机方法。如果0 &

2020-08-24 11:50:21 10597 1

原创 Circular-Circular 和 Circular-Linear Regression

Circular-Circular的例子在一个海边的小岛上有着某种稀缺鱼类,科学家关注这种鱼的产卵时间(TS)是否取决于低潮时间(TLT)。在产卵期,科学家甩了几个小硕士在岛上记录了一波实验数据[TSi,TLTi]。为了研究TS对TLT的依赖关系,科学家将这波数据甩给了某个秃头的延期博士。该博士将TS的0 ~ 24小时的周期转换为[0,24];将TLT转换为相位区间[0,2π]。因此配对的TS和TLT是二元循环数据。如下图,它们被绘制成圆圈。根据文献【1】,可分析TS对TLT的统计相干性,若存在显

2020-08-20 15:49:22 533 1

原创 利用R.matlab包将MATLAB数据导入到R语言

目录1 安装R.matlab包2.在MATLAB中保存.mat文件3. 在R环境中读取.mat文件1 安装R.matlab包安装完R.matlab后,加载该包的过程中可能会提示加载不成功。按照提示继续装提示缺乏的包环境,加载R.methodsS3、R.oo、R.utils。2.在MATLAB中保存.mat文件下列示例代码将ER矩阵保存为ER.mat。注意‘’-v7’’为可用的MAT文件版本,该版本与R.matlab包相匹配。save('ER.mat','ER','-v7');3. 在R环境中读

2020-08-17 15:20:13 2550

原创 Binning method

Binning method分箱法(不知道咋翻译)用于平滑数据或处理有噪声的数据。在这种方法中,首先对数据进行排序,然后将排序后的值分布到多个桶或箱中。它们执行局部平滑的规则如下,1.按均值平滑。每个bin里的数值都等价于这个bins里数值的均值。2.按中位数平滑。每个bin里的数值都等价于这个bins里数值的中位数。3.按边界平均。①确定每个bin的最大值和最小值。②对于bin里的数值,若其靠近最大值则等价到最大值。如若靠近最小值,则等价为最小值。参考文献【1】Python代码...

2020-08-07 16:26:51 1794

原创 Chi-Plots和Kendall Plots

简介参照参考文献【1】和【2】怎么看Chi-plot上图中第一列图表示两变量X和Y的散点图,第二列表示Chi-plot。第一行图到第四行图中X,Y的相关性分比为0.0, 0.2, 0.5,和 0.95。由图可知在Chi-plot中,若散点都在两条横线之间,则相关性接近0。在第一条横线上表示正相关,在第三条线下表示负相关。λi表示(Xi,Yi)到数据集中心(以X,Y的中位数表示)的距离。具体怎么画,可以参照CRAN。怎么看Kendall Plots如上图,左图Y=1-X,右图Y=X,若点落到1

2020-08-06 23:24:50 2154 2

原创 分位数回归的实现方法

目录分位数回归简介实现方法参考文献分位数回归简介简介参照可参照参考文献【】实现方法MATLAB: quantregR package:quantreg[外链图片转存失败,源站可能有防盗图片保存下来直1]Dhttps://px1dujblog.c-dnimg.cn/202008564328801.oss-process=image/watermark,type_ZmFuZ3poZWpg?x700naGVpdGk,shadow_10,text_aHR0cHM6Ly7ibG9nLmNzZG4ubmV0

2020-08-06 17:04:01 4244 1

转载 看的见的高斯过程【转】

https://www.jgoertler.com/visual-exploration-gaussian-processes/http://www.360doc.com/content/19/0217/14/32196507_815537751.shtml#

2020-07-08 19:30:39 138

原创 ggplot2实现多组箱线图上添加均值点(线)

正文library(ggplot2)n <- 1000df <- data.frame(var1=sample(LETTERS[1:3],n, T), var2=sample(LETTERS[1:2],n,T), var3=sample(LETTERS[1:3],n,T), y=rnorm(n))p1 <- ggplot(df, aes(x=var1, y=y)) +

2020-06-27 21:04:29 10139 2

原创 基于matlab的自定义最大似然函数的求参方法

1.已知对数似然函数,利用fminunc函数搜索极值。【1】function [ll] = neg_loglike(theta,Y,X) %定义neg_loglike.m方程 mu = X*theta(1:2); ll = -1*sum(log(normpdf(Y,mu,theta(3)))); %fminunc默认求最小值,调整end%% 假设每次观测独立,代入f(观测|参数)数据。data = csvread('/tmp/data.csv'); X = data(:,[3 1

2020-06-26 20:56:09 5532 1

原创 基于matlab的.nc文件可视化的实现

正文1. nc后缀文件的介绍什么是. nc文件?百度百科介绍如下,NetCDF(network Common Data Form)网络通用数据格式是由美国大学大气研究协会(University Corporation for Atmospheric Research,UCAR)的Unidata项目科学家针对科学数据的特点开发的,是一种面向数组型并适于网络共享的数据的描述和编码标准。目前,NetCDF广泛应用于大气科学、水文、海洋学、环境模拟、地球物理等诸多领域。用户可以借助多种方式方便地管理和操作 N

2020-06-26 20:46:00 6391 4

原创 circular包绘图笔记

官方画图流程:1.initialize layout -> 2.create track -> 3.add graphics -> 4.create track -> 5.add graphics - … ->6. clear流程的土味讲解,1.初始化布局–定义factor,也就是定义我一共有几个扇区,扇区的名字和属性 。2.创建轨道–定义circular一共有几圈。无需太在意每个扇区图的完整程度,因为每个圈的每个扇区(即cell)后面都可以单独修改。3.添加图的信

2020-05-26 22:31:02 939

原创 ggplot2点图+线性趋势+公式+$R^2$+p值

先看效果。R语言代码如下,data("faithful")library(ggplot2)p <- ggplot(faithful,aes(x=eruptions,y=waiting)) + geom_point() + stat_smooth(method='lm',formula = y~x,colour='red')lm(formula = waiting ~ erupt...

2020-04-06 00:28:58 9813 6

原创 R语言下载气象数据

近来气象数据共享网的账户到期,失去日序列数据的下载权限。总结了以下R语言气象数据的下载包。package一览下列所有包的来源均属于 rOpenSci 项目.1. GSODTools2. GSOD3. rnoaa4. bomrang5. riem6. weathercan7. CliFlo8. weatherData上述包,简介如下:The GSODTools by Flo...

2020-03-28 17:02:37 2309

原创 统计检验选取指南

文章目录0 意义1 方法路线2 case study0 意义统计作为分析的必备方法,备受人们的瞩目与喜爱。统计检验让我们从概率的角度评判到不同组的差异是否明显。但对于如何选取统计检验让非统计专业的人们一头雾水。本文列处统计检验的选择方法与适用范围。不足之处,恳请批评指正。1 方法路线以t检验为例,一般选取Shapiro.test来评判数据正态性是否满足。若 p-value = 0.551&...

2020-01-06 10:55:34 845

原创 双样本拟合优度的临界值求解

软件简介Real Statistics Using Excel是一个实用的Excel工具,作为一款免费的统计软件,它实现了在Excel里做统计分析。通过扩展Excel的内置统计功能,用户可以更容易地在Excel执行各种统计分析。作者目的是通过该软件包能在Excel里实现SPSS的功能。作者简介:Charles Zaiontz,普渡大学的数学博士,曾在南佛罗里达大学、卡托尼卡大学(米兰和皮亚...

2019-11-16 14:38:27 1919

原创 Cramér‐von Mises检验

文章目录0写在前面1.单样本CVM检验2.双样本CVM检验参考文献0写在前面Cramér‐von Mises检验用于检验一列数据是否与另一组数据有着同样的分布一种非参数检验方法,是一种比KS检验更加严谨的检验方法。单样本CVM检验检验未知分布是否来自某参数分布,如正态分布等。若要比较两组未知分布的数据则需要双样本CVM检验。1.单样本CVM检验2.双样本CVM检验公式以及详细介绍...

2019-11-15 22:51:50 5179

原创 ggplot2默认字体修改

文章目录1.查看当前的ggplot2默认字体2.查看Windows系统下的字体3.修改成Time New Roman4.参考文献1.查看当前的ggplot2默认字体theme_get()$text显示一个list,family为默认空白,默认是sans(Arial字体)。List of 11$ family : chr “”$ face : chr “pl...

2019-11-13 10:16:59 33059 2

原创 置信区间计算方法

文章目录1 均值的置信区间2标准差的置信区间3偏度的置信区间参考文献画图加个阴影,需要用到置信区间的计算方法。SPSS和R应该都能算,这里简单罗列下三阶统计的计算方法。1 均值的置信区间以前保存的一个表格,来源未知。补充,对于非正态的数据的小样本数据,参考[这里]。(https://newonlinecourses.science.psu.edu/stat414/node/261/)2标...

2019-11-11 22:50:05 14817

原创 泰森多边形的matlab实现

写在前面泰勒多边形求流域的均值。借助ARCGIS可以直接计算,但是目前算的程序都是MATLAB在跑,现在总结下MATLAB怎么利用泰勒多边形计算流域平均值。先上代码x = gallery('uniformdata',[30 1],0); %生成一个30行的均匀随机数,0表示一组的代码y = gallery('uniformdata',[30 1],1);voronoi(x,y)加上...

2019-11-11 19:44:29 3282 1

原创 pheatmap绘制热力图

pheatmap绘制热力图(1)坐标轴顺序pheatmap包在绘制热力图时,行名不与data的行名一致,如何保留原始data的行名,控制参数,cluster_rows=F, cluster_cols=F.(2)调色板函数①colorRamp {grDevices}函数创建颜色梯度,1000表示离散成一千格。要显示的数据就可以插值对应1000种颜色中的某一种。colorRampPal...

2019-11-08 21:36:59 1447

原创 泰勒图--MATLAB实现

0.泰勒图介绍见参考文献[4]Taylor, K. E. (2001). Summarizing multiple aspects of model performance in a single diagram. Journal of Geophysical Research: Atmospheres, 106(D7), 7183-7192.1.准备步骤(1)taylordiag.m。...

2019-10-31 23:04:49 11332 19

原创 R语言零碎整理

R语言零碎整理1.ggplot2画柱形图时,柱子顺序的调整默认情况下是按照英文字母递增顺序排序,即b,d,g,k,r,w。需要对date.frame调整,修改的命令参考如下。ma$classify <- factor(ma$classify, levels=c( "b", "r","g","w","d","k"), ordered=TRUE)2.ggplot2调整调色板颜色(1).........

2019-10-30 16:54:04 4959

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除