自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

辉的博客

数学,经济与计算机技术的结合

  • 博客(283)
  • 收藏
  • 关注

原创 GED(Generalized Error Distribution)广义误差分布

广义误差分布(GED)是指一类以整个实数轴为支撑集的连续分布,是由Box和Tiao在1973年提出的(他们称该分布为the exponential power distribution), Harvey在1981年又提出了该分布并命名为GED.该分布包含三个参数μ∈Ra0b0, 概率密度函数为fx2αΓ1/ββ​e−∣x−μ∣/αβ特别地,当β1时为拉普拉斯分布,当β2时为正态分布,当β→∞时逐点收敛于μ−αμα上的连续分布。

2024-02-03 13:11:33 1201

原创 深度学习笔记

文章目录循环神经网络(RNN)长短期记忆网络(LSTM&Bi-LSTM)门控循环网络(GRU & Bi-GRU)时间卷积网络(TCN)卷积神经网络(CNN)图卷积神经网络(GCN)图注意力神经网络(GAT)循环神经网络(RNN)长短期记忆网络(LSTM&Bi-LSTM)门控循环网络(GRU & Bi-GRU)时间卷积网络(TCN)卷积神经网络(CNN)图卷积神经网络(GCN)图注意力神经网络(GAT)

2024-01-14 20:53:57 467

原创 TF-IDF(词频-逆文档频率)

利用关键词提取可以弥补这一不足,关键词提取是一种自动化的文本处理技术,它可以从一篇文章中自动抽取出最能代表文章主题和内容的若干个词语或短语。TF-IDF (Term Frequency - Inverse Document Frequency,词频-逆文档频率)是信息检索中衡量一个词语重要程度的统计指标,广泛应用于文本分析领域。,而 IDF 是这个词语在所有文档中出现的频率,然后取对数,就得到这个词语的 IDF 值。注:当单词A在一个文章中出现的频率很高的时候,我们倾向于认为A是一个重要的词汇。

2024-01-13 20:51:08 602

原创 自然语言处理笔记

中文分词的工具有:jieba(核心算法是张华平的Nshort算法), SnowNLP, NLPIR汉语分词系统, THULAC, PkuSeg等。中文的情感词典有:NTUSD, 正文褒贬词典TSING, 知网HowNet等。英文的情感词典有:LIWC, SentiWordNet等。

2024-01-13 20:31:19 596

原创 关于tex中的表格设置

将下面的代码放在table环境内,放在tabular环境外== 调整表格宽度和高度==: %12可随机设置,调整到适合自己的大小为止调整列间距:%7可随机设置,调整到适合自己的大小为止上面的代码实现的效果往往不好,实现的是一种图片性质的缩放。改变行高的方法是:\renewcommand\arraystretch{1}(在array宏包中)arraystretch默认定义为1,可以重定义得到制定倍数的表格行距。例如:利用array宏包,并配合命令即可实现tex中多表格排列subcaptio

2024-01-13 10:26:10 1207

原创 R语言中的函数28:Reduce(), Filter(), Find(), Map(), Negate(), Position()

R语言中的Reduce(), Filter(), Find(), Map(), Negate(), Position()是base包中的一些高级函数。随后,很多包也给这些函数提供了更多的扩展。

2023-12-23 23:49:08 900

原创 tex中的边框

left=1cm, right=1cm, top=0.5cm可以设置文本与文字之间的距离。width=5cm, height=3cm,可以设置边框的宽和高。利用empheq宏包。

2023-12-04 22:09:48 268

原创 R语言中的函数27:polynom::polynomial(), deriv(),integral(),solve()多式处理函数

R语言中多项式处理函数

2023-11-05 12:19:04 702

原创 R语言中的函数26:polyroot多项式求根函数

R语言中的base::polyroot()可以用于对多项式求根,求根的多项式可以是复数域上的。

2023-11-05 10:58:26 578

原创 PCA的原理及实现方法

主成分分析

2023-11-01 16:49:26 117

原创 R语言中的数据重塑

tidyverse系列包中的函数操作都是针对简洁数据框进行的,对于不是简洁的数据,实现需要进行数据重塑。数据重塑主要包括长宽表的转换、拆分/合并列、方形化。长宽表转化最初使用的是reshape2包的melt()和cast()函数,后来又发展到早起tidyr包的gather()和spread()函数,现在tidyr 1.0之后又提供了更加易用的pivot_longer()和pivot_wider()函数。

2023-09-28 23:03:53 994

原创 R语言中实现非参数单指标模型估计的函数mgcv::gam

非参数的单指标模型估计

2023-08-17 21:49:57 760

原创 R语言中的函数25:paste,paste0

R中的paste函数

2023-08-09 22:06:58 1753

原创 R语言中的函数24:Combinat:combn(), permn()

R语言中用于排列组合的函数

2023-08-09 21:24:25 1007

原创 R语言中的函数23:zoo::rollmean, rollmax, rollmedian, rollsum等等

R语言中的滚动函数

2023-07-26 23:50:15 918

原创 Tex中的删除线

tex中的删除线

2023-07-25 19:00:28 810

原创 用R语言绘制三维曲面

plot3d()所绘制的图形是可以用鼠标调整视角的。

2023-05-25 23:18:24 2338

原创 决策树ID3, C4.5, C5.0,CART的区别

决策树ID3, C4.5, C5.0, CART的区别

2023-05-11 22:14:43 622 1

原创 TeX中如何对bib文件中的条目注释

如bib文件中参考文献条目中的一些项注释,可以通过改变项名来实现,因为tex对于编译时会忽略无意义的项。因为XTitle和XYear是无意义的项。

2023-04-22 21:40:53 1518

原创 ggplot中显示数学公式

【代码】ggplot中显示数学公式。

2023-04-22 20:57:07 314

原创 ggplot中的注释图层annotate

ggplot作图包中除了常见的geom图层外,还有一个annotate的注释图层,实现对作图对象的额外添加,其添加要素不在ggplot()所接受的数据框中。

2023-04-22 19:03:21 343

原创 ggplot中坐标轴和图例的相关处理

利用theme统一去掉名称后,位置也被去掉了。

2023-04-21 20:00:13 2113

原创 git中连接和删除远端的方法

一个本地文件可以和多个远端连接,但是名称要不一样。

2023-04-18 19:12:22 897

原创 tex中enumitem 宏包对itemize环境的调整

利用宏包enumitem 可以对tex的列表环境itemize进行一些调整,实现更好的展示。

2023-04-18 18:57:00 524

原创 R包编写流程

R包的编写

2023-04-18 18:47:40 702

原创 anaconda配置环境变量的方法

anaconda配置环境变量主要是将一下几个地址添加到环境变量的path中:X\Anaconda3X\Anaconda3\ScriptsX\Anaconda3\Library\binX\Anaconda3\Library\mingw-w64\binX\Anaconda3\Library\usr\bin具体操作可参考:https://blog.csdn.net/weixin_67806873/article/details/128218184

2023-04-05 22:22:42 158

原创 Python中的闭包,nonlocal以及global

通常情况下,我们在函数中引用变量,如果该变量在该函数的作用域内重新定义了,就会用重新定义的变量。如果在该函数作用域内没有重新定义,就会自从向上层函数找同名变量。按照1的规则程序一般不会出现问题,但是出现赋值和引用同时进行的语句时,例如x=x+y,python认为等号左边x是inside函数的作用域内重新定义的变量,等号右边x是outside函数的变量,这时就出现了矛盾,就报错了。为了处理这种情况,python出现了关键字nonlocal和global.

2023-04-03 18:39:31 349

原创 如何利用ssh访问git

利用ssh访问github

2023-03-30 09:10:46 863

原创 K-center聚类的python实现

K-center聚类和K-means聚类类似,都是通过迭代类中心点直至收敛,不同的是K-center的中心点必须是一个真实的样本点,而K-means并不需要。

2022-12-30 14:47:12 726

原创 DBSCAN聚类的python实现

DBSCAN是一种基于密度的聚类算法,python中的sklearn.cluster库可以实现DBSCAN聚类。参数介绍1.eps:对象半径;2.min_samples:一个核心对象应该拥有的最少样本数;3.metric:计算样本之间距离的公式,默认metric=‘euclidean’,即欧式距离;4.algorithm:用来找最近邻样本点算法{‘auto’,‘ball_tree’,‘ke_tree’}5.leaf_size:kd_tree或ball_tree中的叶子节点数;决定了搜索快慢。

2022-12-30 11:56:36 2680

原创 k-mean聚类的python实现

模块提供了常用的非监督聚类算法。该模块中每一个聚类算法都有两个变体: 一个是类(class)另一个是函数(function)。类实现了fit方法来从训练数据中学习聚类;对类来说,训练过程得到的标签数据可以在属性 labels_ 中找到。函数接受训练数据返回对应于不同聚类的一个整数标签数组。1.n_clusters:整形,默认=8 ,生成的聚类数,即产生的质心(centroids)数。2.max_iter:整形,默认=300 ,执行一次k-means算法所进行的最大迭代数。

2022-12-30 11:39:58 972 2

原创 XGBoost模型的python实现

实现 XGBoost 分类算法使用的是xgboost库的,具体参数如下:1、max_depth:给定树的深度,默认为32、learning_rate:每一步迭代的步长,很重要。太大了运行准确率不高,太小了运行速度慢。我们一般使用比默认值小一点,0.1左右就好3、n_estimators:这是生成的最大树的数目,默认为1004、objective:给定损失函数,常用的有:– reg:linear– 线性回归– reg:logistic – 逻辑回归。

2022-12-30 10:57:57 3767 1

原创 Adaboost模型的python实现

Adaboost算法是一种集成学习(ensemble learning)方法。在集成学习中,强学习器指的是由多个机器学习模型组合形成的精度更高的模型。而参与组合的模型就被称为是弱学习器。进行预测时使用的是这些弱学习器的联合模型。训练时需要用训练样本依次训练这些弱学习器。典型的集成学习算法是随机森林和boosting算法,Adaboost算法是boosting算法的一种实现版本。

2022-12-30 10:41:34 1779

原创 Apriori算法的python实现

实现Apriori关联规则挖掘是借助mlxtend第三方包,使用步骤如下:1、调用apriori算法挖掘频繁项集,apriori()中min_support也就是最小支持度,默认为0.5;2、根据频繁项集,计算出它们的关联规则,使用association_rules()函数,如下df:就是 apriori 计算后的频繁项集metric:可选值有’support’,‘confidence’,‘lift’,‘leverage’,‘conviction’

2022-12-30 10:27:07 1580

原创 朴素贝叶斯分类的python的实现

sklearn 是 scikit–learn 的简称,是一个基于 Python 的第三方模块。sklearn 库集成了一些常用的机器学习方法,在进行机器学习任务时,并不需要实现算法,只需要简单的调用 sklearn 库中提供的模块就能完成大多数的机器学习任务。在sklearn中,一共有3个朴素贝叶斯的分类算法类:GaussianNB(先验是高斯分布的朴素贝叶斯);BernoulliNB(先验为伯努利分布的朴素贝叶斯);MultinomialNB(先验是多项式分布的朴素贝叶斯)。

2022-12-29 23:26:15 5424 1

原创 决策树和随机森林的python实现

决策树是一种有监督的机器学习算法,该方法可以用于解决分类和回归问题。决策树可以简单地理解为达到某一特定结果的一系列决策。包含分类树(classification tree)和回归树(regression tree)。

2022-12-29 00:17:27 1955

原创 分类算法KNN的python实现

KNN算法是有监督学习中的分类算法,它是一种非参的,惰性的算法模型。非参的意思并不是说这个算法不需要参数,而是意味着这个模型不会对数据做出任何的假设,与之相对的是线性回归(我们总会假设线性回归是一条直线)。也就是说KNN建立的模型结构是根据数据来决定的,这也比较符合现实的情况,毕竟在现实中的情况往往与理论上的假设是不相符的。惰性的意思是指模型在使用前不会被训练,只有当使用的时候才会被训练。KNN算法优点: 简单易用,相比其他算法,KNN算是比较简洁明了的算法。即使没有很高的数学基础也能搞清楚它的原理。

2022-12-28 22:35:39 3880 2

原创 tensflow中的矩阵运算

在使用神经网络时,如果自定义损失函数就需要用tensflow中的矩阵运算来编写,用numpy是不可以的,因为tensflow的基本对象就是tensor,而numpy的处理对象是array不是tensor。

2022-12-15 19:55:40 116

原创 python中zipfile的用法

zipfile是一个用来压缩文件和解压缩文件的模块,它有两个常用的类,分别是ZipFile和ZipInfo。其中ZipFile是主要的类,用来创建和读取zip文件,而ZipInfo是存储的zip文件的每个文件的信息的。如果我们想要压缩或解压缩,首先要实例化一个 ZipFile 对象。ZipFile 的构造方法有两个参数,第一个参数是必选参数,接受一个字符串格式的压缩包名称,第二个参数为可选参数,表示打开模式,类似于文件操作,有r/w/a三种模式,分别代表读、写、添加,默认为r,即读模式。

2022-12-15 19:51:11 261

原创 Adam算法及python实现

Adam算法的发展经历了:SGD->SGDM->SGDNA->AdaGrad->AdaDelta->Adam->Adamax的过程。它是神经网络优化中的常用算法,在收敛速度上比较快,比SGD对收敛速度的纠结上有了很大的改进。但是该算法的学习率是不断减少的,可能收敛不到真正的最优解,实践中经常是前期Adam,后期SGD进行优化。

2022-12-15 18:46:30 3429 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除