自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(65)
  • 收藏
  • 关注

原创 map函数 | python

map()主要用于对 Series 或 DataFrame 中的元素进行映射转换。

2024-03-07 15:35:24 152

原创 循环中的continue和break | python

1.continue的作用是:中断所在循环的当次执行,直接进入下一次2.break的作用是:直接结束所在的循环3.注意事项:continue和break,在for和while循环中作用一致在嵌套循环中,只能作用在所在的循环上,无法对上层循环起作用参考链接。

2024-01-10 14:07:20 440 1

原创 isin() | python

isin()是pandas中一个用于筛选数据的函数,它接受一个可迭代对象作为参数,并返回一个布尔值序列,表示数据是否匹配给定的条件。以下是isin()表示要应用函数的列名或Series。iterable是包含要检查的值的可迭代对象,如列表、元组、集合等。isin()函数会遍历列中的每一个值,并检查它是否存在于iterable中。如果存在,则返回True,否则返回False。以下是一个使用isin()

2024-01-04 15:38:03 505

原创 set() 函数 | Python

set() 函数创建一个无序不重复元素集,可进行关系测试,删除重复数据,还可以计算交集、差集、并集等。

2023-10-16 10:00:59 208

原创 Conda命令

conda基本操作命令记录学习

2023-08-25 15:22:09 182

原创 激活函数 | 神经网络

深度学习往往需要大量时间来处理大量数据,模型的收敛速度是尤为重要的。所以,总体上来讲,训练深度学习网络尽量使用zero-centered数据 (可以经过数据预处理实现) 和zero-centered输出。所以要尽量选择输出具有zero-centered特点的激活函数以加快模型的收敛速度;如果使用 ReLU,那么一定要小心设置 learning rate,而且要注意不要让网络出现很多 “dead” 神经元,如果这个问题不好解决,那么可以试试 Leaky ReLU、PReLU 或者 Maxout;最好不要用

2023-07-11 14:57:34 623

原创 拉格朗日松弛 | 运筹优化

由于大规模整数规划/混合整数规划往往是NP-hard的,所以我们很难直接对这些问题求解。每当遇到这些复杂问题的时候,一个基本思路就是对复杂的优化问题进行分解(decomposition)。拉格朗日松弛便是其中一种常见的分解方式。松弛的意思即为放松约束,松弛方法主要有以下四种:1)线性规划松弛(将整数约束松弛至实数约束)2)对偶规划松弛(求解对偶规划,根据弱对偶定理,求 max \text{max}max 的对偶问题提供了求 min \text{min}min 的原问题的一个下界)

2023-05-29 10:48:38 1654 2

原创 PCA主成分分析 | 机器学习

1 主成分分析概述PC:找到的每个新特征向量,降低特征个数,降维找出数据中最主要的,用最主要的代替原始数据。非监督的降维方法信息衡量指标: 样本方差,方差越大,特征所带信息量越多。2 算法流程输入:n维样本集D=(x(1),x(2),…,x(m)),要降维到的维数n’.输出:降维后的样本集D′1 对所有样本进行中心化(样本-均值)2 计算协方差矩阵XXT3 对矩阵特征值分解4 取出n个特征值对应的特征向量(w1,w2,…,wn′),将所有向量标准化后,组成特征向量矩阵W5矩阵分解:

2023-05-28 17:16:32 662

原创 apply函数 | pandas

apply()`可以应用于Pandas中的Series和DataFrame对象。在Series对象上,`apply()`将会对Series中的每个元素应用指定的函数并返回一个新的Series对象;在DataFrame对象上,`apply()`将会对每一行或者每一列应用指定的函数并返回一个新的DataFrame对象。

2023-05-11 13:13:55 726

原创 Conda pack 环境打包 | Python

工作中涉及到模型固化部署工作,需要将本地的环境移植到新的离线的机器上。conda 常用来执行虚拟环境配置和包管理工作,可以使用conda-pack 进行conda 环境打包和分发。

2023-04-26 10:16:36 7046 2

原创 linux常见操作命令(解压缩常见命令tar、zip)

Linux常见操作命令。可以使用多种命令对文件夹进行压缩,如 gzip、bzip2、zip、tar 等

2023-04-18 14:17:23 724

原创 神经网络参数初始化方法 | 深度学习

神经网络参数的初始值会影响网络的拟合能力和优化效果,如果初始值过大或过小,可能会使得模型的梯度爆炸或梯度消失,导致网络无法收敛或训练效率低下。因此,合适的参数初始化可以提高模型的收敛速度和泛化能力。

2023-04-14 09:27:01 810

原创 dropout | 深度学习

它的主要作用是增加模型的泛化能力,并提高网络的精度。dropout 的概率在 0.1 到 0.5 之间,dropout的概率为0.1表示在每次训练时,对于每个神经元(或节点)来说,有10%的概率被随机删除,不参与该次训练。提高模型鲁棒性:dropout可以随机地破坏参数之间的相关性,促进网络中参数的独立性,从而提高模型的鲁棒性,使得模型对于噪音和扰动的容忍能力更强。增强模型泛化能力:通过dropout操作,模型学习到的特征会更加丰富和多样化,这可以增强模型的泛化能力,提高模型在未见过数据上的表现。

2023-04-14 09:09:26 941

原创 字符串拼接方法 join()

join()`是一个字符串方法,接受一个可迭代的对象(如列表)作为参数,将可迭代对象中的字符串元素拼接成一个字符串,并使用调用该方法的字符串作为分隔符。

2023-04-13 15:07:32 1725

原创 链表基础 | 数据结构

链表通过指针串联在一起的线性结构,每一个节点由两部分组成,一个是数据域一个是指针域(存放指向下一个节点的指针),最后一个节点的指针域指向null(空指针的意思)

2023-04-13 10:46:56 87

原创 One-Hot独热编码

One-Hot编码通常用于处理类别间不具有大小关系的特征,是一种常见的将分类数据转换成数值型数据的方法。它将每个类别映射为一个唯一的数值,并且将该数值表示为该类别所在维度为1,其他维度均为0的向量。

2023-04-12 09:09:21 1230

原创 标准化归一化方法

为了消除数据特征之间的量纲影响,我们需要对特征进行归一化处理,使得不同指标之间具有可比性;

2023-04-12 08:58:37 1514

原创 substr | mysql

MySQL的`SUBSTR()`函数可以用于从指定字符串的指定位置开始提取指定长度的字符。

2023-04-10 17:11:04 409

原创 异常值检测方法 | 数据分析

DBSCAN算法(Density-Based Spatial Clustering of Applications with Noise)的输入和输出如下,对于无法形成聚类簇的孤立点,即为异常点(噪声点)。如果对于参数Eps和MinPts,所选取的数据对象点p为核心点,则找出所有从p密度可达的数据对象点,形成一个簇;IQR 为四分位数间距,是上四分位数QU与下四分位数QL的差值,包含了全部观察值的一半;如果选取的数据对象点 p 是边缘点,选取另一个数据对象点;从数据集中任意选取一个数据对象点p;

2023-04-10 15:20:02 109

原创 range()函数 | python

用于生成一个整数序列,一般形式为range(start, stop[, step]),其中start表示序列开始的值(默认为0),stop表示序列结束的值(不包括该值),step表示序列中相邻两项之间的差(默认为1)。0123413579。

2023-04-10 10:50:55 155

原创 蚁群算法 | 运筹优化

信息素是蚂蚁之间交流的工具之一,当有蚂蚁走过时,它将会在它行进的路上释放出信息素,并且这种信息素会议一定的速率散发掉。每只蚂蚁在选择路径时,会考虑当前信息素浓度和距离等因素,计算出每条路径的选择概率。蚂蚁从起点出发根据信息素浓度,有一定的概率性选择路段,浓度越高,概率越大,逐步回到终点;当有蚂蚁走过,它后面的蚂蚁通过路上信息素的浓度,做出决策,往左还是往右;蚂蚁在路径上释放信息素,并根据路径长度更新信息素浓度。很明显,沿着短边的的路径上信息素将会越来越浓,从而吸引了越来越多的蚂蚁沿着这条路径行驶;

2023-04-07 15:22:37 964

原创 聚类 kmeans | 机器学习

质心 :簇中所有data的均值为质心k:簇的个数

2023-04-06 15:55:27 1295

原创 粒子群算法 | 启发式优化算法

是一种群体智能算法,通过模拟鸟群觅食寻找目标的过程来进行优化,利用群体中的个体对信息的共享,算法通过不断地更新算法中每个粒子的速度与位置来逼近最优解。每个粒子根据自己的历史最优解和群体的最优解来更新速度和位置,从而在搜索空间中寻找最优解。

2023-04-06 14:58:34 2259

原创 类的私有方法 | python

考虑一个类中需要进行某些较为复杂的操作,如果直接将这些操作暴露给外部,可能会导致外部代码直接修改内部状态,进而破坏类的一些内部逻辑。私有方法的存在可以把复杂的逻辑封装在类的内部,对于外部代码来说,只需要关注类对外公开的接口,而不需要关心内部实现细节。私有方法是指在类中定义的方法,它只能在类的内部被访问和调用,而不能在类实例化之后被外部代码访问和调用。在面向对象编程中,私有方法主要用于封装类的实现细节,避免外部代码直接访问和修改内部状态,从而保证类的封装性和安全性。

2023-04-06 14:49:56 1032

原创 模拟退火 | 启发式算法运筹

模拟退火算法的思想借鉴于固体的退火原理,当固体的温度很高的时候,内能比较大,固体的内部粒子处于快速无序运动,当温度慢慢降低的过程中,固体的内能减小,粒子的慢慢趋于有序,最终,当固体处于常温时,内能达到最小,此时,粒子最为稳定。模拟退火算法的核心是温度下降,随着温度的降低,接受劣解的概率逐渐降低,最终趋于0。如果当前解是一个局部最优解,即在附近的解中没有比它更好的解,那么一般情况下,该算法仍然会接受这个解,并以一定的概率接受更劣的解,这样就有可能跳出局部最优解并进一步找到全局最优解。这是一种贪心的思想。

2023-04-03 15:37:44 1432

原创 遗传算法 |运筹优化

借鉴了生物学中的遗传学和进化论的思想,将待优化问题的解看作进化中的个体,通过基因重组、突变和选择等遗传操作来实现逐代进化,最终找到最优解。

2023-04-03 15:30:16 3719

原创 合并merge pandas

函数用于将两个或多个数据集按照一定的方式合并起来。举个例子,假设我们有两个数据集。现在我们想要将这两个数据集按照。执行上述语句后,得到的。

2023-03-30 14:29:53 134

原创 时间序列预测方法汇总

时序问题本质都是回归问题,只是回归的方式(线性回归、树模型、深度学习等)有一定的区别。

2023-03-24 10:49:12 470

原创 list列表生成式 | python

是在一个中括号里包含一个表达式,然后是一个for语句,然后是0个或多个for或者if语句。下面通过例题来对列表生成式进行深入的理解。

2023-03-24 10:23:24 121

原创 Python之count函数

原文链接:https://blog.csdn.net/qq_61210648/article/details/126691890。end — 字符串中结束搜索的位置,字符中第一个字符的索引为0,。默认为字符串的最后一个位置。start — 字符串开始搜索的位置,默认为第一个字符,第一个字符索引值为0。返回值 — 返回子字符串在字符串中出现的次数。统计子字符串在总字符串里边的出现次数。sub — 搜索的子字符串。count函数的主要作用。

2023-03-17 14:10:43 244

原创 python tolist()函数

python tolist()函数

2023-03-14 09:35:00 1498

原创 iloc[ ]函数(Pandas库)

iloc[ ]函数(Pandas库)

2023-03-14 09:13:58 6139

原创 列表list添加append()函数 | Python

向列表末尾添加一个元素

2023-02-23 09:22:53 460

原创 期望 | 数理统计

平均、估摸、大概用期望来表达。

2023-02-21 10:36:09 104

原创 Series、list | pandas

一种类似于一维数组的对象,它由一组数据(不同数据类型)以及一组与之相关的数据标签(即索引)组成。# 左侧为索引,右侧是数据创建 创建一个具有标签索引的Series​。

2023-02-21 09:55:58 197

原创 交叉验证 | 机器学习

交叉验证**目的:**交叉重复的使用数据集分为训练集和测试集,这次用于训练集,下次可能用于测试集。一般用在数据量不是很充条件下,评估模型好坏。如果样本大于一万条的话,我们一般随机的把数据分成三份,一份为训练集(Training Set),一份为验证集(Validation Set),最后一份为测试集(Test Set)。用训练集来训练模型,用验证集来评估模型预测的好坏和选择模型及其对应的参数。把最终得到的模型再用于测试集,最终决定使用哪个模型以及对应参数。简单:30%测试集,70%训练集(2)s折交叉

2023-02-20 10:32:36 1772

原创 Pandas-排序函数sort_values()

Pandas-排序函数sort_values()

2023-02-19 22:21:50 493

原创 Mysql | Error Code: 1153 - Got a packet bigger than ‘max_allowed_packet‘ bytes

max_allowed_packet 参数限制了Mysql服务能够接受的数据包大小,数据包超过设置的值时,则会报错

2023-02-17 10:33:35 683

原创 ps修改文字

ps修改文字

2023-02-01 20:20:22 973

原创 感受野-神经网络基础

感受野-神经网络基础

2023-02-01 17:13:18 92

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除