小雲啊-CSDN博客

原创 map函数 | python

map()主要用于对 Series 或 DataFrame 中的元素进行映射转换。

2024-03-07 15:35:24 152

原创循环中的continue和break | python

1.continue的作用是:中断所在循环的当次执行，直接进入下一次2.break的作用是:直接结束所在的循环3.注意事项:continue和break，在for和while循环中作用一致在嵌套循环中，只能作用在所在的循环上，无法对上层循环起作用参考链接。

2024-01-10 14:07:20 440 1

isin()是pandas中一个用于筛选数据的函数，它接受一个可迭代对象作为参数，并返回一个布尔值序列，表示数据是否匹配给定的条件。以下是isin()表示要应用函数的列名或Series。iterable是包含要检查的值的可迭代对象，如列表、元组、集合等。isin()函数会遍历列中的每一个值，并检查它是否存在于iterable中。如果存在，则返回True，否则返回False。以下是一个使用isin()

2024-01-04 15:38:03 505

原创 set() 函数 | Python

set() 函数创建一个无序不重复元素集，可进行关系测试，删除重复数据，还可以计算交集、差集、并集等。

2023-10-16 10:00:59 208

原创 Conda命令

conda基本操作命令记录学习

2023-08-25 15:22:09 182

原创激活函数 | 神经网络

深度学习往往需要大量时间来处理大量数据，模型的收敛速度是尤为重要的。所以，总体上来讲，训练深度学习网络尽量使用zero-centered数据 (可以经过数据预处理实现) 和zero-centered输出。所以要尽量选择输出具有zero-centered特点的激活函数以加快模型的收敛速度；如果使用 ReLU，那么一定要小心设置 learning rate，而且要注意不要让网络出现很多 “dead” 神经元，如果这个问题不好解决，那么可以试试 Leaky ReLU、PReLU 或者 Maxout；最好不要用

2023-07-11 14:57:34 623

原创拉格朗日松弛 | 运筹优化

由于大规模整数规划/混合整数规划往往是NP-hard的，所以我们很难直接对这些问题求解。每当遇到这些复杂问题的时候，一个基本思路就是对复杂的优化问题进行分解（decomposition）。拉格朗日松弛便是其中一种常见的分解方式。松弛的意思即为放松约束，松弛方法主要有以下四种：1）线性规划松弛（将整数约束松弛至实数约束）2）对偶规划松弛（求解对偶规划，根据弱对偶定理，求 max \text{max}max 的对偶问题提供了求 min \text{min}min 的原问题的一个下界）

2023-05-29 10:48:38 1654 2

原创 PCA主成分分析 | 机器学习

1 主成分分析概述PC：找到的每个新特征向量，降低特征个数，降维找出数据中最主要的，用最主要的代替原始数据。非监督的降维方法信息衡量指标：样本方差，方差越大，特征所带信息量越多。2 算法流程输入：n维样本集D=(x(1),x(2),…,x(m))，要降维到的维数n’.输出：降维后的样本集D′1 对所有样本进行中心化（样本-均值）2 计算协方差矩阵XXT3 对矩阵特征值分解4 取出n个特征值对应的特征向量(w1,w2,…,wn′)，将所有向量标准化后，组成特征向量矩阵W5矩阵分解：

2023-05-28 17:16:32 662

原创 apply函数 | pandas

apply()`可以应用于Pandas中的Series和DataFrame对象。在Series对象上，`apply()`将会对Series中的每个元素应用指定的函数并返回一个新的Series对象；在DataFrame对象上，`apply()`将会对每一行或者每一列应用指定的函数并返回一个新的DataFrame对象。

2023-05-11 13:13:55 726

原创 Conda pack 环境打包 | Python

工作中涉及到模型固化部署工作，需要将本地的环境移植到新的离线的机器上。conda 常用来执行虚拟环境配置和包管理工作，可以使用conda-pack 进行conda 环境打包和分发。

2023-04-26 10:16:36 7046 2

原创 linux常见操作命令（解压缩常见命令tar、zip）

Linux常见操作命令。可以使用多种命令对文件夹进行压缩，如 gzip、bzip2、zip、tar 等

2023-04-18 14:17:23 724

原创神经网络参数初始化方法 | 深度学习

神经网络参数的初始值会影响网络的拟合能力和优化效果，如果初始值过大或过小，可能会使得模型的梯度爆炸或梯度消失，导致网络无法收敛或训练效率低下。因此，合适的参数初始化可以提高模型的收敛速度和泛化能力。

2023-04-14 09:27:01 810

原创 dropout | 深度学习

它的主要作用是增加模型的泛化能力，并提高网络的精度。dropout 的概率在 0.1 到 0.5 之间，dropout的概率为0.1表示在每次训练时，对于每个神经元（或节点）来说，有10%的概率被随机删除，不参与该次训练。提高模型鲁棒性：dropout可以随机地破坏参数之间的相关性，促进网络中参数的独立性，从而提高模型的鲁棒性，使得模型对于噪音和扰动的容忍能力更强。增强模型泛化能力：通过dropout操作，模型学习到的特征会更加丰富和多样化，这可以增强模型的泛化能力，提高模型在未见过数据上的表现。

2023-04-14 09:09:26 941

原创字符串拼接方法 join()

join()`是一个字符串方法，接受一个可迭代的对象(如列表)作为参数，将可迭代对象中的字符串元素拼接成一个字符串，并使用调用该方法的字符串作为分隔符。

2023-04-13 15:07:32 1725

原创链表基础 | 数据结构

链表通过指针串联在一起的线性结构，每一个节点由两部分组成，一个是数据域一个是指针域（存放指向下一个节点的指针），最后一个节点的指针域指向null（空指针的意思）

2023-04-13 10:46:56 87

原创 One-Hot独热编码

One-Hot编码通常用于处理类别间不具有大小关系的特征，是一种常见的将分类数据转换成数值型数据的方法。它将每个类别映射为一个唯一的数值，并且将该数值表示为该类别所在维度为1，其他维度均为0的向量。

2023-04-12 09:09:21 1230

原创标准化归一化方法

为了消除数据特征之间的量纲影响，我们需要对特征进行归一化处理，使得不同指标之间具有可比性；

2023-04-12 08:58:37 1514

原创 substr | mysql

MySQL的`SUBSTR()`函数可以用于从指定字符串的指定位置开始提取指定长度的字符。

2023-04-10 17:11:04 409

原创异常值检测方法 | 数据分析

DBSCAN算法（Density-Based Spatial Clustering of Applications with Noise）的输入和输出如下，对于无法形成聚类簇的孤立点，即为异常点（噪声点）。如果对于参数Eps和MinPts，所选取的数据对象点p为核心点，则找出所有从p密度可达的数据对象点，形成一个簇；IQR 为四分位数间距，是上四分位数QU与下四分位数QL的差值，包含了全部观察值的一半；如果选取的数据对象点 p 是边缘点，选取另一个数据对象点；从数据集中任意选取一个数据对象点p；

2023-04-10 15:20:02 109

原创 range()函数 | python

用于生成一个整数序列，一般形式为range(start, stop[, step])，其中start表示序列开始的值（默认为0），stop表示序列结束的值（不包括该值），step表示序列中相邻两项之间的差（默认为1）。0123413579。

2023-04-10 10:50:55 155

原创蚁群算法 | 运筹优化

信息素是蚂蚁之间交流的工具之一，当有蚂蚁走过时，它将会在它行进的路上释放出信息素，并且这种信息素会议一定的速率散发掉。每只蚂蚁在选择路径时，会考虑当前信息素浓度和距离等因素，计算出每条路径的选择概率。蚂蚁从起点出发根据信息素浓度，有一定的概率性选择路段，浓度越高，概率越大，逐步回到终点；当有蚂蚁走过，它后面的蚂蚁通过路上信息素的浓度，做出决策，往左还是往右；蚂蚁在路径上释放信息素，并根据路径长度更新信息素浓度。很明显，沿着短边的的路径上信息素将会越来越浓，从而吸引了越来越多的蚂蚁沿着这条路径行驶；

2023-04-07 15:22:37 964

原创聚类 kmeans | 机器学习

质心：簇中所有data的均值为质心k：簇的个数

2023-04-06 15:55:27 1295

原创粒子群算法 | 启发式优化算法

是一种群体智能算法，通过模拟鸟群觅食寻找目标的过程来进行优化，利用群体中的个体对信息的共享，算法通过不断地更新算法中每个粒子的速度与位置来逼近最优解。每个粒子根据自己的历史最优解和群体的最优解来更新速度和位置，从而在搜索空间中寻找最优解。

2023-04-06 14:58:34 2259

原创类的私有方法 | python

考虑一个类中需要进行某些较为复杂的操作，如果直接将这些操作暴露给外部，可能会导致外部代码直接修改内部状态，进而破坏类的一些内部逻辑。私有方法的存在可以把复杂的逻辑封装在类的内部，对于外部代码来说，只需要关注类对外公开的接口，而不需要关心内部实现细节。私有方法是指在类中定义的方法，它只能在类的内部被访问和调用，而不能在类实例化之后被外部代码访问和调用。在面向对象编程中，私有方法主要用于封装类的实现细节，避免外部代码直接访问和修改内部状态，从而保证类的封装性和安全性。

2023-04-06 14:49:56 1032

原创模拟退火 | 启发式算法运筹

模拟退火算法的思想借鉴于固体的退火原理，当固体的温度很高的时候，内能比较大，固体的内部粒子处于快速无序运动，当温度慢慢降低的过程中，固体的内能减小，粒子的慢慢趋于有序，最终，当固体处于常温时，内能达到最小，此时，粒子最为稳定。模拟退火算法的核心是温度下降，随着温度的降低，接受劣解的概率逐渐降低，最终趋于0。如果当前解是一个局部最优解，即在附近的解中没有比它更好的解，那么一般情况下，该算法仍然会接受这个解，并以一定的概率接受更劣的解，这样就有可能跳出局部最优解并进一步找到全局最优解。这是一种贪心的思想。

2023-04-03 15:37:44 1432

原创遗传算法 |运筹优化

借鉴了生物学中的遗传学和进化论的思想，将待优化问题的解看作进化中的个体，通过基因重组、突变和选择等遗传操作来实现逐代进化，最终找到最优解。

2023-04-03 15:30:16 3719

原创合并merge pandas

函数用于将两个或多个数据集按照一定的方式合并起来。举个例子，假设我们有两个数据集。现在我们想要将这两个数据集按照。执行上述语句后，得到的。

2023-03-30 14:29:53 134

原创时间序列预测方法汇总

时序问题本质都是回归问题，只是回归的方式（线性回归、树模型、深度学习等）有一定的区别。

2023-03-24 10:49:12 470

原创 list列表生成式 | python

是在一个中括号里包含一个表达式,然后是一个for语句,然后是0个或多个for或者if语句。下面通过例题来对列表生成式进行深入的理解。

2023-03-24 10:23:24 121

原创 Python之count函数

原文链接：https://blog.csdn.net/qq_61210648/article/details/126691890。end — 字符串中结束搜索的位置，字符中第一个字符的索引为0,。默认为字符串的最后一个位置。start — 字符串开始搜索的位置，默认为第一个字符，第一个字符索引值为0。返回值 — 返回子字符串在字符串中出现的次数。统计子字符串在总字符串里边的出现次数。sub — 搜索的子字符串。count函数的主要作用。

2023-03-17 14:10:43 244

原创 python tolist()函数

python tolist()函数

2023-03-14 09:35:00 1498

原创 iloc[ ]函数（Pandas库）

iloc[ ]函数（Pandas库）

2023-03-14 09:13:58 6139

原创列表list添加append()函数 | Python

向列表末尾添加一个元素

2023-02-23 09:22:53 460

原创期望 | 数理统计

平均、估摸、大概用期望来表达。

2023-02-21 10:36:09 104

原创 Series、list | pandas

一种类似于一维数组的对象，它由一组数据（不同数据类型）以及一组与之相关的数据标签（即索引）组成。# 左侧为索引，右侧是数据创建创建一个具有标签索引的Series。

2023-02-21 09:55:58 197

原创交叉验证 | 机器学习

交叉验证**目的：**交叉重复的使用数据集分为训练集和测试集，这次用于训练集，下次可能用于测试集。一般用在数据量不是很充条件下，评估模型好坏。如果样本大于一万条的话，我们一般随机的把数据分成三份，一份为训练集（Training Set），一份为验证集（Validation Set），最后一份为测试集（Test Set）。用训练集来训练模型，用验证集来评估模型预测的好坏和选择模型及其对应的参数。把最终得到的模型再用于测试集，最终决定使用哪个模型以及对应参数。简单：30%测试集，70%训练集（2）s折交叉

2023-02-20 10:32:36 1772

空空如也

空空如也