springtostring-CSDN博客

原创时钟(CLOCK)置换算法

当调入进程所请求的页面时，如果内存中已经没有空闲块了，则必须按照某种算法将内存中的若干页面淘汰至外存。用于选择淘汰页面的算法称为页面置换算法，置换算法的好坏，将直接影响到请求分页系统的性能。FIFO置换算法和LRU置换算法的思想都比较容易理解，页面置换的推导也是简单的。但是CLOCK置换算法比较难从书上获取准确的概念了，教材上的定义替换指针的位置描述得不清楚，网上的clock例子也...

2018-12-28 21:44:19 54423 30

原创遗传算法解决TSP问题(Pyhton代码)

遗传算法的原理参考维基百科：https://zh.wikipedia.org/wiki/%E9%81%97%E4%BC%A0%E7%AE%97%E6%B3%95遗传算法流程图：遗传算法的思想和流程都是很简单的，但是运用在具体应用时却会常常无从下手。如何编码解码，如何进行交叉是两个难点。本文以用遗传算法解决旅行商问题(TSP)为例。问题描述：现有34个城市，已知其坐标；从其中某一...

2018-09-05 20:43:20 24335 50

原创模拟退火算法实现寻找函数最值

模拟退火的算法思想：模拟退火算法从某一较高初温出发，伴随温度参数的不断下降,结合概率突跳特性在解空间中随机寻找目标函数的全局最优解，即在局部最优解能概率性地跳出并最终趋于全局最优。模拟退火算法模板：初始温度T=100冷却速率rate=0.99while T>1: 随机生成一个解 x=random 随机解的适应度 y=f(x) 如果...

2018-08-30 15:58:53 5679

原创遗传算法实现寻找函数最值

遗传算法的原理参考维基百科：https://zh.wikipedia.org/wiki/%E9%81%97%E4%BC%A0%E7%AE%97%E6%B3%95遗传算法流程图：遗传算法的思想和流程都是很简单的，但是运用在具体应用时却会常常无从下手。如何编码解码，如何进行交叉是两个难点。遗传算法的最简单例子——寻找函数f(x)=x+5sin(5x)+2cos(4x)在区间[0,10]...

2018-08-30 15:28:20 2023

粒子群算法简介粒子群优化（Particle Swarm Optimization, PSO），又称微粒群算法，是由J. Kennedy和R. C. Eberhart等于1995年开发的一种演化计算技术，来源于对一个简化社会模型的模拟。其中“群”来源于微粒群匹配M. M. Millonas在开发应用于人工生命的模型时所提出的群体智能的5个基本原则。“粒子（particle）”是一个折衷的选择，因...

2018-08-30 14:43:40 9461

原创 rdt 可靠数据传输协议

计算机网络的设计基本方案是复杂化，多功能化应用层，运输层的协议设计，从而使得网络层，链路层，物理层变得相对简单，网络搭建的物质条件变得简单。由于网络层较为简单，采用了无连接的协议，在不可靠信道上传输，导致数据传输是不可靠的。为了保证数据传输的可靠性，我们选择在运输层采用复杂的rdt（可靠数据传输协议），以完成网络的可靠性。原理图如下所示：rdt协议经历了rdt1.0，rdt2.0，rd...

2018-05-20 11:22:54 33934 21

原创 sklearn marco vs micro

多类别任务的评估指标一般有的计算方式有mirco和marco之分，micro使用全体样本计算指标，marco使用各类别的指标均值。以F1_score为例，二分类的F1_score计算公式为：F1=2×Precision×RecallPrecision+RecallF1 = \frac{2 \times Precision \times Recall}{Precision + Recall}F1=Precision+Recall2×Precision×Recall多分类F1_score分为：mi

2021-11-20 21:51:14 936

原创 lightgbm 自定义metric函数

lgb 自定义函数模板：# f(preds: array, train_data: Dataset) -> name: str, eval_result: float, is_higher_better: booldef f(preds, train_data): ''' :param preds: array, 预测值 :param train_data: lgb Dataset, lgb的传入数据集 :return: ''' ### 返回

2021-11-10 14:37:14 4152 1

原创 pandas dataframe 两列转字典

在数据处理时，时常需要将数据表的两列转化为字典映射形式df[[‘A’,‘B’]] -----> dict(key:A, value:B)方法一：使用zipd = dict(zip(df['A'],df['B']))import pandas as pdimport numpy as nptest_dict = {'id':[1,2,3,4,5,6],'name':['Alice','Bob','Cindy','Eric','Helen','Grace '],'gender':[0,

2021-10-26 19:08:29 6277

原创 CTR 树模型-特征工程代码

刚参加完一场CTR比赛，原本打算使用NN解决问题，后期发现树模型效果意外的好，学习了一些树模型处理CTR问题的特征工程代码。曝光特征，交叉特征(count, nunique)# 统计特征 count,nunqiuedef cnt_stat(df, group_cols, target_col=None, use_cnt=True, use_nunique=True): if isinstance(group_cols, list): col_name = '_'.join(gr

2021-09-28 11:45:29 411

原创 lightgbm 各任务基本代码

lightgbm适用于多个任务(回归，二分类，多分类)，具体的参数需要做出变化，下面给出各任务的基本代码。回归import sklearnfrom sklearn import datasetsfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import roc_auc_score,mean_squared_errorimport numpy as npimport lightgbm as lgb

2021-09-27 21:58:56 836

原创 leetcode1081. 不同字符的最小子序列

1081. 不同字符的最小子序列返回 s 字典序最小的子序列，该子序列包含 s 的所有不同字符，且只包含一次。示例 1：输入：s = “bcabc”输出：“abc”示例 2：输入：s = “cbacdcbc”输出：“acdb”1 <= s.length <= 1000s 由小写英文字母组成本题与316. 去除重复字母是一样的题目。如果没有接触过单调栈很难掌握本道题，看过一遍题解代码后，再做一次还是不会。如果只是知道最简单的单调栈，那么自己写这道题也会比较难

2021-08-18 22:30:48 274

原创 leetcode 丑数

264. 丑数 II给你一个整数 n ，请你找出并返回第 n 个丑数。丑数就是只包含质因数 2、3 和/或 5 的正整数。示例 1：输入：n = 10输出：12解释：[1, 2, 3, 4, 5, 6, 8, 9, 10, 12] 是由前 10 个丑数组成的序列。示例 2：输入：n = 1输出：1解释：1 通常被视为丑数。首先肯定不能遍历各个整数，判断其是否只包含质因数 2、3 和 5，这样算法会超时。方法一：优先队列+hash使用优先队列记录模拟过程，每次将最小的数

2021-07-19 18:35:27 184

原创算法导论编辑距离

编辑距离是动态规划算法学习的经典问题。leetcode有一道面试常考的72. 编辑距离算法导论上的编辑距离实验要比leetcode上的实验更加的难算法导论书编辑距离习题：为了将一个文本串x[1..m]x [ 1.. m ]x[1..m] 转换为目标串y[1..n]y [ 1.. n ]y[1..n]，我们可以使用多种变换操作。我们的目标是，给定xxx 和yyy ，求将xxx转换为yyy的一个变换操作序列。我们使用一个数组zzz 保存中间结果，假定它足够大，可存下中间结果的所有字符。初始时，zzz是空

2021-07-18 22:29:38 399 1

原创 numpy 强制类型转换问题

今天用numpy遇到一个关于类型转换的问题，import numpy as npA = np.array([1,2,3,4,5,6,7,8,9]) A[0]=3.2print(A)# [3 2 3 4 5 6 7 8 9]可以发现A[0]=3.2,被强制转换成整型3了。发生的原因是A的类型是np.int，赋值浮点数，会自动转为整型。这样的问题一旦出现很难发现，在写成程序时要提前想好要用的np类型。补充，两个整型np.array做运算时，会根据运算自动转换类型。A = np.array

2021-06-24 13:27:13 831

原创 leetcode 1872. 石子游戏VIII

1872. 石子游戏 VIIIAlice 和 Bob 玩一个游戏，两人轮流操作， Alice 先手。总共有 nnn 个石子排成一行。轮到某个玩家的回合时，如果石子的数目大于 1 ，他将执行以下操作：选择一个整数$ x > 1$ ，并且移除最左边的 xxx 个石子。将移除的石子价值之和累加到该玩家的分数中。将一个新的石子放在最左边，且新石子的值为被移除石子值之和。当只剩下一个石子时，游戏结束。Alice 和 Bob 的分数之差为 (Alice 的分数 - Bob 的分数) 。 Alic

2021-05-25 19:49:18 264

原创 leetcode面试题 05.04 下一个数

下一个数。给定一个正整数，找出与其二进制表达式中1的个数相同且大小最接近的那两个数（一个略大，一个略小）。示例1: 输入：num = 2（或者0b10）输出：[4, 1] 或者（[0b100, 0b1]）示例2: 输入：num = 1 输出：[2, -1]提示:num的范围在[1, 2147483647]之间；如果找不到前一个或者后一个满足条件的正数，那么输出 -1。本题知识点在于位运算，熟悉位运算能较快解题。如何取大一点的数：从右向左遍历num二进制表达式，将第一次出现

2021-05-08 09:28:30 209 1

原创 python 多进程中的变量问题.

最近写python程序，发现python的for循环太慢了，希望能通过多进程加速，加快程序速度。程序功能：期望把每一次循环的结果都保存在一个字典dict里，但是实际输出发现字典是空的，程序功能类似如下：import torchimport torch.nn as nnimport timeimport multiprocessingMP = {}def putone(x): a,b=x[0],x[1] b[a]=2*a MP[a] = 2*aif __nam

2021-05-04 17:39:03 1296

原创 leetcode403 青蛙过河

403. 青蛙过河一只青蛙想要过河。假定河流被等分为若干个单元格，并且在每一个单元格内都有可能放有一块石子（也有可能没有）。青蛙可以跳上石子，但是不可以跳入水中。给你石子的位置列表 stones（用单元格序号升序表示），请判定青蛙能否成功过河（即能否在最后一步跳至最后一块石子上）。开始时，青蛙默认已站在第一块石子上，并可以假定它第一步只能跳跃一个单位（即只能从单元格 1 跳至单元格 2 ）。如果青蛙上一步跳跃了 k 个单位，那么它接下来的跳跃距离只能选择为 k - 1、k 或 k + 1

2021-04-30 22:33:52 109

原创 PyTorch nn.MultiHead() 参数理解

之前一直是自己实现MultiHead Self-Attention程序，代码段又臭又长。后来发现Pytorch 早已经有API nn.MultiHead()函数，但是使用时我却遇到了很大的麻烦。首先放上官网说明：MultiHead(Q,K,V)=Concat(head1,…,headh)WOwhere headi=Attention(QWiQ,KWiK,VWiV)MultiHead(Q,K,V)=Concat(head_1,…,head_h)W_O\quad where\ hea

2021-02-22 22:21:56 9858

原创 leetcode410. 分割数组的最大值

410. 分割数组的最大值给定一个非负整数数组 nums和一个整数 m ，你需要将这个数组分成 m个非空的连续子数组。设计一个算法使得这 m个子数组各自和的最大值最小。示例 1：输入：nums = [7,2,5,10,8], m = 2输出：18解释：一共有四种方法将 nums 分割为 2 个子数组。其中最好的方式是将其分为 [7,2,5] 和 [10,8] 。因为此时这两个子数组各自的和的最大值为18，在所有情况中最小。示例 2：输入：nums = [1,2,3,4,5], m =

2021-02-21 23:15:52 127

原创 BPRMF算法(Pytorch实现)

1. 写作目的首先感叹一下推荐系统的子领域是这么的丰富，可以有召回阶段的传统推荐、精排阶段的CTR、序列化推荐、对话推荐、推荐系统与图神经网络结合、推荐系统与知识图谱结合、推荐系统与NAS技术结合。论文看得眼花缭乱，慕然回首，发现自己根本没入门。 BPR算法是基础的推荐算法，在我入门推荐系统时很容易理解BPR算法，但是当我想实现完整的推荐算法时，却困难重重，如何加载数据，如何进行负采样，如何写评价指标函数，让我很烦恼。参照王翔老师的NGCF算法 Tensorflow版和 PyTorch版自己

2021-02-19 16:14:26 3921 5

原创 leetcode 1760. 袋子里最少数目的球

题目：给你一个整数数组 nums ，其中 nums[i] 表示第 i 个袋子里球的数目。同时给你一个整数** maxOperations** 。你可以进行如下操作至多 maxOperations 次：选择任意一个袋子，并将袋子里的球分到 2 个新的袋子中，每个袋子里都有正整数个球。比方说，一个袋子里有5个球，你可以把它们分到两个新袋子里，分别有1个和 4 个球，或者分别有 2 个和 3 个球。你的开销是单个袋子里球数目的最大值，你想要最小化开销。请你返回进行上述操作后的最小开销。示例：输入

2021-02-16 23:28:05 256

原创 Amazon Review Dataset数据集介绍

Amazon Review Dataset数据集记录了用户对亚马逊网站商品的评价，是推荐系统的经典数据集，并且Amazon一直在更新这个数据集，根据时间顺序，Amazon数据集可以分成三类：2013 版 https://nijianmo.github.io/amazon/index.html2014版 http://jmcauley.ucsd.edu/data/amazon/index_2014.html2018版 http://snap.stanford.edu/data/web-Amazon-

2021-01-29 22:25:05 23479 11

空空如也

空空如也