hhy不许摸鱼-CSDN博客

原创 Could not resolve host: github.com问题解决

git clone的时候发现机器无法解析github.com，其实应该改用ssh协议去clone，但是我用的是公用的机器，密钥对一直没配置好，所以也就堵死了。那么如果想让机器能解析github.com，（机器本身没有ping命令）我在我本机器ping github.com，看到ip，然后把ip写入机器的。

2024-01-30 15:56:53 591

原创 PYG中torch_scatter, torch_sparse等pip安装包错解决

【代码】PYG中torch_scatter, torch_sparse等pip安装包错解决。

2024-01-20 00:13:57 467

原创 Unity脚本判断场景内物体是否为Root Prefab的方法

获得距离最近的Prefab Object地址，然后通过字符串操作取出文件名，判断当前的Gameobject.name是否与地址中的文件名相符，如果文件名相同，那么就是根prefab，如果不是，说明它存在一个非本身的prefab root。很抽象，会存在root prefab下包含了一个包含prefab的非prefab，很绕，但是你懂了就能懂了，这样的话，最近的prefab object就成了children prefab自己了，而不是隔了一个非prefab的root prefab。

2023-10-10 18:10:02 449

原创 Kibana报错:The .kibana_8.10.0 alias refers to a newer version of Kibana: v8.10.0

查了网上很多内容，都不是很有用，然后对接了elastic search数据库的信息，发现es更新了，然后我就想到，那应该是kibana的内容会作为.kibana index保存在es数据库当中，所以当es数据库升级的时候，.kibana_8.9.0会升级为.kibana_8.10.0，当我启动8.9.0版本的kibana时，会从es进行数据迁移，但是.kibana_8.10.0并不符合当前版本的kibana所以报错。

2023-09-17 01:11:12 496

原创预训练Bert添加new token的问题

最近遇到使用transformers的AutoTokenizer的时候，修改vocab.txt中的[unused1]依然无法识别相应的new token。我将[unused1]修改为了[TRI]，句子中的[TRI]并没有被整体识别，而是识别为了[,T,RI,]。所以可以认定，Bert对带有方括号的token统一按special token处理，所以要使用。若去掉[TRI]的方括号，问题就消失了。来添加此类token。

2023-09-04 10:28:44 704

原创 Elasticsearch在现有index上添加field方法

不需要创建新的index再进行数据迁移，update一下mapping就行。

2023-09-01 17:30:05 140

原创 Linux-crontab使用问题解决

另外有个node，就是如果要使用python命令，不能直接调用python，因为它相当于开了个新shell运行命令，需要你给明python interpreter的地址，所以把绝对地址写全即可。1.多个运行指令之间没有耦合关系，分别独立，则可以直接分为两个任务写，也就是两行。添加完任务之后，restart该程序，输入密码。选择文本编辑方式，写入要运行的脚本，以及时间要求。把多条命令在同一个任务里面拼接起来，举例就是。将标准输出重定向到对应的文件中，形成log。2.如果多个任务有一定的关联，那么需要使用。

2023-08-29 17:10:53 287

原创【Datawhale 科大讯飞-基于论文摘要的文本分类与关键词抽取挑战赛】机器学习方法baseline

计算出每个词的 TF-IDF 值后，使用 TF-IDF 计算得到的数值向量替代原文本即可实现基于 TF-IDF 的文本特征提取。这里将对应的文本token转化为vector，方便后面进行计算，这里的CountVectorizer()使用的是BOW模型，所以编码后的维度应该是词表的大小。IDF 指 inverse document frequence，即逆文档频率，指包含某个词的文档数占语料库总文档数的比例。当然这还没完，之前的CountVectorizer()是基于BOW模型的。结果也会有显而易见的提高。

2023-08-17 01:07:38 254

原创使用Bert预训练模型处理序列推荐任务

最近的工作有涉及该任务，整理一下思路以及代码细节。

2023-08-06 01:36:20 877

原创 Stable-Diffusion-Webui部署SDXL0.9报错参数shape不匹配解决

已经在model/stable-diffusion文件夹下放进去了sdxl0.9的safetensor文件，但是在切换model的时候，会报错model的shape不一致。update一些web-ui项目就可以，因为当前项目太老了，没有使用最新的版本。

2023-07-26 22:30:07 1943

原创在LLM的支持下使游戏NPC具有记忆化的方法

更理想的回答需要智能体从Klaus在研究项目上花费的时间的记忆中进行泛化，生成一个更高层次的反思，即Klaus对研究充满热情，同时也能够认识到Maria在自己的研究中付出了努力（尽管在不同的领域），从而产生一个反思，即他们有共同的兴趣爱好。这种行为的基础是一种新颖的智能体架构，它将一个大型语言模型与合成和检索相关信息的机制相结合，以在语言模型的输出上进行条件控制。因为LLM的输入tokens是有限制的，所以伴随着问题的记忆context是有窗口大小限制的，将所有的记忆输入LLM并不现实。

2023-07-18 22:17:29 1404

原创使用Hugging Face预训练Bert处理下游任务显存占用过多

具体的方法进入https://huggingface.co/huawei-noah/TinyBERT_General_4L_312D/tree/main链接中，download其中的model参数，以及词典表、config。在使用HuggingFace的transformer下的BertForMaskedLM进行预训练语言模型的load时，bert会占用很大的显存。这里可以考虑使用TinyBERT，速度和显存上都能得到很大的优化。在load模型时load这些文件就可以了。

2023-07-14 22:07:34 841

原创百度-知识中台研发组-Python开发实习生面试记录

c++写的，一开始用队列写的按行遍历，然后告诉我要考虑换行，所以就用数学的方法对于每一个第2^i - 1个节点输出内容后输出换行。一面了一个多小时，问题除了数据的索引b树答成了另一个东西，别的基本都答来了。这个问题好像是一开始问的，我讲了ripple net的协同过滤，然后才引出的Q3。所以这件事情让我挺气愤的，后来百度另一个岗位又要我简历来着，情绪上头也不想投了。我：是用的哈希，具体的哈希函数不太了解，但是知道解决冲突的办法是红黑树。思路挺简单的，sort后，固定不同的元素，然后双指针遍历。

2023-07-11 21:16:19 292

原创智谱AI-算法实习生（知识图谱方向）实习面试记录

没错和我的经历可以说是match得不能再match了，但是还是挂了hh。

2023-07-03 19:09:53 972 1

原创加载Bert预训练模型时报错：huggingface_hub.utils._validators.HFValidationError

很简单，我download下来的代码没有并没有模型参数的文件，所以去。里面放的是模型参数文件所在的文件夹而不是文件本身。下载然后放到文件夹里就好了。

2023-07-01 00:02:27 4771 6

原创 GPU资源紧张时PYG NeighborSampler报错原因分析

所以就仔细分析了一下报错内容，发现sampler代码内.cuda()默认使用了gpu:0，所以导致了cuda out of mem。所以我进入pyg包内将其修改为了。环境是gpu：0的资源已经用尽，使用os设置使用gpu：3，但是总是一到图采样就cuda out of mem。经过错误排除不是数据问题，知识单方面的函数问题。在NeighborSampler处报错如下。

2023-06-16 20:48:13 341

原创 GraphTrip论文笔记【Information Fusion 92 (2023)】

GraphTrip论文笔记

2023-02-20 12:23:12 669 2

原创空间函数某一点梯度与法向量求法的区别

突然遇到一个问题，感觉梯度和空间曲线某一点的法向量计算方法极为“类似”，但是定义告诉我这两个绝对不是一个概念。搜遍了好多梯度的讲解都没能有人对这个点进行区分。其实本质上是对空间曲线理解的不同，梯度把它理解为了一个多元自变量决定一个因变量的函数；而法向量计算时把它理解为了三个坐标决定空间一个定点。

2022-11-05 01:06:00 671

原创 An Attentional Recurrent Neural Networkfor Personalized Next Location Recommendation【ARNN】代码复现反思

title: ARNN复现反思date: 2022-04-26 22:37:56tags: NLP的一些收获因为找遍了一二三四作，都没有能得到An Attentional Recurrent Neural Networkfor Personalized Next Location Recommendation这篇论文的代码，一作没反应，二三四都让我找一作…麻了，所以硬下头皮准备复现。其实任务量还好，最幸运的是这篇论文的模型架构与另外一篇DeepMove的模型十分相似，都是先embedding序列后.

2022-04-27 00:00:34 550

原创 Meta Path Based Random Walk复现思路【基于元路径的随机游走模型】

title: Meta Path Based Random Walkdate: 2022-02-13 00:43:08tags: NLP的一些收获课题原因需要复现ARNN模型。即“An Attentional Recurrent Neural Networkfor Personalized Next Location Recommendation”这篇论文，早就听说随机游走模型以及PageRank之类的算法，现在算是自己动手复现了，因为其中需要使用随机游走来获得每个POI的neighbors，从而训.

2022-02-13 02:24:48 1711

原创一种机器翻译的评估方法 BLEU

title: BLEUdate: 2021-08-17 18:23:27tags: NLP的一些收获论文链接 BLEU: a Method for Automatic Evaluation of Machine Translation首先给出一组reference和candidate：Candidate1：It is a guide to action which ensures that the military always obeys the commands of the party..

2022-01-27 21:24:50 1154

原创 Adaboost算法

title: Adaboostdate: 2021-12-21 01:27:40tags: 机器学习关于AdaboostAdaboost算法是针对二分类问题提出的集成学习算法，是boosting类算法最著名的代表。当一个学习器的学习的正确率仅比随机猜测的正确率略高，那么就称它是弱学习器，当一个学习期的学习的正确率很高，那么就称它是强学习器。而且发现弱学习器算法要容易得多，这样就需要将弱学习器提升为强学习器。Adaboost的做法是首先选择一个弱学习器，然后进行多轮的训练，但是每一轮训练过后，都要根.

2022-01-27 21:22:08 1909

原创 OpenCL并行编程框架应用分析【高性能计算导论课程作业】

title: OpenCL并行编程框架【高性能计算导论课程作业】date: 2022-01-19 16:58:31tags: HPCOpenCL环境安装配置由于我使用的机器是MacBook Pro 2020，mac系统里面已经集成了OpenCL的SDK，所以不需要去另外下载，只需要在Xcode工程中将其加入进来就可以进行OpenCL的开发了。下面展示的是工程文件中配置OpenCL环境的过程。（1）首先在Xcode工程文件的Build Phases下导入OpenCL的库文件。（2）导入后，就可以.

2022-01-26 18:31:21 810

原创 Mandelbrot Set with HPC【高性能计算导论课设】

title: Mandelbrot Setdate: 2022-01-13 15:39:18tags: 高性能计算Mandelbrot Set with HPC本课程设计任务使用MPI与OpenMP混合并行编程模型，计算一定范围复平面内属于Mandelbrot Set的元素。将该范围复平面内的元素C是否属于Mandelbrot Set的信息，映射到图片中进行可视化。调整并行进程数以及每个进程内的并行线程数，探究计算效率的变化情况。调整数据规模，探究计算效率的变化情况。计算策略zn+1=.

2022-01-13 18:12:09 600 2

原创三层感知机-step by step

title: 三层感知机-step by stepdate: 2021-11-09 23:12:33tags: 机器学习实现内容：实现一个三层感知机对手写数字数据集进行分类绘制损失值变化曲线完成kaggle MNIST手写数字分类任务，根据给定的超参数训练模型，完成表格的填写实现数据集使用手写数字集。并且40%作测试集，60%做训练集。import matplotlib.pyplot as plt%matplotlib inlinefrom time import timei.

2021-11-10 00:33:51 1264 2

原创集合划分(递推)

title: 集合划分date: 2021-11-07 20:39:42tags: ACMProblemn个元素的集合{1,2,…, n }可以划分为若干个非空子集。例如，当n=4 时，集合{1，2，3，4}可以划分为15 个不同的非空子集如下：{{1}，{2}，{3}，{4}}，{{1，2}，{3}，{4}}，{{1，3}，{2}，{4}}，{{1，4}，{2}，{3}}，{{2，3}，{1}，{4}}，{{2，4}，{1}，{3}}，{{3，4}，{1}，{2}}，.

2021-11-07 20:58:49 603

原创清帝之惑之顺治

title: 清帝之惑之顺治date: 2021-11-07 19:22:27tags: ACMProblem顺治喜欢滑雪，这并不奇怪，因为滑雪的确很刺激。可是为了获得速度，滑的区域必须向下倾斜，而且当你滑到坡底，你不得不再次走上坡或者等待太监们来载你。顺治想知道载一个区域中最长的滑坡。区域由一个二维数组给出。数组的每个数字代表点的高度。下面是一个例子：　　 1 2 3 4 5　　16 17 18 19 6　　15 24 25 20 7　　14 23 22 21 8　　13 12 .

2021-11-07 19:27:29 129

原创加分二叉树

title: 加分二叉树date: 2021-11-07 12:15:41tags: ACM设一个n个节点的二叉树tree的中序遍历为（l,2,3,…,n），其中数字1,2,3,…,n为节点编号。每个节点都有一个分数（均为正整数），记第i个节点的分数为di，tree及它的每个子树都有一个加分，任一棵子树subtree（也包含tree本身）的加分计算方法如下：subtree的左子树的加分× subtree的右子树的加分＋subtree的根的分数若某个子树为空，规定其加分为1，叶子的加分就是叶节点本.

2021-11-07 12:37:59 1006

原创 Warcraft III 守望者的烦恼

title: Warcraft III 守望者的烦恼date: 2021-11-07 00:19:37tags: ACM头脑并不发达的warden最近在思考一个问题，她的闪烁技能是可以升级的，k级的闪烁技能最多可以向前移动k个监狱，一共有n个监狱要视察，她从入口进去，一路上有n个监狱，而且不会往回走，当然她并不用每个监狱都视察，但是她最后一定要到第n个监狱里去，因为监狱的出口在那里，但是她并不一定要到第1个监狱。守望者warden现在想知道，她在拥有k级闪烁技能时视察n个监狱一共有多少种方案？I.

2021-11-07 00:34:23 224

原创积木城堡(dp)

title: 积木城堡date: 2021-11-06 22:10:40tags: ACMXC的儿子小XC最喜欢玩的游戏用积木垒漂亮的城堡。城堡是用一些立方体的积木垒成的，城堡的每一层是一块积木。小XC是一个比他爸爸XC还聪明的孩子，他发现垒城堡的时候，如果下面的积木比上面的积木大，那么城堡便不容易倒。所以他在垒城堡的时候总是遵循这样的规则。小XC想把自己垒的城堡送给幼儿园里漂亮的女孩子们，这样可以增加他的好感度。为了公平起见，他决定把送给每个女孩子一样高的城堡，这样可以避免女孩子们为了获得更漂亮.

2021-11-07 00:18:31 281

原创人工智能课程笔记(马少平著)

title: 人工智能课程笔记date: 2021-11-05 14:11:24tags: AI Course考完AI了，把笔记保存一下吧。描述了一些关键知识的理解（因为抓紧复习所以有些地方写的并不详尽）。

2021-11-05 21:59:12 1556

原创 Qt自定义信号和槽函数的同时重载

自定义信号和槽函数的同时重载记录一下，省得一周的小学期又白上…Signal和Slots相当于软件中一个事件触发的条件与结果。而在QT中，条件与结果常常是某一class的对象中的某个函数，所以使用connection(arg1, arg2, arg3, arg4)来连接二者，一旦arg1对象下的arg2操作实现，则arg3对象下的arg4操作进行。通常分别建立两个head和cpp来实现这两个对象的构建。像这样，其中hello.h是声明的signal类，world.h是声明的slots类。分别如下：

2021-07-20 01:07:34 477

原创龙贝格方法计算椭圆周长

龙贝格方法计算椭圆周长椭圆周长定积分公式由于椭圆的周长可以看作是很多Δx\Delta xΔx与Δy\Delta yΔy直角边构成的斜边的和。因此就是dx2+dy2\sqrt{dx^2+dy^2}dx2+dy2，此处为了简化直接用参数方程替换，就是4×∫0π2a2sinθ+b2cosθdθ4\times \int_{0}^{ \frac{\pi}{2}} \sqrt{a^2 sin\theta + b^2 cos\theta} d\theta4×∫02πa2sinθ+b2cosθdθ。龙贝格积分

2021-06-12 14:39:29 1768

原创 RNN理解

RNNrnn即循环神经网络，给模型一个记忆的功能，每一个status的输出都与前面所有的输入有关。

2021-04-22 23:38:54 131

原创关于卷积核多通道输出的理解(基于dive into DL pytorch）

理解如图所示如题

2021-04-10 20:03:36 226

原创 TransE理解与实现

（依附于博主yuanwyue代码https://blog.csdn.net/shunaoxi2313/article/details/89766467）理解如下图附上那位博主的代码自己加了一些有没有的注释帮助理解import codecsimport randomimport mathimport numpy as npimport copyimport timeentity2id = {}relation2id = {}def data_loader(file):

2021-04-01 00:30:19 935 2

原创八皇后问题栈dfs实现

问题八皇后问题：设8皇后问题的解为 (x1, x2, x3, …,x8), 约束条件为：在8x8的棋盘上，其中任意两个xi 和xj不能位于棋盘的同行、同列及同对角线。要求用一维数组进行存储，输出所有可能的排列。思路用dfs的话，首先可以先把问题简化，不需一个单元一个单元的搜索。显然同一行的单元只能有且仅有一个皇后。不妨利用单行皇后的唯一性将stack数组中的第i个元素当作第i行的皇后所在的列数。然后进行递归深搜。/*Lab2_3_19281158 * */#include<iostrea

2021-03-31 14:13:54 444

原创 4阶斐波那契序列队列实现

问题4阶斐波那契序列如下：f0=f1=f2=0, f3=1,…,fi=fi-1+fi-2+fi-3+fi-4，利用容量为k=4的循环队列，构造序列的前n+1项（f0, f1 , f2 ,… fn ），要求满足fn ≤200而fn+1 >200。算法对于一个队列，总有四个值在其内，用队列内的四个值计算出下一个值并将算出来的该值直接放入队尾，不考虑队满，因为要直接覆盖前面的第五个值，然后再计算，直至有一值大于200。可以推广至k。/*Lab2_2_19281158 */#include&l

2021-03-30 23:51:30 1168

原创 Pytorch实现逻辑回归demo

关于Logistic Regression逻辑回归简单来说，就是对于一组几维的数据，每个数据对应着一个类别，这里用yyy表示。用于训练，然后目的是对于一组多维的输入能够预测其类别yyy实现方法步骤大致与Linear Regression类似，深层原理不再赘述。注意在分类问题中使用的是Cross-Entropy Loss Function，为什么，因为如果使用Quadratic Loss Function的话会让拟合的标准过于严格，因为要让一组数据属于某一类并不需要其与target一模一样，只需其属于

2021-03-25 20:41:18 197

原创 Pytorch实现线性回归demo

关于线性回归即对于几组input和target的值用模型进行线性的拟合。比如对于房子的不同地理位置大小等因素决定的房价。线性的模型就是对于一组input输入得出与target相近的out。过程较为普式的把输入对象的属性整合为一组集合[x1j,x2j,x3j,...,xnj][x_1^j,x_2^j,x_3^j,...,x_n^j][x1j,x2j,x3j,...,xnj]，对应的target为yjy^jyj。然后对于一个jjj给出预测的out（target的prediction）：hθ(x

2021-03-23 19:52:44 270

空空如也

空空如也