自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

myaijarvis notebook

myaijarvis notebook

  • 博客(164)
  • 收藏
  • 关注

原创 【笔记】书生·浦语大模型实战营——第四课(XTuner 大模型单卡低成本微调实战)

学到了linux系统中 tmux 的使用了解了XTuner 大模型微调框架的使用pth格式参数转Hugging Face格式Merge模型参数。

2024-01-14 23:05:15 539

原创 【笔记】书生·浦语大模型实战营——第三课(基于 InternLM 和 LangChain 搭建你的知识库)

选择一个垂直领域,收集该领域的专业资料构建专业知识库,并搭建专业问答助手,并在。上成功部署(截图,并提供应用地址)碰到pandas相关报错就卸载重装。输出文字乱码:重新生成向量文件。这里需要等好几分钟才行。

2024-01-10 22:57:46 463

原创 【笔记】书生·浦语大模型实战营——第一、二课

群公告1月3日*更新。

2024-01-03 21:26:16 697

原创 【Python】环境配置,【Pytorch】GPU版本安装

在当前用户目录下创建pip目录,即C:\Users\xxx\pip\ (xxx指代用户名),在pip目录下创建pip.ini文件,文件内容如下。torchvision和torchaudio可以根据需要再安装,一般是用不上的。技巧:下载的时候复制链接到IDM,然后IDM下载过程中速度会波动,将cudnn解压,将bin、include、lib复制和替换到。建议:后续也可以把这三个包单独下载下来,使用pip分别安装。双击下载好的cuda****.exe。下载对应的cuda并安装。但下载很容易断,所以请看。

2023-08-30 15:28:30 411 1

原创 【NLP】词向量 笔记

目的:记录自己感觉经常忘的部分、和理解不深的知识点。

2023-04-04 21:36:34 146 1

翻译 【NLP论文】用于仇恨语音检测的字符级超网络 Character-level HyperNetworks for Hate Speech Detection

针对特定群体的仇恨言论和仇恨内容的大规模传播是一个至关重要的社会问题。仇恨言论的自动检测方法通常采用最先进的基于深度学习(DL)的文本分类器——包含超过1亿个参数的大型预训练神经语言模型,使用相关的标记数据集将这些模型调整到仇恨言论检测任务中。不幸的是,只有少数大小有限的公共标记数据集可以用于此目的。我们为推动这一事态做出了几项极具潜力的贡献。我们提出了一种用于仇恨言论检测的超网络,它是一类特殊的DL网络,其权值由一个小型的辅助网络来调节。这些体系结构是在字符级。

2023-03-03 21:37:49 526

原创 【python】代码执行过程、全局变量、局部变量

【参考:python中函数的定义和调用的先后顺序问题_独孤尚良dugushangliang的博客-CSDN博客】【参考:python main,类变量 - bhz - 博客园】【参考:local variable referenced before assignment 原因及解决办法_斗南花卉市场的博客-CSDN博客】代码从上到下依次执行不要在函数内部改变全局变量的值,如果确实想改变全局变量的值(以y为例),那么需要在函数内部首先声明,即加上global y这一行代码。当.py文件被直接运行时,

2022-12-07 16:16:25 523

原创 【Pytorch】广播机制

【参考:The size of tensor a must match the size of tensor b (y) at non-singleton dimension z_点PY的博客-CSDN博客】报错:The size of tensor a (x) must match the size of tensor b (y) at non-singleton dimension z其广播机制遵循以下规则:以数组A和数组B的相加为例, 其余数学运算同理核心:如果相加的两个数组的shape不同,

2022-12-04 17:05:18 849

原创 【前端】JavaScript 原型与原型链

原型:每个都有的,称之为原型。因为这个属性的值是一个对象,也称之为。__proto__:每个对象都有__proto__属性。作用:这个属性指向它的原型对象。

2022-11-27 21:16:40 192

原创 【Linux】vim (待完善)

一般命令模式(普通模式、正常模式)控制光标移动,对文本进行复制、粘贴、删除等工作。用户刚刚启动 vi/vim,便进入了命令模式。。编辑模式插入或替换末行模式(底线命令模式)在命令模式下输入即可进入末行模式,在冒号后面输入指令,即可实现特定的功能。

2022-11-20 16:41:38 269

原创 【Linux】WSL

总结:如果不用Linux桌面的话还是挺不错的要Linux桌面的话还是装VMware吧先决条件必须运行 Windows 10 版本 2004 及更高版本(内部版本 19041 及更高版本)或 Windows 11。

2022-11-17 16:25:54 1351

原创 【前端】(浏览器)调试技巧

定位hover显示出现的元素console。

2022-11-04 13:00:08 990

原创 【Pytorch】torch.gather函数理解

有三个标签[0, 1, 2],即三个类别。现在知道两个样本(A 和 B)所得到的三个标签的概率分别为[0.1, 0.3, 0.6]和[0.3, 0.2, 0.5], 用my_pred表示, 这两个样本的真实标签分别为0和2, 那么我们很容易知道A所预测的真实标签的概率为0.1, B所预测的真实标签的概率为0.5,A分类错误,B正确分类。那么用程序这么获得标签对应的概率呢,这里就可以用gather函数。引言:在多分类中,torch.gather常用来取出标签所对应的概率。用二维tensor举例。

2022-09-26 11:49:40 528

原创 【paddle】Vision Transformer(attention)

讲得非常好。

2022-08-25 21:57:22 717

原创 【Python】【LeetCode】数据结构(重要)

可以和列表一样切片访问。

2022-07-25 23:07:58 582

转载 【Datawhale】【机器学习】糖尿病遗传风险检测挑战赛

截至2022年,中国糖尿病患者近1.3亿。中国糖尿病患病原因受生活方式、老龄化、城市化、家族遗传等多种因素影响。同时,糖尿病患者趋向年轻化。糖尿病可导致心血管、肾脏、脑血管并发症的发生。因此,准确诊断出患有糖尿病个体具有非常重要的临床意义。糖尿病早期遗传风险预测将有助于预防糖尿病的发生。......

2022-07-25 16:33:28 1036

原创 【算法】【 LeetCode】线段树

关于各类「区间和」问题如何选择解决方案(含模板)-区域和检索-数组可修改-力扣(LeetCode)】线段树详解「汇总级别整理🔥🔥🔥」-我的日程安排表I-力扣(LeetCode)】动态开点模板。

2022-07-23 17:30:58 648

原创 【算法】第三届全国大学生算法设计与编程挑战赛(秋季赛)

秋季赛题目:http://vj.saikr.com/contest/16/problems【参考:第三届全国大学生算法设计与编程挑战赛题解【金奖全国第九】_米莱虾的博客-CSDN博客】【参考:2021-2022第三届全国大学生算法设计与编程挑战赛(秋季赛) 题解_ReChn0的博客-CSDN博客】线段树 不会,待定......

2022-07-13 19:32:31 2457 5

原创 【算法】第三届全国大学生算法设计与编程挑战赛(冬季赛)

【参考:2021-2022年度第三届全国大学生算法设计与编程挑战赛(冬季赛)题解_int 我的博客-CSDN博客】思路:二分

2022-07-11 16:03:45 4807

原创 【NLP】【TextCNN】 文本分类

必看:【参考:【论文笔记】:Convolutional Neural Networks for Sentence Classification用CNN做句子分类 - 小千同学超级爱写代码 - 博客园】【参考:卷积在NLP领域的应用–以TextCNN为例_哔哩哔哩_bilibili】【参考:论文阅读:Convolutional Neural Networks for Sentence Classification 卷积神经网络的句子分类_南有芙蕖-CSDN博客】【参考:TextCNN天池授课_哔哩哔哩_bil

2022-06-29 22:12:01 473

原创 【LeetCode】【SQL】刷题笔记

code格式规范:列名最好和表中的列名一样(大小写一样)参考资料:官方文档:【参考:MySQL :: MySQL 5.7 参考手册 :: 13 SQL 语句】【参考:SQL中的谓词 - 知乎】题目以类型归类,记录常用且易错的类型【参考:584. 寻找用户推荐人 【比官方细,千字干货!】(三值运算,NULL) - 寻找用户推荐人 - 力扣(LeetCode)】【参考:584. 寻找用户推荐人 - 简单 - 力扣(LeetCode)】多表查询【参考:183. 从不订购的客户 - 力扣(LeetCod

2022-06-29 21:08:06 335

原创 【Python】高级语法——闭包和装饰器

来源:【参考:Python必知必会 - 闭包和装饰器】【参考:Python的闭包和装饰器,我是这样理解的_哔哩哔哩_bilibili】在原有基础上添加自己的思考过程代码可视化网站:【参考:Python Tutor: Learn Python, JavaScript, C, C++, and Java by visualizing code】Local、Enclosing function locals、Global、Built-in当引用一个变量时,Python按以下顺序依次进行查找:第一个能够完成查找

2022-06-24 21:22:02 166

原创 【Python】Leetcode提交例子

【参考:508. 出现次数最多的子树元素和 - 力扣(LeetCode)】像类一样写变量和函数把需要的函数写在函数内部

2022-06-19 13:28:50 532

原创 【NLP】Seq2Seq论文(RNN) 机器翻译

论文:《Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation 》2014使用 RNN Encoder-Decoder 学习短语表示以进行统计机器翻译【参考:【NLP】Seq2Seq 翻译_myaijarvis的博客-CSDN博客】【参考:nlp-tutorial/Seq2Seq.py at master · graykode/nlp-tutorial】【参考:seq2seq的

2022-06-14 21:06:15 386

原创 【NLP】神经网络语言模型NNLM

《A Neural Probabilistic Language Model》其中双曲正切 tanh 逐个元素地应用,W 可选为零(无直接连接),x 是词特征层激活向量,它是来自矩阵 C 的输入词特征的串联:【参考:graykode/nlp-tutorial: Natural Language Processing Tutorial for Deep Learning Researchers】【参考:Neural Network Language Model PyTorch实现_哔哩哔哩_bilibili

2022-06-13 21:56:12 284

原创 【Pytroch】Transformer实现、einsum函数

【参考:一个函数打天下,einsum - 知乎】【参考:Machine-Learning-Collection/transformer_from_scratch.py at master · aladdinpersson/Machine-Learning-Collection】理解Transformer【参考:Pytorch Transformers from Scratch (Attention is all you need) - YouTube】【参考:Machine-Learning-Col

2022-06-03 17:55:07 799

原创 【NLP】Seq2Seq 翻译

【参考:Seq2Seq 机器翻译, 全程手写代码_哔哩哔哩_bilibili】【参考:shouxieai/seq2seq_translation: seq2seq_translation】代码总结训练Seq2Seq就相当于用decoder接一个全连接层做多分类,而预测的时候则需要先输入一个字符进行预测,然后把这个预测输出的字符作为下一次的输出。

2022-06-02 16:09:14 391

转载 【NLP】怎样阅读NLP论文 && 如何做好文献阅读及笔记整理

【参考:怎样阅读NLP论文_哔哩哔哩_bilibili】【参考:如何阅读NLP论文笔记_12Struggle的博客-CSDN博客】【参考:怎样阅读NLP论文_百度搜索】

2022-06-01 19:51:48 233

原创 【Paddle】Paddle学习笔记(对比Pytorch)

记录一些常用的片段【参考:飞桨(Paddlepaddle)的动态图、静态图全流程例子_AlexDish的博客-CSDN博客】tensor【参考:to_tensor-API文档-PaddlePaddle深度学习平台】【参考:tolist-API文档-PaddlePaddle深度学习平台】模型保存及加载【参考:模型保存及加载-使用文档-PaddlePaddle深度学习平台】...

2022-05-21 21:08:45 768

原创 【PaddleNLP】使用预训练模型代码解读(Stack,Pad,Tuple、utils.py,偏函数)

本项目来源于:【参考:『NLP经典项目集』02:使用预训练模型ERNIE优化情感分析 - 飞桨AI Studio】Stack,Pad,Tuple【参考:使用PaddleNLP进行恶意网页识别(一) - 飞桨AI Studio】【参考:PaddleNLP/data.md at develop · PaddlePaddle/PaddleNLP】注意,在早前的PaddleNLP版本中,token_type_ids叫做segment_ids# 单句输入single_seg_input = tok

2022-05-21 15:06:55 2032 6

原创 【PaddleNLP】恶意网页识别(五):用BERT识别恶意网页内容

【参考:使用PaddleNLP进行恶意网页识别(五):用BERT识别恶意网页内容 - 飞桨AI Studio】代码更新,仿造pytorch,特此记录import osimport sysimport codecs # 编码转换import chardet # 第三方编码检测模块import shutilimport reimport timeimport numpy as npimport pandas as pdimport jiebafrom tqdm import tqdm,

2022-05-20 21:19:30 842

原创 【Pytorch】collate_fn函数

【参考:pytorch中collate_fn函数的使用&如何向collate_fn函数传参_XJTU-Qidong的博客-CSDN博客】collate_fnclass MyDataset(Dataset): def __init__(self, datas, tags, word2idx, tag2idx): self.datas = datas self.tags = tags self.word2idx = word2idx

2022-05-19 16:41:20 887

原创 【Pytorch】常用函数与技巧(重要)

【参考:【深度学习】 Pytorch笔记_myaijarvis的博客-CSDN博客】【参考:【PyTorch深度学习实践】B站视频教程笔记_myaijarvis的博客-CSDN博客】手写数据集(多分类模板)【参考:【Pytorch从零入门深度学习实战教程】B站_myaijarvis的博客-CSDN博客】MLP | Pytorch构建模板【参考:【PyTorch】学习【深入浅出PyTorch | GitHub】_myaijarvis的博客-CSDN博客】FashionMNIST时装分类

2022-05-18 21:45:29 319

原创 【LeetCode】会议调度问题 (动态规划)

【参考:会议室调度算法集锦_阿飞算法的博客-CSDN博客】1751. 最多可以参加的会议数目 II hard【参考:1751. 最多可以参加的会议数目 II - 力扣(LeetCode)】【参考:【阿飞算法】畅游面试中的动态规划套路-最多可以参加的会议数目 II - 最多可以参加的会议数目 II - 力扣(LeetCode)】 循序渐进自顶向下记忆化递归memo[curr][k] : 表示处理到编号curr这个会议,还剩余k次参加会议机会所能获取的价值的最大值class Solution {

2022-05-15 14:04:31 1318

原创 【LeetCode】动态规划 编辑距离 字符串 双指针

编辑距离【参考:代码随想录# 动态规划之编辑距离总结篇# 判断子序列】72.编辑距离583.两个字符串的删除操作392.判断子序列392. 判断子序列 easy【参考:392. 判断子序列 - 力扣(LeetCode)】【参考:代码随想录# 392.判断子序列】这道题应该算是编辑距离的入门题目,因为从题意中我们也可以发现,只需要计算删除的情况,不用考虑增加和替换的情况。dp[i][j] 表示以下标 i-1 为结尾的字符串 s,和以下标 j-1 为结尾的字符串 t,相同子序列的长度为

2022-05-14 16:27:09 273

原创 【Python】刷题技巧总结(比较 排序)

比较 排序类排序 类比较【参考:python3 类排序 类比较-蒲公英云】列表和字典排序【参考:python3列表和字典排序-蒲公英云】

2022-05-13 12:53:49 188

原创 【LeetCode】数学

等差数列390. 消除游戏 - medium【参考:390. 消除游戏 - 力扣(LeetCode)】纯模拟会超时class Solution { public int lastRemaining(int n) { List<Integer> list=new ArrayList<>(); for(int i=0;i<n;i++){list.add(i+1);} int d=0; while(tru

2022-05-12 16:51:23 383

原创 【NLP】 BERT微博评论情感分类

【参考:HuggingFace学习2:使用Bert模型训练文本分类任务_呆萌的代Ma的博客-CSDN博客】数据集:【参考:利用LSTM+CNN+glove词向量预训练模型进行微博评论情感分析(二分类)_你们卷的我睡不着QAQ的博客-CSDN博客】文本处理import pandas as pdimport numpy as npdf = pd.read_csv("weibo_senti_100k.csv", encoding="gbk")df.head()import redf.in

2022-05-09 22:40:32 4077 3

原创 【NLP】Transformer理解(Pytorch实现)

蓝斯诺特【参考:Transformer简明教程, 从理论到代码实现到项目实战, NLP进阶必知必会._哔哩哔哩_bilibili】举了一个实例,计算过程浅显易懂【参考:NLP - Transformer_伊织_的博客-CSDN博客】【参考:lansinuote/Transformer_Example | github】下面略有修改import torchimport randomimport numpy as npimport mathtorch.manual_seed(100)m

2022-05-06 22:21:12 534

转载 【Pytorch】torch.argmax

在原文章上有自己的补充和修改【参考:torch.argmax函数说明_Egozjuer的博客-CSDN博客】argmax函数:torch.argmax(input, dim=None, keepdim=False)返回指定维度最大值的序号dim给定的定义是:the demention to reduce.也就是把在dim这个维度的数据,变成这个维度上的最大值的下标index1)dim的不同值表示不同维度。特别的在dim=0表示二维中的列,dim=1在二维矩阵中表示行。广泛的来说,我们不管一个矩阵是

2022-05-05 16:44:04 582

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除