自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

菜比的博客

菜比本菜

  • 博客(31)
  • 资源 (3)
  • 收藏
  • 关注

原创 Huggingface transformer的Trainer中data_collator的使用

什么时候使用由Transformers Trainer的文档中可知,Trainer函数有一个参数data_collator,其值也为一个函数,用于从一个list of elements来构造一个batch。这个函数其实就是torch.utils.data.DataLoader中的collate_fn。如果还不知道collate_fn是做何用处,请参考这篇文档。要用到这个函数,要符合如下两个条件:Trainer的参数train_dataset或eval_dataset是torch.utils.data

2021-12-02 20:42:16 8535 6

原创 Huggingface填坑:Unexpected key(s) in state_dict: “roberta.pooler.dense.weight“....

在加载已经训练好的模型时,出现问题如下:RuntimeError: Error(s) in loading state_dict for RobertaForSequenceClassification: Unexpected key(s) in state_dict: "roberta.pooler.dense.weight", "roberta.pooler.dense.bias".先说原因版本问题!在huggingface3.1.0中,roberta相关模型的实现是11层tr

2021-10-23 17:20:14 2487 2

原创 Longformer论文解读和代码解析

前言这篇博文记录了longformer论文的主要思想、代码实现和结果复现方面的一些工作,相关链接如下:原longformer论文地址github上原作者公开的代码huggingface上原作者编辑的longformer模块原论文解读其实transformer-xl已经突破了transformer对处理文本长度的限制,那longformer的意义是什么呢?原作者的解释是这样的:transformer-xl处理长文本时按从左到右的方式自回归处理,这样每一个segment只能看到其所在的segme

2021-10-15 20:22:28 3073

原创 torch.item()的用法

torch数据类型的item方法是得到只有一个元素张量里面的元素值。如下:>>> x = torch.tensor(4)>>> x.item()4如果对包含多个元素的torch.tensor用item()方法,则会报错如下:>>> x = torch.tensor([1,2,3,4])>>> x.item()Traceback (most recent call last): File "<stdin>

2021-03-25 18:10:52 5378 3

原创 Shusen Wang NLP课程学习笔记 Transformer + BERT

Transformercyq总结,就是博主啦attention without RNNOriginal paper Attention is All You Need. In NIPS, 2017Transformer 是一个 Sep2Sep模型Transformer不是RNNTransformer的效果完胜RNN,业界已经基本不用RNN了文章目录TransformerReview of Attention on RNNAttention without RNNAttention Laye

2020-08-01 10:30:17 573

原创 Shusen Wang NLP课程学习笔记 RNN+NLP

RNN+NLP学习笔记(点击标题查看视频课程)cyq总结(就是博主啦)文章目录RNN+NLP学习笔记(点击标题查看视频课程)Data Processing BasicsProcessing Categorical FeaturesProcessing Text DataTokenizationCount Word FrequenciesOne-hot EncodingText Processing and Word Embedding(嵌入)Text to SequenceTokenizetionBui

2020-08-01 10:14:51 878 1

原创 lc中heap-use-after-free的一种情况

在做 lc114. 二叉树展开为链表 时遇到。当时代码写到一半,如下:class Solution {public: TreeNode* lastNode;public: void backtrack(TreeNode* node){ if(node != NULL){ if(lastNode -> left == NULL) lastNode -> left = node; // cout<<n

2020-06-16 11:26:01 859

原创 PAT1005 Spell It Right

此题重点为用string接输入,int会溢出#include <iostream>#include <string>#include <string.h>#include <vector>using namespace std;string transfer(int i){ if(i == 0) return "zero"; if(i == 1) return "one"; if(i == 2) return "two"

2020-06-15 11:39:00 110

原创 PAT1004 Counting Leaves

开始想用树来做,就构造了TreeNode。结果完全没用上,用map和vector就能很好解决问题,本题放在pat里确实算很简单的了。#include <iostream>#include <map>//#include <string>#include <vector>using namespace std;struct TreeNode{ int val; TreeNode* leftchild; TreeNode* r

2020-06-14 21:58:24 110

原创 PAT1003 Emergency 迪杰斯特拉 + dp

坑:第二个测试用例起始点为终止点,此时的路径数为1疑惑:用深度优先算法超出内存限制了,希望用深度优先通过的大佬不吝赐教收获:迪杰斯特拉需要的数据结构比较简单: //距离矩阵,查值需要 vector<vector<int> > length; //记录哪些节点已经找到路径(0没找到,1找到),用来将节点划分成两个集合 int alreadyReach[size()]; //到i节点的最短距离,记录中间结果,用于下一步计算 int minLen[size

2020-06-12 15:18:45 115

原创 PAT1001 A+B Format

题目要求是每三个数之间加一个“,”类似外国的那种数的表示方法。第一次做PAT,用了2小时,,#include <iostream>#include <vector>#include <cstdio>#include <math.h>using namespace std;//计算数字有多少位,//一定不要再用 (int)(log(sum)/log(10))这样的了,效率虽高,但出错概率极大int CalBit(int num){ i

2020-06-11 11:35:19 97

原创 lc139. 单词拆分

原题链接注意:本文的回溯代码会出现超时异常,仅供理解题目和拓展思路使用class Solution {//25min 回溯public: map<char, vector<string>> Dict; int end ;public: bool canMatch(string word, char arr[], int pos){ int len = word.size(); char wordArr[

2020-06-07 10:31:30 117

原创 lc115. 不同的子序列

原题链接注释部分是我对dp方法中找递推公式的一点拙见class Solution {// 用时34min// 在找递推公式时,详细讨论具体一位的手动推断情况是很有效的// 1.确定子问题是什么?// 2.确定在讨论某一位的时候,已经有哪些子问题的解是已知的// 3.确定当前这一位的解如何完全根据子问题的解表示// 题目本质上和不同路径数是一样的,一个是最后一位匹配选与不选,一个是前一步向上与向左public:

2020-06-04 13:56:36 148

原创 lc97. 交错字符串_dp

原题链接被注释掉的部分是分治法的完整代码。dp数据结构:Arr[i][j][k]代表s3的前 i 位是否是s1的前 j 位和s2的前 k 位的交错字符串。dp递推公式:Arr[i][j][k] = (s3的第 i 位可以匹配s1的第 j 位 && Arr[i - 1][j - 1][k])|| (s3的第 i 位可以匹配s2的第 k 位 && Arr[i - 1][j][k - 1])class Solution {// public:// int s

2020-06-03 10:41:24 282

原创 lc91. 解码方法_dp

原题链接递推公式:when charAt[i] == ‘0’ :if(charAt[i - 1] == 1 || charAt[i - 1] == 2) dp[i] = dp[i - 2];else return 0;when charAt[i] != ‘0’if(charAt[i] 和 charAt[i - 1] 可以组合) dp[i] = dp[i - 1] + dp[i - 2]else dp[i] = dp[i - 1]class Solution {public:

2020-06-02 14:02:53 241

原创 lc98. 验证二叉搜索树_深度优先

原题链接为了对比,给出广度优先算法的一般代码格式(自己总结的,若有出入,还望纠正):void backtrack(int depth){ if(depth is the bottom of the tree){ cul the requested ans; return; } for(int i = begin of width; i < end of width; i++){ add Num related to i; backtrack(depth + 1); pop

2020-06-01 16:52:06 198

原创 lc93. 复原IP地址_回溯法

原题链接我的回溯函数返回的是分段方法,是一组四元向量。如[3,3,2,3]表示IP地址的点分十进制的4个数分别是3位数,3位数,2位数,3位数。主函数中再将其对应到具体的IP地址class Solution {public: vector<int> pos; vector<vector<int>> ansPos;public: int Num(char cArr[], int start, int end){ int ans

2020-05-31 16:27:38 238

原创 lc92. 反转链表 II_三指针法

原题链接本题本来想开始就设置头节点,但不知道为什么使用头节点后结果如下:所以只好只在m==1时使用头节点,其他时候不用。三指针部分如下 subHead = subTill->next; subTill->next = subHead->next; subHead->next = head->next; head->next = subHead;其中,head是 链表待反转部分 前的链表序列的最后一个节点。上面代码始终保证了

2020-05-27 23:24:53 174

原创 lc65. 有效数字_有限向量机

原题链接参考java编译器词法分析程序的写法,有限向量机如下图所示:对应程序如下:class Solution {public: bool isNum(char c){ if(c - '0' >= 0 && c - '9' <= 0) return true; return false; } bool isNumber(string s) { char charArr[s.size() + 1];

2020-05-27 09:45:37 408

原创 lc59. 螺旋矩阵 II

原题链接参考lc54中“C++详细题解”,可以描述为一种“动态边界”的循环。需要注意先初始化答案vector<vector<int>>到指定大小并填0,否则会有空指针错误class Solution {public: vector<vector<int>> generateMatrix(int n) { vector<vector<int>> ans; for(int i = 0; i &.

2020-05-24 20:43:53 122

原创 lc56. 合并区间_双指针法

原题链接在不考虑输入序列中左边界与右边界对应关系下的解法,依据为每个区间左边界小于等于右边界交叉区间中必存在区间A的右边界大于等于区间B的左边界class Solution {public: vector<vector<int>> merge(vector<vector<int>>& intervals) { vector<int> first; vector<int> .

2020-05-23 17:29:47 155

原创 lc54. 螺旋矩阵

原题链接中文版lc的题解中,“C++详细题解”和我的方法思路相同,但代码更简洁。我的出发点是,每次行/列中已被访问过的元素数为如下数组:allreadyVisited = [0,1,1,2,2,3,3,4,4,5,5,6,6…];除了第一项0,其他项都是成对出现的,而且已被访问过的数总是对半分配在当前要访问行/列的头部和尾部class Solution {public: vector<int> spiralOrder(vector<vector<int>&g

2020-05-23 15:59:47 188

原创 lc45 条约游戏II

原题链接回溯法class Solution {public: int step = 0; int size; int min_step;public: void oneStep(vector<int>& nums, int pos){ if(pos == size - 1){ min_step = min(min_step, step); return; }

2020-05-19 20:14:11 124

原创 lc44.通配符匹配_算法与优化

原题如下:给定一个字符串 ( s) 和一个字符模式 ( p) ,实现一个支持 ‘?’ 和 ‘*’ 的通配符匹配。'?' 可以匹配任何单个字符。'*' 可以匹配任意字符串(包括空字符串)。两个字符串完全匹配才算匹配成功。说明:s 可能为空,且只包含从 a-z 的小写字母。p 可能为空,且只包含从 a-z 的小写字母,以及字符 ? 和 *。链接:https://leetcode-cn.com/problems/wildcard-matching思路:分治法看到这题,我最开始想到的是lc

2020-05-18 18:16:39 215

原创 大数乘法(java字符串相乘)

大数乘法(java字符串乘法)先看一下在 leetcode 上的执行结果:可以看到,这里有空间换时间的问题原题给定两个以字符串形式表示的非负整数 num1 和 num2,返回 num1 和 num2 的乘积,它们的乘积也表示为字符串形式。说明:num1 和 num2 的长度小于110。num1 和 num2 只包含数字 0-9。num1 和 num2 均不以零开头,除非是数字 0...

2020-03-16 17:07:19 1070

原创 安装配置Axis2,为Eclipse安装配置Axis2插件教程

安装配置Axis2,为Eclipse安装配置Axis2插件教程之前在网上看过许多安装配置Axis2的教程,但都不太好使,尤其是Eclipse总是识别失败,故总结如下:1. Eclipse安装在https://www.eclipse.org/downloads/找到适合自己电脑的版本下载安装即可,注意记住安装的位置。这里我下载的是2018-12的版本,安装位置在D:\eclipse。另外,要...

2020-01-12 23:28:40 2239 3

原创 Windows10安装Ubuntu16.04双系统后,开机没有引导解决

Windows10安装Ubuntu16.04双系统后,开机没有引导解决博主之前成功安装过Ubuntu16.04,是自己分区安装的。安装完后开机应有引导界面,选择不同的操作系统。后来加了一块固态,引导界面就没了,开机自动进入Windows。解决如下:在Windows中以管理员模式进入cmd(C:\Windows\System32\cmd.exe右键,以管理员身份运行)输入bcdedit /s...

2020-01-12 23:01:59 3058 4

原创 web服务(电子服务系统设计)知识点汇总

web服务(电子服务系统设计)知识点汇总前言第一章 WS基础第二章 分布式计算基础架构第三章 XML概览第四章 SOAP简单对象访问协议第五章 描述WEB服务第六章 WEB服务的注册和发现第七章 WEB服务的寻址和通知(未完成)前言本文档原意为考试复习所用,基于 《web服务:原理与技术》 课本。但是,自学的同学也可以以此文档为参考文档。博主是西工大软院学生,此文档为自己总结...

2020-01-04 16:25:16 545 1

原创 EV-FlowNet: Self-Supervised Optical Flow Estimation for Event-based Cameras论文分析

EV-FlowNet: Self-Supervised Optical Flow Estimation for Event-based Cameras论文分析related work之前的部分就不写了。方法(Method):A. Event事件的代表目的:让event数据更像frame-flow的数据,方便充分利用现有网络(image-like input)1.1 拥有相对少的输入通...

2019-11-24 19:58:42 843 2

原创 The goal you specified requires a project to execute but there is no POM in this directory问题解决

The goal you specified requires a project to execute but there is no POM in this directory (D:\ChromeDownload). Please verify you invoked Maven from the correct directory. -> [Help 1]问题解决 s...

2019-10-01 17:03:26 24141 1

原创 Ubuntu 16.04中卸载Anaconda引起的pip(pip3)异常

Ubuntu 16.04中卸载Anaconda引起的pip异常正确方法错误尝试我在_ubuntu_系统中安装了支持python3.7版本的_Anaconda3_以及_conda_后由于python版本不匹配问题(tensorflow, opencv在python3.5中),将其卸载,但卸载后出现pip不能使用问题,在_pip install xxx_ 后错误提示如下:~$ pip insta...

2019-07-27 22:54:17 1334

event camera - outdoor_day数据集

Alix Zhu等人用到的数据集,用于event flow等和event camera相关网络的测试,包含event数据和灰度图

2019-12-15

MATLAB R2018b Win64 Crack.rar Matlab破解文件,内含说明书。

Matlab破解文件,全。netapi32.dll文件最后要放到Matlab自己安装路径下的bin文件夹中

2019-09-21

西工大软件开发综合能力训练XMusic

西北工业大学软件工程软件开发综合能力训练课程,Android方向项目结果和文档,含源代码 项目为XMusic音乐播放器,需求文档中大部分需求均已实现,开发不易,拙作仅供参考。 学习文档参照《疯狂Android》和哔站天哥在奔跑教程,有部分功能如navigation drawer和toolbar等请参考csdn相关博客

2019-09-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除