自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(510)
  • 资源 (15)
  • 问答 (9)
  • 收藏
  • 关注

原创 IEEE PDF eXpress Validating Pdf..之后Error in converting file

至于说转好后的格式有啥不同,我看了一眼,第一:那个超链接没有了,就是那个引用的索引,我原本的pdf点击索引就可以跳转到reference,被他转了之后不行了,我问了那个人工,他说是这样的,没问题。第二:图片变暗淡了一些些,我原本的图片统一使用的pdf图片格式,非常亮,比较清楚,他转了之后难道不是了?解决办法如下:失败之后,那里有一个选项按钮,叫做manual request,也就是人工转换,点那个申请就可以了,然后也挺快的,我个人是1个小时候之后就人工给我转好了。

2024-04-21 20:34:19 373

原创 自然语言处理基础面试

​ bert的Embedding层由3个子层求和得到,分别是词向量层Token Embedings,句子层Segment Embeddings以及位置编码层Position Embeddings,特别注意的是,bert中的位置编码层是采用随机初始化训练学习得到,和transformer的正弦函数编码不同。原始bert是静态mask,也就是每个epoch训练的内容mask部分都是一致的,这样没法学习到更多有用的信息,roberta采用的是动态mask,每个epoch训练的mask都是重新处理的,效果更好。

2024-04-20 23:38:32 357

原创 大模型(e.g., ChatGPT)里面的一些技术和发展方向

具体来说,再训练一个模型C,这个模型学习如何给一个(问题,答案)打分,至于说给多少分,也是需要人类标注数据的,人类需要标注(问题,答案,打分),也就是说一个问题可能会有多个答案,好的不好的答案都有,但打分不同,这个模型C训练好了之后,就可以用来监督模型D了。在模型A的基础上,输入一个问题,模型A会输出一个答案,这个答案和问题一起交给模型C,我们可以得到一个得分,这个得分会反馈给模型A,从而模型A不断学习,想要提高得分,得到模型D。有监督微调,也就是给定问题和答案,对1中学习的预训练模型进行微调。

2024-04-20 11:24:04 1097

原创 arxiv文章导出的bibtex格式是misc导致latex引用不正确

在arxiv官网上右下角导出bibtex,发现是misc格式,然后我用的是springer的期刊latex模板,发现引用不正确。有3个地方要改,一个是misc换成article,一个是添加了最后两行,然后就是正常的arxiv文章引用格式了。把上面那个bibtex手动改成下面这个。引用效果如下,就只有一个2024。

2024-04-15 12:03:28 166

原创 IJCNN注册(register)的时候付款失败(the payment didn‘t process)

主要是这个name on card,不是填你的论文英文名字,也不是填银行卡上那个MR.中文名字拼音,而是填你的中文名字!就是注册这张VISA卡的时候的中文名,踩坑了!又要踩坑了,我当时是在北京办理的工行星座卡,所以我写了Beijing, 不行!琢磨了一下,不是前面的填写信息有问题,而是付款信息的问题。上面这三个没有什么好说的,都是数字,银行卡上面全部写了。然后是那个国家选择,老实选择中国就行。坑了我好久,试了好多遍。

2024-04-13 20:33:32 182

原创 (已解决)使用IEEE格式的latex模板时出现引用(citation/reference)下面有下划线的情况

翻译一下就是:正常情况下,引用的期刊或者会议都是斜体的,而不是像之前那样有一个下划线。出现下划线的原因就在于导入了奇怪的包。问题如下,1.有一个下划线标注所发表的期刊或者会议2.不是斜体的。我们可以使用其他命令,这样就不用导入。上面这样肯定是不对的,那为什么会出现这种情况呢?仍为斜体,那么引用格式就不会异常了。,斜体命令此时会变成下划线命令。1.使用删除线,好像并不是只有。,这可以使得你可以继续使用。

2024-04-08 11:35:57 514

原创 Healthcare医疗健康领域常见的几个单词

在美国,医学界将23小时内出院的手术病例,界定为日间手术。因此人们在美国经常能看到名字里带有“23”这个数字的日间手术中心,医生们还会将23这个数字印得大大的,放在自己的名片上面。这里要注意的是,虽然有的“日间手术”的英文名称里有“Outpatient”这样的字眼,但日间手术与我们所熟知的“门诊手术”是截然不同的,两者的区别在于:门诊手术一般不需要麻醉医生在场,例如医生自己动手麻醉的大隐静脉、肿块切除等手术;而“日间手术”是需要麻醉医生参与的,和日常手术室里的那些大手术没有什么区别。

2024-04-07 23:02:10 308

原创 What is case-based reasoning (CBR)? 基于案例的推理

有人说,不知道名字有啥的,反正大家都会用,不需要学它叫什么名字。话虽如此,但是如果你说你的这种技术大有来头,等到你汇报给别人听的时候,或者写论文的时候,别人就会觉得你的东西逼格高,而不是干巴巴的说,我们提出了一个方法,这个方法非常直觉。这个方向其实挺小众的,然后其实也很直觉,所以你可能其实一直在用这个技术,只不过你不知道这个技术有一个专业的名字《基于案例的推理》而已。

2024-03-24 11:56:00 468

原创 include和contain的区别

参考:https://www.bilibili.com/video/BV1Nv411Y7is/?A包括B,其实A和B是同一种东西,比如人包括大人和小孩,这次参观包括对博物馆和游泳馆的参观(前后都是参观),这些都使用include。个人的解释,这两个东西都有包括,包含的意思,但是也正如其名,include侧重包括,contain侧重包含。

2024-03-15 16:32:52 183

原创 (已解决)将overleaf上的文章paper上传到arxiv上遇到的问题。

首先说一点,将paper的pdf文件直接上传arxiv是不行的,arxiv要求我们要上传源文件,所以才这么麻烦。

2024-02-11 21:09:27 1126

原创 (已解决)LaTeX Error: File `svproc.cls‘ not found. (用Springer LNCS 会议Proceedings模板)

解决办法:我们发现其实是路径不对,所以我们更改一下路径就好了,然后发现编译成功。

2024-02-10 22:08:54 578

原创 Universal Approximation Capabilities of Mixture of Weibulls (混合韦布尔分布的万能近似)

回答1:Ultimately this sounds tautological: just define “well-behaved” as any density that can be approximated, according to some specific metric, arbitrarily closely by mixtures of Weibulls!找了好久都没有找到混合韦布尔分布是否有万能近似性质,下面这个算是一点线索,不过看不太懂。

2024-01-24 18:02:48 401

原创 (统计用词)Identifiability可识别性

比如我现在有一个正态分布,只有我知道他的均值和方差,然后我根据这个正态分布采样无数个点,让另外一个人根据这些采样的点来推断正态分布背后的均值和方差。在无数个点的情况下,这个人应该得到。也就是说不能有另外一个均值和方差竟然可以和我们这一个均值和方差采样到一模一样的无数的点。这里的model你可理解为就是一个分布,比如正态分布,其有两个参数。且正确的均值和方差。正态分布是可识别的。

2024-01-24 17:49:45 513

原创 Pytorch如何使用RNN而不是RNNCell进行单步(迭代,递归)更新

一种方法当然是用回RNNCell,但是之前训练模型的时候用的是RNN,不方便换回去重新训练RNNCell,现在想在RNN基础上加一个递归的功能。后来直接使用RNN了,可以输入多个位置的输入,直接得到最后一个位置的隐状态。以前初学的时候是使用的RNNCell,是用来迭代的,接收的是两个参数,一个是当前位置输入,一个是之前隐状态,然后就更新得到新的状态。得到的结果的含义,前面已经说了,我们现在的任务是,能不能利用RNN递归地得到上述结果呢?结果如下,可以看到,和之前的结果一模一样。注:初始化的隐状态是0。

2024-01-19 17:25:11 397

原创 (已解决)word如何制作和引用参考文献

1.有人会问,我能不能复制那个引用[1],然后改成[2],然后就变成引用第2篇文章,这个格式上来说是可以,但是我好像试过,这样的话,点击那个[2]只会跳转到第一篇文章,也就是说你改成2,但是超链接其实是没有改的,所以最好不要这样复制,就光标位置继续插入引用就好了,也很快的。这个时候,我们发现会弹出一个对话框,这些就是之前编过号的参考文献,你可以选择一个参考文献,然后点击插入,表示要在光标处引用它,然后就完成了。如下,先选中,然后点击编号,然后选择编号的样式,一般都是[1]的这种形式。

2024-01-02 11:48:59 1300

原创 (已解决)Critical Package ctex Error: CTeX fontset `fandol‘ is unavailable in current

其实解决的办法很简单,我这里说使用overleaf的情况(如果你是本地安装那10几个G,本地运行latex的,建议你改用overleaf,真的好用,到时候你会谢我的。首先,这个错误会产生,说明你是想用ctex这个包,也就是需要写入中文,但是编译的时候报了上述的错误对吧。2.将编译器选成xelatex,原本英文的话应该会是pdflatex。网上很多人给了解决办法,但是在我这都没有用。3.重新编译,成功。

2024-01-02 09:49:39 1990 2

原创 (已解决)(pytorch指定了gpu但还是占用了一点0号gpu)以及错误(cuDNN error: CUDNN_STATUS_INTERNAL_ERROR)

前者报错我的理解是当使用CUDA的时候Pytorch内部有一个初始化,默认运行在第0块GPU(即使模型被指定运行在其他GPU),然后显存不足指的是在初始化的时候显存不足,也就是第0块GPU显存不足以支撑初始化了,一般初始化其实并不消耗多少显存,比模型运行时一般小多了,那为什么还会报错呢?:仅有5号gpu可见,此时gpu编号会改变,5号gpu会变成0号gpu,所以指定0号gpu,其实就是指定原来的5号gpu。我们其实就是要解决Pytorch指定了gpu但还是会占用了一点0号gpu(初始化默认会在0上面)。

2023-12-29 11:56:15 1558

原创 (salutation称呼)Mr., Mrs., Miss, Ms., Mx.,Jr.,Sr.,II,III,IV 分别是什么意思

Mx.:在性别方面,常见的英文称谓主要有Mr. (先生)、Mrs. (太太)、Miss(小姐)及Ms.(女士)等。这个词的出现显然和时代发展有关,我们知道,人是分男女的,几乎各行各业都遵守,有些人就觉得没有必要,都是人,所以就有那种无性别论的人,如果出国,可能会见到。Sir:也是先生,可以直接称呼一个不知姓名的男士,作为对比Mr. 后要加姓,Miss其实也可以用于直接称呼一个不知姓名的女士。Miss:小姐(未婚),但不严格,有的时候学生称呼女老师可以直接用这个词,不必管是否结婚。Mrs.:太太(已婚)

2023-12-24 10:14:34 1882

原创 (已解决)如何使用matplotlib绘制小提琴图

绘制小提琴图,本人暂时不想学新的东西,就是懒。本文介绍如何使用matplotlib绘制小提琴图,很多其他博客只是使用最简单的语法,默认小提琴颜色会是蓝色,根本改不了。本文使用了一点高级的用法,可以满足基本日常需求。想要更加高级怎么办?

2023-12-18 23:07:57 586

原创 (已解决)set_ticks() got an unexpected keyword argument ‘labels‘

这个玩意是Matplotlib 3.1及以上版本的用法,而你的版本低于这个版本,不支持。方法1:更新你的Matplotlib版本。这里给两种方法,个人推荐方法2。上述代码的功能和新版本的。

2023-12-18 22:22:54 777

原创 在linux环境下使用命令行运行python项目时包(模块Module)以及文件路径的问题

由于个人一直习惯就是使用绝对路径,所以以前一般比较少碰到标题所示的问题。这次遇到一个项目,其全部使用的是相对路径,然后我在linux环境下运行。是一个绝对路径,所以你进入linux之后,可以在任何工作目录执行上述命令。其次,如果项目文件中导入包是相对路径(这个一般都是),例如假设我们的。但是,如果这个项目里面有代码使用相对路径,例如代码要打开文件。提醒python如果找不到包可以在上述目录下寻找。,那么就有可能报错。不报错的情况是,你需要在。那么如上还是可能会报错,即没有模型名字叫做。

2023-11-03 21:58:56 708

原创 (完全解决)如何输入一个图的邻接矩阵(每两个点的亲密度矩阵affinity),然后使用sklearn进行谱聚类

网上倒是有一些关于使用sklearn进行谱聚类的教程,但是这些教程的输入都是一些点的集合,然后根据谱聚类的原理,其会每两个点计算一次亲密度(可以认为两个点距离越大,亲密度越小),假设一共有N个点,那么就是。参数其实就是距离计算公式你选用哪个的意思,比如我们常常知道的欧式距离,曼哈顿距离,当然谱聚类里面不是这些。总之,实际使用中,哪个效果好用哪个,建议官方提供的距离你都可以试一试。然后算法再根据这些亲密度进行聚类,即亲密度越大的点,他们应该聚在一起。,注意邻接矩阵需要为正数,否则报错,所以我们下面用了指数。

2023-10-22 20:25:59 1332

原创 latex如何设置字体大小

通常,下面这些控制字体大小的命令就够用了。那么hello就会使正常字体大小。

2023-10-18 11:44:22 1604

原创 (完全解决)latex如何设置某段文字向右对齐

也就是说不是像上上图那样,文字后面空格一大堆,然后是日期。开门见山,老子就是想要下图中日期的效果,可以看到,日期向右对齐。但是试过了好像不行,其是换一行,然后向右对齐。

2023-10-18 11:30:18 3685 1

原创 (latex中appendix附录怎么写)以及(附录里面的图片表格之类的如何重新编号)

正文可以引用附录,附录也可以引用正文,包括引用文章。这个很简单,我一开始以为很复杂。

2023-10-15 10:51:24 7694

原创 Dirac delta function (狄拉克 delta 函数)

其不是一个具体的函数,而是具有某一性质的函数的总称。比如正态分布只是一个总称,不告诉均值和方差你根本不知道它长什么样。总结就是,该函数满足积分为1,积分区间为无穷小,概率密度为无穷大,所以非常地抽象。

2023-10-14 11:29:10 172

原创 如何实现torch.arange的tensor版本

因为这样才可以保证,输出的结果的维度是一样的。步长一个是1,一个是2,这样肯定不行,两个。输出的维度不同,就肯定不可能并行。细心的人可以发现,上面是具有特殊性的,输出的维度还是会不同,无法并行。(end-start),最终。并行做,难道就不行吗?

2023-10-04 11:30:22 419

原创 会议AISTATS(Artificial Intelligence and Statistics) Latex模板参考文献引用问题

在看AISTATS2024模板的时候,发现模板里面根本没有教怎么引用,要被气死了。如下,引用的时候,模板是自己手打上去的?而且模板提供的那三个引用,根本也没有Cheesman这个人,顿时就感觉这模板谁写的,写得太烂了。

2023-09-30 16:36:56 630 1

原创 (matplotlib)如何将x轴或者y轴刻度显示到小数点后1位或者后若干位

那如果我们就是为了统一格式,必须小数点后一位呢?这个时候我们要拿出大杀器,一个所见即所得的东西,yticks不是所见即所得,但是参数。这个问题乍一看好像很简单,使用xticks或者yticks不就行了吗,想几位小数就几位小数,例如。可以看到,刻度会完全展示labels里面的东西,labels里面是几位小数,那么刻度就是几位。我问你,画出来的图真的会是一位小数吗?

2023-09-14 15:47:52 1479

原创 (matplotlib)如何不显示x轴或y轴刻度(ticks)

可以发现,正常情况下是有刻度的,如果我不想要刻度该怎么办呢?

2023-09-14 11:26:27 2212

原创 (Pytorch)判断一个tensor中是否存在nan

有的时候写代码会遇到nan的情况,遇到这种情况你肯定要去解决的,说明你代码有问题。如果你不解决,大概率由于模型前向传播+训练导致模型中所有tensor都是nan,甚至中途就报错了。我们首要是对一些你认为关键的tensor变量进行检测是否为nan,然后停下来,进一步分析nan的原因。nan的原因有非常之多,这里就不介绍了,大家可以看看。

2023-09-13 11:49:19 1321

原创 (matplotlib)如何让各个子图ax大小(宽度和高度)相等

这个东西,好像确实会导致整个子图变形,会和其他3个子图不一样,但是我仍然不知道为什么前面三个子图不是一样宽高。百思不得其解,最后找了好久终于在网上找到了解决办法,但是你要我说为什么上面代码会不相等,我也不知道。下面是源代码,虽然有点长,但是后面3个子图其实都是复制黏贴画第一个子图的代码而已。,这个东西是一个好东西,建议大家学一学,可能可以顺带解决很多其他大小问题。然后往各个子图中填充东西,可以最终得到四个大小不一样的子图,气死了。我用如下subplots代码画一行四个子图,,四个子图大小还是不一样。

2023-09-12 22:35:49 1787

原创 (matplotlib已解决)ValueError: Invalid RGBA argument: ‘o‘

使用matplotlib画散点图,给每一个点配置一个颜色的时候出现了这个错误。解决办法:不要使用"o",可以使用如下颜色,

2023-09-09 20:10:21 493

原创 各种论文模板(IEEE,ACM,Springer)如何使用bibliography,bibliographystyle导入参考文献

在用latex写论文的时候,会遇到各种模板,如果你要投IEEE的期刊或者会议,就得使用相应的latex模板。对于普通使用者来说,在写latex的时候这些不同的模板大同小异,比如将模板中的标题,摘要,介绍等等替换为自己的。但是有一个地方,不同的模板有一些不一样,那就是引用参考文献部分,那里需要使用命令,或者,这些xxx命令有的模板里面会介绍是什么,但是今天遇到没有介绍的,特此记录。

2023-08-30 10:11:10 2896 1

原创 RuntimeError: Function MmBackward returned an invalid gradient at index 0 - got [1984, 64] but expec

这个据我观察,一般都是linear层的输入输出维度写错了,然后反向传播的时候出现了问题(我自己是这样,然后网上找了另外一个人的答案也是这样)。到底是哪里输入输出维度写错了呢?你找下维度为64的linear层,检查一下就行了,好像只能挨个检查,因为报错信息就这么多。别问我为什么维度写错了,竟然还能前向传播,其实我也纳闷,按照道理矩阵相乘维度不匹配,不应该直接报错吗?有谁知道了评论区踢我一下,我把我的错误线性层代码贴在下面。

2023-08-29 17:49:38 1566 2

原创 在使用springer模板的时候,引用书 book时候,末尾的引文地方出现问号???

一个问题,我怎么知道出版地点是在哪里,反正我是在这本书的官方网站上看到的。这一项,也就是出版地点。

2023-08-23 16:56:39 240

原创 ECIR(The European Conference on Information Retrieval )

记录一下这个会议的接受率。

2023-08-22 19:27:20 323

原创 latex中两种图并排放,而且各自有小标题caption

【代码】latex中两种图并排放,而且各自有小标题caption。

2023-06-30 09:50:39 2194 2

原创 typeError: file must have ‘read‘ and ‘readline‘ attributes/ ‘ascii‘ codec can‘t decode byte 0x80

这是在使用pickle读取.pkl文件的时候出现的错误,需要提醒的是,pickle读取.pkl可能会出现很多错误,这一篇文章是否适合你你需要对号入座。本人在使用pickle的时候遇到两个错误。

2023-06-28 11:54:02 1165

原创 使用networkx查看某一个节点的一阶/二阶/三阶邻居

一般情况下,貌似这些图之类的包,只提供查询一个节点的一阶邻居,但是有的时候我们需要二阶甚至三阶,那么该如何做呢?注意一下,本文的方法仅可以针对二阶或者三阶,更高阶的代码没有提供。假设有下面这个图。

2023-06-23 16:49:20 1648

littileprince1-5.txt

而且只选取了其5/25章来训练,模型可谓相当小,但是麻雀虽小五脏俱全。

2021-07-11

Dataset.rar

这是中文电影评论数据集,数据集还算大,大型模型可以用,小型模型使用一部分,所以也可以。数据集的质量挺高的。

2021-07-10

convert_bert_tf_checkpoint_to_pytorch.py

将基于TensorFlow的谷歌发布的官方BERT模型转化为基于Pytorch的BERT模型

2021-06-26

chinese_wwm_ext_pytorch.rar

基于pytorch的中文bert模型。

2021-06-26

chinese_L-12_H-768_A-12.rar

这是一个已经训练好的中文bert模型,参数都是可以用的参数,可以直接拿来用。这个是轻量版的,不过要注意这个是基于Tensorflow的,不过据说有可以将其转化为pytorch版本的脚本,可以自己搜一下。

2021-06-26

中国科学院大学现代智能优化方法韩丛英老师期末考试要点

中国科学院大学现代智能优化方法韩丛英老师期末考试要点

2021-05-19

国科大2020-12-30自然语言处理考试.txt

国科大2020-12-30自然语言处理考试回忆

2021-05-11

中国计算机学会推荐的国际期刊和会议,

中国计算机学会推荐的国际期刊和会议-2019年发布的。在计算机的每一个方向都分为了A,B,C类。

2021-04-29

finaltest.txt

国科大编译高级教程期末考试考点和经验

2021-03-23

emnlp2021-latex.zip

atex版本EMNLP2021论文模板lEMNLP2021论文模板lEMNLP2021论文模板lEMNLP2021论文模板l

2021-03-20

acl-ijcnlp2021-templates.zip

latex版的ACL2021论文模板ACL2021论文模板ACL2021论文模板ACL2021论文模板ACL2021论文模板ACL2021论文模板

2021-03-20

Points-to analysis in almost linear time

Steensgaard的论文,指针分析的算法,流不敏感Points-to analysis in almost linear time,Points-to analysis in almost linear time,Points-to analysis in almost linear time

2020-12-11

Statistic-2.6.1.rar

这个可以用来统计你的项目的代码行数,我是用在android studio中,其他开发工具中也应该都可以用。这个是一个插件,很小。

2020-04-29

使用JSON所必须的6个包

在网络数据传输的时候选择把我们的数据变成json格式是非常好的,而这个就需要这6个包的支持。这6个包可以帮忙进行生成和解析,非常方便使用。

2020-04-28

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除