自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Wang laiqi's blog

悠长岁月平静,无事亦是蹉跎

  • 博客(113)
  • 资源 (11)
  • 收藏
  • 关注

原创 【无标题】

linux 终端clear命令无效,并返回:terminals database is inaccessible。step1: vim ~/.bashrc 在里面添加如下信心。

2024-02-20 16:09:13 294

原创 scp通过跳板机向服务器传文件的方法

在实际情况下如果目标服务器无法通过ssh直接连接,需要跳板机才能连接,如何使用scp呢?目标服务器host2: 192.168.42.9 user:admin2。跳板机host1:192.168.32.7 user:admin1。通过如下命令用scp命令进行传输。

2023-10-23 15:21:51 1157

原创 visual-studio-code通过跳板机连接远程服务器的配置操作

把本机生成的rsa_id.pub公钥上传至服务器中,并追加(cat命令) 写入到~/.ssh目录下的authorized_keys文件中。如果~/.ssh目录下没有authorized_keys文件,则需要我们手动创建一个。step5:visual studio code 连接服务器不需要密码的操作。生成的两个默认文件中,id_rsa.pub是公钥,id_rsa是私钥。打开下图中的配置文件,并输入跳板机和服务器的配置信息。step3:将本机生成的私钥和公钥上传服务器上。step1:在本机上生成私钥和公钥。

2023-10-10 11:36:22 318

原创 bash: /usr/bin/mv: Argument list too long

【代码】bash: /usr/bin/mv: Argument list too long。

2023-08-14 10:54:18 302

原创 Visual Studio Code 设置文件头部添加作者、日期和函数注释

step2:左下角选择管理—设置—输入"fileheader"—点击"在setting.json中编辑"step1:安装插件KoroFileHeader。step3:添加下面的代码到json文件中。

2023-07-31 16:56:19 1458

原创 How to resolve “RuntimeError: CUDA out of memory”?

【代码】How to resolve “RuntimeError: CUDA out of memory”?

2023-07-14 16:22:32 522

原创 GitClone报错:GnuTLS recv error (-110): The TLS connection was non-properly terminated.解决方法

尝试了下面这种解决办法,没有解决。最终使用下面的方法解决的。

2023-07-12 14:03:19 378

原创 ubuntu系统linux下安装指定版本的gcc方法

1:查看当前linux系统的gcc版本。2:查看和cuda版本对应的gcc版本。3:安装和cuda对应版本的gcc。4:建立gcc和cuda的软链接。

2023-07-05 10:17:00 1899

原创 git从版本库中删除文件但不删除物理文件

【代码】git从版本库中删除文件但不删除物理文件。

2023-06-30 15:41:55 116

原创 E: Unmet dependencies. Try ‘apt --fix-broken install‘ with no packages (or specify a solution) libre

遇到这个错误的解决方法。

2023-06-21 14:49:04 292

原创 Tar Argument list too long 参数列表过长的解决办法

当对一个目录里面的文件进行压缩(tar)时,而这个文件数量超过三万个,就会遇到标题中的问题。

2023-03-29 10:19:43 385 1

原创 Docker容器的基本操作方法

docker 容器的基本操作

2022-11-12 18:22:01 171

原创 TensorRT8.2.1.8基于Docker容器快速安装

基于Docker安装Tensorrt的方法介绍

2022-11-12 17:46:07 1387

原创 Linux中buff/cache内存占用过高进行清除

清除linux上的buff/cache

2022-11-08 13:58:59 1451

原创 vscode connect server not use input password

visual studio code 连接远程 linux 服务器,不用每次都输入密码

2022-11-05 15:28:15 171

原创 Brief Review — Improving Neural Machine Translation Models with Monolingual Data

the nlp domain machine translation

2022-09-14 19:13:26 290

原创 fairseq-generate-info

translation result

2022-07-13 11:05:00 180

原创 TypeError: can‘t convert cuda:0 device type tensor to numpy. Use Tensor.cpu() to copy the tensor to

AttributeError: 'list' object has no attribute 'cpu'

2022-06-10 09:54:19 325

原创 “bernoulli_scalar_cpu_“ not implemented for ‘Half‘

CPU 不支持半精度计算,重新安装成GPU版本的pytorch 就可以查看安装的pytorch是否能使用CUDA进行加速计算import torchtorch.cuda.is_available()

2022-04-21 12:02:38 4492

原创 vim debug python use pdb

pdb Python自带的一种debug工具pdb 的两种用法1: 非侵入式方法python -m pdb filename.py2: 侵入式方法Import pdbpdb.set_trace()3: 常用命令l:查看当前位置前后11行源代码ll:查看当前函数或框架的所有源代码n: 执行下一行不会进入函数体c:持续执行下去,直到遇到一个断点n:执行下一行(不会进入函数体)s:执行下一行(能够进入函数体)p:打印变量,相当于print()函数q:退出调式器referen

2022-04-19 17:54:49 1031

原创 create virtual environment

for linux and windowswget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.shFor OSXwget https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-x86_64.shInstall minicondash Miniconda3-latest-*-x86_64.sh -bRun conda init~ /

2022-04-15 11:42:53 375

原创 Tf中指定GPU的使用和配置

1:在终端执行程序指定GPUCUDA_VISIBLE_DEVICES=0 python demo.py其他可用的形式CUDA_VISIBLE_DEVICES=0,1CUDA_VISIBLE_DEVICES=“0,1,2”2:在python代码中指定GPUimport osos.environ["CUDA_VISIBLE_DEVICES"]="0,1"3:设置定量的GPU使用量import tensorflow as tfconfig = tf.ConfigProto()confi

2022-04-12 17:05:31 2407

原创 server certificate verification failed. CAfile: /etc/ssl/certs/ca-certificates.crt CRLfile: none

出现以上问题如何解决git config --global http.sslverify false

2022-02-10 15:35:23 1096

原创 Python常用的几个函数解析

1:yield一个带有yield的函数就是一个generator, 它和普通的函数不同,生成一个generator看起来像函数调用,但不会执行任何函数代码,直到对其调用next()才开始执行。虽然执行流程仍按照函数的流程执行,但每执行到一个yield语句就会中断,并返回一个迭代值,下次执行的时候从yield的下一个语句继续执行。看起来就如同一个函数在正常执行的过程中被yield中断了数次,每次中断都会从当前的yield返回当前的迭代值。yield的好处是显而易见的,把一个函数改写成一个generator

2022-01-21 14:57:10 360

原创 自然语言相关任务介绍

自然语言相关任务介绍

2022-01-20 18:54:16 416

原创 深度学习的基本概念介绍

Tensor概念介绍可以把Tensor理解为多维数组,可以具有任意多的维度,不同的Tensor可以有不同的数据类型(dtype)和形状(shape)同一Tensor中的所有元素的dtype均相同。不同维度的Tensor可视化表示为如下图所示。模型和层的概念模型是深度学习中比较重要的概念,模型的核心功能是将一组输入变量经过一系列的计算,映射到另一组输出变量,用到的映射函数就是一种深度学习算法。模型主要包含两方面的内容。(1)一系列层的组合用于进行映射。(2)一些参数变量在训练的过程中实时更新.

2022-01-20 10:38:26 993

原创 2022年预训练的下一步发展

1:基于数据驱动存在的问题长尾效应:现实中的数据分布就是长尾的,在学习的过程中,模型容易出现过拟合,泛化性差。数据噪声:对于有标签的数据,在标注过程中就不可避免的存在噪声。尤其是多人在标注一份数据集的时候,由于每个人的知识背景都不一样,对于问题的理解也就不一样,因此对同一份数据集的标注结果就会存在误差。也就是说,标注规范难以确定,无法统一大家的知识库。2:基于预训练语言模型存在的问题预训练模型的方式归根结底仍然属于数据驱动的任务,其通过在大规模数据上学习,推断未知数据的概率。如果数据中存在表述不

2022-01-12 10:42:35 53

原创 快速高效的阅读一篇AI论文方法

1 发现有趣AI论文的地方Papers With Code.RedditMedium2 掌握论文背景信息论文解决什么问题使用什么方法,该方法有什么优缺点3 把握主要观点先看一下各个章节和小节的标题,把它们与文章所介绍的模型架构联系起来4 客观看待实验结果检查比较基准:作者对比的是否全面检查Ablation:文章给出的pipeline方案中每个组成部分对实验结果的贡献上,贡献大小是否都被检验检查数据:用于论文所处理任务的开源主流数据是否提到了5实验结果整理论文中提到的实

2021-12-24 18:05:56 1137

原创 使用Pandas对数据集进行操作

1 数据信息如下表所示

2021-12-22 11:25:07 1045

原创 github pages +hexo 搭建个人博客

搭建个人的博客https://blog.csdn.net/weixin_43664418/article/details/103542206?spm=1001.2101.3001.6650.7&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-7.highlightwordscore&depth_1-utm_source=distribute.pc_relevant.none-t

2021-12-16 15:12:44 162

原创 NLP技术发展史

1:NLP技术发展时序图

2021-10-28 14:35:36 372

原创 XLNet和Bert语言模型的对比

1.XLNet和Bert的对比分析1.1 自回归语言模型(Autoregressive LM)就是从左向右依次计算某个词出现的概率或者从右向左计算某个词出现的概率,典型代表就是GPT1.2 自编码语言模型(Autoencoder LM)把句子中的某个词用【MASK】替换掉,然后根据该单词的上下文来预测该单词,典型代表就是BERT1.3 两种模型的优缺点自回归语言模型没有能自然的同时获取单词的上下文信息,而自编码语言模型能很自然的把上下文信息融合到模型中,Bert中的每个Transformer都能

2021-10-28 11:33:22 323

原创 各种领域匹配数据汇总

ATEC:是金融领域客服场景的数据.BQ:银行领域的问题匹配,BQ数据链接。LCQMC:覆盖多个领域的问题匹配,LCQMC数据链接。PAWSX:谷歌发布的数据集,包含多种释义对和非释义对。STS-B:计算两句话的相关性,是通过翻译和人工修正后的数据集。...

2021-10-27 10:43:50 451

原创 NLPer核心竞争力是什么?

NLPer的危机核心开源工具越来越多CNN、RNN、Transformer、Seq2Seq等。深度学习技术出现后,特征工程做的越来越少。NLP门槛逐渐降低有众多的开源工具和预训练语言模型可用。算力成为主要的瓶颈。NLPer的核心竞争力一个核心非机构、半结构化—>结构化是NLP的核心问题两个能力发现问题的能力解决问题的能力三个优势对基本概念,定义理解更精准对领域数据更敏感对研究方向有更好的品味自然语言处理的本质从无结构化序列中预测有结构化语义(句法分析、命名

2021-10-12 10:31:17 284

原创 机器阅读理解技术简介

1:什么是机器阅读理解任务机器阅读理解任务类似英文的阅读理解题型,输入:篇章P和问题Q,输出:答案A的过程。2:机器阅读理解任务类型机器阅读理解任务主要包含四种类型:选择型、填空型、抽取型、生成型。填空型阅读理解任务在该类型的任务中,给定一段文本并移除其中若干词或者实体作为问题,模型需要在被删除的位置填入正确答案。部分数据集提供了候选答案,而另外一些数据集则未提供,只能从上下文中寻找。选择型阅读理解任务选择型阅读理解即根据问题和给定的文本中在若干候选答案中选择正确的答案。抽取型阅读理解任务

2021-10-08 11:44:19 258

原创 推荐系统的相关知识点介绍

1:推荐系统的基本概念构建推荐系统本质上是要解决“5W”的问题,即向谁(who)在什么时间(when)在什么地方(where)推荐什么内容(what)并解释为什么推荐(why)2:常见的推荐算法(1)协同过滤推荐算法(Collaborative Filtering Recommendation):该算法的核心是分析用户的兴趣和行为,利用具有共同行为习惯的群体有相似喜好的原则,推荐用户感兴趣的信息。基于用户的协同过滤:根据用户的历史喜好,分析出具有相似兴趣的人,然后给用户推荐其他人喜欢的物品。基

2021-09-26 15:28:14 311

原创 递归和迭代的理解

To Iterate is Human, to Recurse, Divine.中文译为:人理解迭代,神理解递归关于递归和循环的生动解释1:递归你打开面前这扇门,看到屋里面还有一扇门。你走过去,发现手中的钥匙还可以打开它,你推开门,发现里面还有一扇门,你继续打开它。若干次之后,你打开面前的门后,发现只有一间屋子,没有门了。然后,你开始原路返回,每走回一间屋子,你数一次,走到入口的时候,你可以回答出你到底用这你把钥匙打开了几扇门。2:循环你打开面前这扇门,看到屋里面还有一扇门。你走过去,发现手中的钥

2021-09-15 16:17:50 149

原创 从Elasticsearch索引库中读取数据的操作

从ES索引库中读取数据的代码逻辑如下:#!/usr/bing/env python# -*-coding:utf-8-*-# author:xx# datetime:21-x-x 下午xx:xx# software:PyCharmimport osimport sysimport jsonimport inspectfilename = inspect.getframeinfo(inspect.currentframe()).filenamematrix_dir = os.path

2021-08-09 18:26:37 436

原创 Linux 下解压缩文件命令

1:压缩命令tar -zcvf 压缩文件名.tar.gz 被压缩文件名2:解压命令tar -zxvf 压缩文件名.tar.gz

2021-08-09 18:00:26 110

原创 Linux修改用户密码

1:在root用户下,修改root用户的密码passwd输入两遍新密码2:在root用户下,修改普通用户的密码,如修改nlp用户的密码passwd nlp输入两遍新密码

2021-08-02 09:39:57 82

B0016+周志华_如何做研究与写论文?.zip

研究不等于研发 研究的目的是发现新知识、发明新技术 研发:基于已有的知识和技术进行研制、开发 科学研究扩展人类的知识

2020-10-16

Pytorch 中文官方教程

PyTorch是一个基于Torch的Python开源机器学习库,用于自然语言处理等应用程序。它主要由 Facebookd的人工智能小组开发,不仅能够 实现强大的GPU加速,同时还支持动态神经网络,这一点是现在很多主流框架如TensorFlow都不支持的。

2020-10-14

MachineLearning

介绍machineLearning在数据处理过程中的实际用法

2016-09-29

Statistic Concept Summary

介绍描述数据的统计概念

2016-09-29

模式识别和机器学习

模式识别和机器学习的中文版,里面详细介绍了,机器学习的一些算法

2016-04-16

googleMapreduce文章

google发表的mapreduce文章,主要用来介绍mapreduce的工作原理。

2016-04-16

java程序打包成jar文件和exe文件的详细步骤

java桌面应用程序如何打包成jar文件和可执行的exe文件的详细步骤和过程介绍,以及解决其中的问题方法。

2016-04-16

Android编程入门教程andbook中文版

Android编程入门教程andbook中文版,适合初学者进行学习,

2014-09-03

GoogleAndroidSDK开发范例大全

GoogleAndroidSDK开发范例大全,本书含有很多的实例供开发者进行练习。每个案例都讲解的很详细,适合android开发者使用。

2014-09-03

Android应用开发详解pdf和源代码

Android应用开发详解pdf和源代码,本书内容讲的很详细,而且实例很丰富,适合初学者和具有一定开发经验的android学习者进行学习。

2014-09-03

Android中listView的讲解

详细的android中listView控件的案例实现,有利于android学习者对listView控件的学习。

2014-08-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除