自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 问答 (1)
  • 收藏
  • 关注

原创 XLNet:语言理解的生成自回归预训练模型一

看了XLNET的语言模型的论文,基于自身的理解,编写了这篇文章,有写的不对的地方希望大家能够指出,在此希望能和大家一起学习。 传统意义上的自回归语言模型不具有构建双向上下文信息模型的能力,而类似于bert的自编码器的语言模型可以解决这个问题,但是他是依赖于【mask】掩码去实现双向构建模型,所以忽略了mask位置之间的依赖关系,并存在预训练语义微调的差异,为了同时获取自回归语言模型考虑上下文信息和bert模型双向构建的优点,开始构建了xlnet模型。 先介绍...

2021-01-27 18:05:56 388

原创 pandas读取CSV文件各种报错情况

将csv文件全部复制到一个txt文本中,使用utf-8格式去进行存储,使用open,readlines去读取文件,则可以解决问题

2019-11-20 18:41:43 384

转载 ValueError:仅作用域名称为xxx的分配映射应映射为仅作用域xxx。应该是'scope /':'other_scope /'。

解决方法:modeling.py/get_assignment_map_from_checkpoint- assignment_map[name] = name+ assignment_map[name] = name_to_variable[name]

2019-10-22 14:19:22 676 6

转载 python对应打乱两个数组或者列表的方法

数组采用numpy.random.get_state() , numpy.random.set_state()list列表随机种子random.seed:zip方式:

2019-10-15 10:11:54 808

原创 字符集编码问题

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start byte出现这种情况,可以尝试编码格式改为unicode_escape可以解决问题还有一种去除txt文本的//uff ,可以使用utf-8-sig编码模式...

2019-10-15 09:52:32 99

原创 Surprise库部分替代函数

今天写推荐算法协同过滤的时候接触了surprise库,发现许多网上原来的方法已经被弃用了,再次做下备注data.split()方法变成surprise.model_selection中的KFoldevaluate等预测方法也被弃用了,改为使用accuracy去预测例子(电影表):from surprise import SVDfrom surprise import Data...

2019-09-23 13:52:57 417

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除