自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

日积月累,天道酬勤

我代码写的少,你可别骗我

  • 博客(507)
  • 资源 (28)
  • 收藏
  • 关注

原创 从零实现深度学习框架【实现自己的PyTorch】

本着“凡我不能创造的,我就不能理解”的思想,此系列文章会基于纯Python以及NumPy从零创建自己的深度学习框架,该框架类似PyTorch能实现自动求导。

2021-12-19 15:38:18 4633

原创 人工智能数学基础之高等数学

人工智能中用到的高数知识,看这一篇就够了。

2019-07-15 23:18:25 11021 6

原创 [论文笔记]Root Mean Square Layer Normalization

⭐ 作者在层归一化的基础上移除掉均值相关项,得到了RMSNorm。然后通过实现证明其效果还不错。

2024-04-17 19:43:52 870

原创 [论文翻译]GQA: Training Generalized Multi-Query Transformer Models from Multi-Head Checkpoints

⭐ 本篇工作提出分组查询注意力,简单来说就是在MQA的基础上增加了key-value头的数量,经过实验证明取得了不错的效果。

2024-04-13 23:20:49 595

原创 [论文翻译]GLU Variants Improve Transformer

⭐ 作者用流行的激活函数(Swish,GeLU和ReLU等)替换GLU中的激活函数,得到了一个困惑度比较好的GLU变体——SwiGLU,但作者也无法解释效果好的原因。

2024-04-13 21:39:12 609

原创 [论文笔记]ROFORMER: ENHANCED TRANSFORMER WITH ROTARY POSITION EMBEDDING(下)

该论文提出了旋转位置编码,是后续很多大模型默认的编码方式。

2024-04-13 19:59:04 243

原创 [论文笔记]ROFORMER: ENHANCED TRANSFORMER WITH ROTARY POSITION EMBEDDING(上)

该论文提出了旋转位置编码,是后续很多大模型默认的编码方式。

2024-04-13 19:56:35 100

原创 复数与二维空间旋转

为了理解旋转位置编码才有了这篇文章

2024-04-06 17:57:02 586

原创 李宏毅深度强化学习导论——当奖励是稀疏的

本文介绍如何处理稀疏奖励问题。

2024-04-01 20:41:38 588

原创 GPT2从放弃到入门(四)

本文介绍如何将模型转换为ONNX,并在HuggingFace的Spaces上部署提供给大家访问。

2024-03-26 22:49:52 1073

原创 李宏毅深度强化学习导论——演员-评论员

本文主要介绍演员-评论员(Actor-Critic)算法。

2024-03-26 08:32:07 651

原创 李宏毅深度强化学习导论——策略梯度

本文介绍了什么是策略梯度

2024-03-25 20:44:29 646

原创 GPT2从放弃到入门(三)

本文介绍文本生成中一些基本方法的原理:温度、TopK、TopP等。这些方法通常可以组合在一起使用。

2024-03-23 13:54:40 751

原创 李宏毅深度强化学习导论——基本概念

李宏毅强化学习简介

2024-03-21 22:33:01 787

原创 GPT2从放弃到入门(二)

本文介绍如何利用GPT2从零训练一个多轮对话聊天机器人,按照本文的思路可以轻松地训练自己的数据。

2024-03-21 20:35:40 740

原创 [论文笔记]LLaMA: Open and Efficient Foundation Language Models

⭐ 作者提出了LLaMMA系列模型,可以说天不生LLaMMA,开源大模型万古如黑夜。比较详细的介绍了模型实现细节,重要的是开源了实现代码。除了提供了在模型实现优化上的思路外,还给出了提高训练(推理)效率的方法。

2024-03-14 20:33:11 603

原创 [论文笔记]DouZero: Mastering DouDizhu with Self-Play Deep Reinforcement Learning

本篇论教你如何训练一个强化学习模型来斗地主

2024-03-11 19:00:31 403

原创 GPT2从放弃到入门(一)

本文从零实现GPT2,在最后通过GPT2实现小说生成器。

2024-02-26 18:50:28 934

原创 手写GPT实现小说生成(二)

介绍了从零实现GPT并训练一个小说生成器的细节。

2024-01-26 20:15:00 2370 2

原创 手写GPT实现小说生成(一)

从零实现GPT模型并训练小说生成器。

2024-01-19 19:23:12 832 2

原创 Transformer从菜鸟到新手(七)

本文主要介绍束搜索的实现与原理,最后证明通过束搜索可以得到更好的结果。

2024-01-16 20:45:00 942

原创 Transformer从菜鸟到新手(六)

本文介绍KV缓存技术的原理和实现。

2024-01-11 20:00:00 944

原创 Transformer从菜鸟到新手(五)

本文介绍如何利用PyTorch进行多GPU并行训练。

2024-01-09 22:50:23 1058

原创 Transformer从菜鸟到新手(四)

本文介绍训练Transformer的一些不可忽略的细节。

2024-01-08 09:00:02 427

原创 Transformer从菜鸟到新手(三)

本文开始完整实现Transformer

2024-01-05 09:02:43 967

原创 Transformer从菜鸟到新手(二)

Transformer中位置编码和多头注意力的详解。

2024-01-04 09:10:04 979

原创 Transformer从菜鸟到新手(一)

从本文开始回顾一下Transformer的原理与实现细节,包括分词算法BPE的实现。最终利用从零实现的Transformer模型进行英中翻译。

2024-01-02 21:30:00 1106

原创 RE2文本匹配调优实战

在的最后,博主说过会结合词向量以及其他技巧来对效果进行调优,本篇文章对整个过程进行详细记录。其他文本匹配系列实战后续也会进行类似的调优,方法是一样的,不再赘述。本文所用到的词向量可以在文末找到,免费提供下载。完整代码在文末。

2023-12-11 19:11:29 1184

原创 Gensim训练中文词向量实战

一步一步利用gensim训练中文词向量

2023-12-04 19:25:43 467

原创 MatchPyramid实现文本匹配

把文本匹配看成是图像识别的思路。

2023-11-30 20:00:00 949

原创 [论文笔记]MatchPyramid

⭐ 作者将文本匹配看作是图像识别任务。将两端文本单词之间的匹配矩阵当成是图像,然后应用分层卷积网络捕获丰富的匹配模式。

2023-11-23 20:00:00 1072

原创 RE2文本匹配实战

逐行实现RE2文本匹配

2023-11-19 20:23:59 296 3

原创 [论文笔记]BGE

⭐ 作者发布了C-Pack,一套推进中文文本嵌入领域的资源包。包含中文文本嵌入基准C-MTEB、大规模文本嵌入数据集C-MTP和多个规模的嵌入模型BGE。同时还发布了完整的训练方法。

2023-10-31 22:18:41 956

原创 [论文笔记]RetroMAE

⭐ 作者提出了一种掩码自编码框架RetroMAE,用于预训练面向检索的语言模型:输入句子在编码器和解码器中被随机遮盖,然后将句子嵌入与解码器的遮盖输入拼接起来,重构原始输入。

2023-10-31 21:48:28 803

原创 [论文笔记]GTE

⭐ 本篇工作提出了一个两阶段对比学习方法,通过一个改进的对比学习目标,在固定的批次大小下能够有效地扩大负样本池,在无监督预训练阶段采用在网上公开的数据构建出大量的弱监督文本对,在有监督微调阶段也从大量任务和领域中收集数据进行微调,结合这两个阶段训练了一个统一的文本嵌入模型。

2023-10-28 09:09:47 1582

原创 [论文笔记]E5

⭐ 作者提出了E5模型,以带弱监督信号的对比学习方式训练。提出了一种新的数据集CCPairs,在这个新的数据集上E5得到了不错的性能。

2023-10-28 09:08:22 735

原创 [论文笔记]MobileBERT

⭐ 作者提出了MobileBERT,是一种任务无关的BERT变体,仅需简单的微调就能广泛地应用于不同的下游任务。MobileBERT被设计成和BERT-large一样深,是一种深而窄的结构,通过采用瓶颈结构与在自注意力和前馈网络之间的平衡来窄化每层。提出了替换层归一化和改用relu激活来提升模型的速度,但会有一定程度上(一个点左右)的性能下降。

2023-10-23 20:00:00 409

原创 [论文笔记]NEZHA

⭐ 本篇工作,作者主要提出了功能相对位置编码技术,可以使模型具有更强的扩展性,当遇到比训练中序列长度更长的序列时,依然可以发挥作用。

2023-10-22 22:29:15 623 3

原创 [论文笔记]GPT-2

⭐ 作者提出了GPT-2,针对GPT-1进行了一些修改,基于无监督训练。使用Pre-LN的层归一化方法;在最后一个自注意力块后添加了一个额外的层归一化;修改了残差层权重缩放因子;扩充了词汇表;将上下文大小从512扩充到了1024;使用了更大的批次512。作者开始注意到零样本设定下的表现,观察到语言模型的容量对性能至关重要。给最终性能超群的175B参数GPT-3一个启发。

2023-10-21 10:00:01 608

原创 [论文笔记]GPT-1

⭐ 作者提出了GPT(1代),一种基于大量无标签文本数据上进行语言建模任务预训练,然后通过进行与任务匹配的较小修改来进行微调,取得了不错的效果。

2023-10-20 20:00:00 793

Transformer机器翻译数据集

机器翻译数据集,使用教程 https://helloai.blog.csdn.net/article/details/135344697

2024-01-03

英文-中文机器翻译数据集

中英文翻译数据集: Anyone can do that. 任何人都可以做到。 How about another piece of cake? 要不要再來一塊蛋糕? She married him. 她嫁给了他。 I don't like learning irregular verbs. 我不喜欢学习不规则动词。 It's a whole new ball game for me. 這對我來說是個全新的球類遊戲。 He's sleeping like a baby. 他正睡着,像个婴儿一样。 He can play both tennis and baseball. 他既会打网球,又会打棒球。 We should cancel the hike. 我們應該取消這次遠足。 He is good at dealing with children. 他擅長應付小孩子。

2022-07-21

介绍TFIDF与BM25的优秀PPT

介绍从TFIDF到BM25的优秀PPT

2022-06-23

bert_sentence_classification.7z

基于HuggingFace 哈工大hfl/chinese-bert-wwm-ext预训练模型微调的中文句子分类模型

2021-09-25

chinese_sentence_classification_corpus.7z

中文问句分类数据集,可用于训练中文问句分类和句向量抽取等任务。

2021-09-25

sentence_classification.7z

基于HuggingFace 哈工大hfl/chinese-robert-wwm-ext预训练模型微调的中文句子分类模型

2021-09-24

chinese_wwm_ext_pytorch.zip

哈工大发布的BERT WWM-EXT版预训练模型

2021-09-21

VIM常见命令总结vim常见命令总结

VIM常见命令总结VIM常见命令总结

2021-08-19

datasets.rar

文章中用到的数据

2021-03-01

英文情绪分类数据集文件

经典的英文情绪分类/情感分析数据集

2020-09-02

词性标注traindata.rar

英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。

2020-08-29

Typora 0.9.9.66 绿色版

Typora 0.9.9.66 绿色版

2019-03-19

RabbitMQ示例代码

rabbitmq示例代码,

2018-12-17

RocketMQ实战与原理解析【清晰版】

作者是阿里资深数据专家,对RocketMQ有深入的研究,并有大量的实践经验。在写这本书之前,作者不仅系统、深入地阅读了RocketMQ的源代码,而且还向RocketMQ的官方开发团队深入了解了它的诸多设计细节。作者结合自己多年使用RocketMQ的经验,从开发和运维两个维度,给出了大部分场景下的优秀实践,能帮助读者在学会使用和用好RocketMQ的同时,尽量少“踩坑”。同时,本书也结合源码分析了分布式消息队列的原理,使读者可以在复杂业务场景下定制有特殊功能的消息队列。 该PDF仅供购买纸质版参考,请在下载24小时后删除!!!

2018-11-03

Angular6依赖注入Demo

Angular6依赖注入Demo,包含懒加载实现。 Angular6依赖注入Demo,包含懒加载实现。

2018-07-23

Java网络编程第4版英文版

《Java网络编程(第四版)》实用指南全面介绍了如何使用Java开发网络程序。你将学习如何使用Java的网络类库既快速又轻松地完成常见的网络编程任务,如编写多线程服务器、加密通信、广播到本地网络,以及向服务器端程序提交数据。作者提供了真正可实用的程序来讲解他介绍的方法和类。第4版经过全面修订,已经涵盖REST、SPDY、异步I/O和很多其他高级技术。本书主要内容有:研究Internet底层协议,如TCP/IP和UDP/IP;了解Java的核心I/O API如何处理网络输入和输出;发现InetAddress类如何帮助Java程序与DNS交互;用Java的URI和URL类定位、识别和下载网络资源;深入研究HTTP协议,包括REST、HTTP首部和cookie;使用Java的底层Socket类编写服务器和网络客户端;利用非阻塞I/O同时管理多个连接。

2018-07-03

snmp4j-2.2.5.jar

snmp4j 2.2.5 版本的 snmp4j 2.2.5 版本的 snmp4j 2.2.5 版本的

2018-07-03

非常好的红黑树教程,值得一看

红黑树教程,看这一篇就够了

2018-05-16

Dubbo与Zookeeper、SpringMVC整合和使用

Dubbo与Zookeeper、SpringMVC整合和使用 项目代码,文章见:http://www.cnblogs.com/EDGClearlove/p/6848460.html

2017-05-13

dubbo-admin-2.5.4

兼容jdk1.8的dubbo-admin

2017-05-12

Java JDBC 连接数据库实例

Java JDBC 连接数据库实例 通用度稍好

2014-10-28

安卓实现选择联系人

一个选择联系人控件实现,可以显示联系人名称,图片,号码。 支持多选,自定义了Checkbox样式,自定义了Adapter 界面可以自己修改。 缺点是字符串没有放到String.xml里面,懒得改了。 这是一个小作品目里面的测试功能。 本人新手,不足之处请大家指点出来。 PS:资源分2分不多吧

2014-09-08

JavaIO 2nd Edition PDF

Java IO 第二版 真正PDF版本的

2013-04-24

软件需求规格说明书

软件需求规格说明书模板,解释得很详细。值得一下

2013-04-10

非递归归并排序详细分析

非递归归并排序详细分析,Java实现. 非常详细,基本上可以看明白

2012-09-25

易学C++教程

比较适合新手入门的一本教程。 可以让你由浅入深,从入门到精通。

2011-12-03

C++真值表模拟程序

这是一个用C++做的离散数学 实现任意给定公式真值表的计算,并显示运算结果。

2011-12-03

主流编程语言的选择和学习杂谈

此资料送给那些在选择学习编程语言的人 ,所有内容都摘自网络。

2011-10-15

coloader80.dll

coloader80.dll 下载看看。 描述要大于字,怎么办了。我要怎么描述啊。

2011-08-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除