自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(87)
  • 收藏
  • 关注

原创 Transformer学习

encoder和decoder基本一样,decoder多了一个masked mutil-head attention。因为decoder计算每次都依赖前一个节点的输出,所以a_n只能看到1~n个节点的输出。NAT的表现通常不如AT。原因:multi-modality。增加一个停止token,一般来会跟begin用一个符号。因为有的语言没有文字,比如将狗叫翻译出来。将任务转化成翻译任务,硬训一发,效果不错。

2023-10-05 22:20:10 304

原创 Transformer学习-self-attention

cnn就是self-attention的特例。self-attention更灵活,但是如果训练集小可能更容易过拟。5. self-attention for Graph:用attention来表示nodes之间的关联。

2023-10-03 17:00:09 347

原创 wangshusen学习笔记

难度:计算量巨大 – 需要每次从0开始训练CNN,最后用CNN的val 作为奖励来训练controller RNN。如果用上述超参搭建20个卷积层可能的组合有(4 * 3 * 2) ^ 20 = 4 x 10 ^ 27种。2. search space巨大,尝试数量太小,不容易找到特别好的结构;Ray(推荐的开源系统,better than spark);随机设置超参 --train–> CNN model --evaluate–> val acc。重复该过程多次,选择其中val acc 最好的超参配置。

2023-09-13 17:18:54 236

原创 大模型微调总结

数据:预训练数据分布和特定任务数据分布不一致 ==>将特定任务、场景的语料的内在关系融入大模型参数中,同时和预训练的通用语料建立联通关系。缩小预训练数据和业务数据的差异,增强对业务数据的理解能力。在某些特定任务上无法达到实际业务需求 or 性能差无法直接使用 ==> 改善特定任务下欠拟合程度。==> 所需资源、训练时间最大,且当语料不够大时容易过拟。==>前缀保留部分序列长度会减少下游任务的序列输入长度。==>难以优化,性能随可训练参数的规模非单调变化。==> 没有额外的推理延时,大致收敛于基座模型。

2023-09-05 22:06:15 567

原创 大模型综述论文笔记6-15

code。

2023-08-31 23:23:29 919

原创 大模型综述论文笔记1-5

通过神经网络来表征单词序列的概率问题。通过 model size (N), dataset size (D), and the amount of training compute © 三个因素来衡量神经网络模型的表现。3.LLMs的发展不需要明确区分以研究或是工程化为目的,LLMs的训练需要大数据处理和并行训练这些更实际的经验。LLMs 可以适配相同结构的transformer 并可以作为小模型的与训练模型。1.LLMs表现出在更小的PLMs中可能无法观察到的更惊人的能力。

2023-08-29 23:53:13 1060

原创 MMCV+pytorch1.10+cu11.x离线安装踩坑记录

mmcv/mmdet/mmpose/mmengine 依赖的其他wheel包对python版本有要求,安装过程中请注意!mmdet、mmpose、mmengine在pypi仓库可以找到对应python版本的包,直接下载安装。方案:参照第一节重新安装pytorch,如果问题没有解决再参照第二节重新安装mmcv。如果仍然报错,可能是pytorch版本不对,参照第一节重新安装pytorch。方案:卸载mmcv-full、mmcv,重新安装mmcv2.0.0rc4。

2023-08-28 10:09:30 1254

原创 MySql-丁奇-学习笔记-为啥我的MySql会抖一下?(flush机制)

flush机制

2020-12-03 11:05:18 208

原创 MySql-丁奇-学习笔记-如何给字符串创建索引

前缀索引和其他解决方案

2020-12-02 15:16:53 199

原创 MySql-丁奇-学习笔记-为甚么MySql有时会选错索引?

为甚么MySql有时会选错索引?以及解决办法

2020-12-01 11:35:22 165

原创 MySql-丁奇-学习笔记-普通索引和唯一索引如何选择?(change buffer机制)

普通索引和唯一索引应该如何选择?change buffer 详解

2020-11-30 11:32:57 273

原创 MySql-丁奇-学习笔记-MVCC

MVCC原理

2020-11-29 20:10:10 230

原创 MySql-丁奇-学习笔记-如何减少行锁对性能的影响(死锁检测带来的性能消耗)

行锁的性能问题

2020-11-29 15:51:36 301

原创 MySql-丁奇-学习笔记-全局锁和表锁

全局锁和表锁

2020-11-29 14:18:52 179

原创 设置MySql事务隔离级别

设置MySql隔离级别

2020-11-27 09:32:45 134

转载 Java进程和普通进程在内存管理上的区别与联系

nothing

2020-11-26 15:29:27 135

原创 链表反转非递归算法!看不懂打死我!

链表反转非递归算法

2020-11-24 00:33:20 245

原创 二叉树前中后序遍历的递归及非递归实现(附代码)

二叉树前中后序遍历的递归及非递归实现

2020-11-23 23:54:33 532

原创 递归反转链表算法图解!看不懂打死我!

递归反转链表算法图解

2020-11-23 20:23:49 771

原创 MySql锁机制详解

MySql锁机制

2020-11-23 17:05:00 189

原创 MySql日志

Bin log、Redo log、Undo log详解为甚么redolog要有两阶段提交回滚日志啥时候删除binlog一天一备和一周一备哪个更好

2020-11-23 00:19:38 187

原创 Select子句的执行顺序

Sql语句的执行过程

2020-11-22 16:11:08 158

原创 MySql调优概述

mysql调优概述

2020-11-12 21:51:44 166

原创 一次JVM调优实验纪实

JVM调优实验

2020-11-10 18:02:54 193

转载 SPI机制详解以及如何打破双亲委派机制

SPI机制详解以及如何打破双亲委派机制

2020-11-09 21:40:22 1298

原创 Java的long和double类型的赋值操作为什么不是原子性的?

Java的long和double类型的赋值操作为什么不是原子性的?

2020-11-09 15:33:18 1654 3

原创 读了数篇关于ConcurrentHashMap的博文后,总结一下写的好的博文

ConcurrentHashMap

2020-11-06 01:04:14 115

转载 UnSafe类详解

UnSafe详解

2020-11-05 22:58:23 279

原创 什么是Fail Fast和Fail Safe?

Fail Fast 和 Fail Safe的概念、原理及区别

2020-11-05 22:33:53 935

原创 Java线程池原理

线程池原理

2020-11-03 22:48:19 74

转载 Paxos解析及在zkServer中的实现

Paxos及在zkServer中的实现

2020-11-02 23:11:35 124

原创 Redis-从缓存击穿、穿透、雪崩到分布式锁

详解缓存击穿、穿透、雪崩及其解决方案,以及Redis做分布式锁的场景和方案

2020-11-02 13:37:22 218

原创 Centos6安装运行twemproxy

centos install twemproxy

2020-11-01 15:08:30 190

原创 负载均衡-高可用HA、KeepAlived

高可用HA、KeepAlived

2020-10-28 23:15:02 239

原创 负载均衡-LVS转发模型详解

图解NAT、FullNAT、DR、TUN模型

2020-10-28 20:27:21 488

原创 SpringBoot国际化配置

SpringBoot国际化配置

2020-10-26 23:18:09 165

原创 Thymeleaf基本使用

Thymeleaf模板引擎快速上手

2020-10-26 22:38:03 270

原创 java.lang.IllegalStateException: Unable to find a @SpringBootConfiguration, you need to use @Context

java.lang.IllegalStateException: Unable to find a @SpringBootConfiguration, you need to use @ContextConfiguration or @SpringBootTest(classes=...) with your test

2020-10-26 17:12:09 104

原创 SpringBoot如何将自定义Servlet,Filter,Listener,ViewResolver

自定义servlet,filter,listener+springboot 代码

2020-10-26 17:02:04 213

原创 Java网络IO系列-BIO、NIO、多路复用器详解(附代码)

BIONIOSelectPollEpoll

2020-10-24 23:24:05 829

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除