FesianXu-CSDN博客

大规模语言模型（Large Language Model,LLM）是当前的当红炸子鸡，展现出了强大的逻辑推理，语义理解能力，而视觉作为人类最为主要的感知世界的手段，亟待和LLM进行融合，形成多模态大规模语言模型（Multimodal LLM, MLLM），BLIP-2这篇文章利用已经充分训练好的图片编码器和LLM模型，通过Q-Former巧妙地融合在一起，在引入少量待学习参数的同时，取得了显著的效果。本文将对BLIP2进行笔记和笔者个人感想纪录，希望对诸位读者有所帮助。

2024-02-03 18:45:31 1237

原创【论文极速读】视频检索中的模态均衡方法

多模态落地过程中的模态不均衡问题

2023-12-07 13:10:57 267

原创【论文极速读】EMT——评估多模态LLM中的灾难性遗忘问题

评估多模态LLM模型的灾难性遗忘现象

2023-10-07 20:39:56 412

原创告读者：本账号不再更新

无

2022-12-03 14:05:19 584 3

原创【论文极速读】ERNIE VIL 2.0，多模态模型的一种多视角预训练范式

ERNIE VIL 2.0 多视角多模态的预训练方法

2022-12-03 13:23:15 292

原创【数据物语系列】漫谈数据分布可视化分析

可视化数据分布的一些常用方法

2022-11-27 01:43:38 737

原创模型无关的全局特征依赖分析方法 I ——部分依赖曲线分析与条件依赖曲线分析

模型无关的全局特征依赖分析方法——关于模型调试分析的一些事儿

2022-10-30 18:28:47 1039

原创【论文极速读】FILIP：一种基于交互的细粒度图文预训练模型

FILIP，基于交互的细粒度图文匹配模型

2022-10-16 01:47:34 1154

原创【Debug危机系列】Embedding层的千层套路

Embedding层也没那么简单喔

2022-09-17 01:21:29 1292

原创万字长文详解静态图和动态图中的自动求导机制

万字长文详解静态图和动态图中的自动求导机制

2022-09-11 10:09:07 688

原创为何基于树的模型在表格型数据中能优于深度学习？

为什么树模型在表格型数据上会优于神经网络模型呢？

2022-09-10 18:58:42 1304 1

原创【见闻录系列】浅谈搜索系统与推荐系统的一点区别

推荐系统和搜索系统的一些见解

2022-09-03 23:01:17 1090

原创【Hadoop Streaming实践系列】大规模字段提取的实践

Hadoop Streaming的大规模字段提取实践

2022-08-30 00:30:57 575

原创【Debug危机系列】记一次opencv相关的debug过程

debug笔记，这次关于opencv的imencode和cvtColor

2022-08-28 11:09:14 847

原创 hinge loss的一种实现方法

hinge loss的实现

2022-08-20 11:42:52 841

原创【见闻录系列】我所理解的搜索业务二三事

搜索系统全链路的二三事

2022-08-07 17:42:08 796 1

原创学习资源推荐

资源推荐

2022-06-29 10:13:13 347

原创浅论分布式训练中的recompute机制

分布式训练中的重计算机制，一个小注意点

2022-06-12 08:47:01 877 3

原创混合精度训练场景中，对比学习损失函数的一个注意点

对比学习在半精度训练过程中的小问题

2022-06-08 22:46:49 1143

原创【工程实践系列】在paddle数据加载器中返回URL或者其他文本信息

paddle Dataloader里面传递字符串

2022-06-02 08:03:34 601

原创【见闻录系列】我所理解的“业务”

技术赋能业务的理解

2022-06-01 10:12:52 396

原创 linux日常工作shell命令与工具汇总

本文作为笔者的日常工作linux使用过程中的备忘录文件操作文件record去重对文件内的record进行去重，可采用uniq和sort命令进行，比如文件record为，不同字段用\t隔开，为了将其中重复的record挑选出来，或者将非重复的record挑选出来，有以下几种命令可供使用。# filename: dup_recordmike 30nancy 45jacky 45mike 67nancy 25nancy 57nancy 25mike 30mike 67jacky 45

2022-05-16 14:55:49 233

原创【git笔记】git使用杂问题收录

本文作为笔记记录git使用的一些杂问题。git bash中文文件名无法正确显示git终端的文件名无法正常显示，如git bash 客户端第一次查看文件时，无法正确显示中文的文件名，输入以下命令即可解决git config --global core.quotepath false # 显示 status 编码git config --global gui.encoding utf-8 # 图形界面编码git config --global i18n.co

2022-05-14 08:51:14 209

原创 python使用日常备忘录

python使用日常

2022-04-29 08:14:38 1129

原创在多模态模型训练时，如何合适地融合单模态损失

多模态训练时候导致的单模态缺损，需要同时考虑单模态损失

2022-04-21 10:27:47 3743 1

原创集群深度学习训练实践笔记——高性能分布式多任务数据读取

高性能的分布式多任务数据读取方式

2022-04-07 21:22:03 561

原创【用户行为学研究】从用户点击数据中构造隐式反馈

笔者在前文[4]中介绍了LTR模型中常用的GBRank模型，在文章末尾提到了根据用户点击数据构造隐式反馈，从而构建出有序对数据进行训练，因而引出了`Skip-Above`这个构建隐式反馈的方法，该方法在文章[1]中提出，作者根据翔实的用户行为学实验和分析，得出了包括`Skip-Above`在内的一系列通过点击信号来构建隐式反馈的方法。

2022-04-02 17:12:32 832

原创搜索系统中的Learning To Rank模型：GBRank

GBRank模型介绍以及推导

2022-03-27 01:04:29 885

空空如也

空空如也