自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

机器学习杂货铺1号店

机器学习小杂事儿

  • 博客(254)
  • 收藏
  • 关注

原创 Kosmos-2: 在多模态大语言模型中引入基准和指代能力

kosmos-2:一种提供了基准和指代能力的多模态大语言模型

2024-03-05 19:21:21 878

原创 Kosmos-1: 通用接口架构下的多模态大语言模型

kosmos 构建一个通用接口的多模态大语言模型

2024-03-03 11:23:06 996

原创 【论文极速读】MetaLM:一种融合因果语言模型和非因果语言模型的方法

最近我在恶补一些经典的LLM工作,之前也精读过MetaLM这个工作但是没有及时笔记,现在已经有些遗忘了,因此在过年期间复习了下,在此笔记希望对诸位有所帮助。

2024-02-19 19:39:42 819

原创 【论文极速读】Flamingo:一种交织图文的视觉语言大模型方法

Flamingo算是DeepMind的多模态融合LLM的一个较老的工作了(2022年),之前粗略读过没来得及及时总结,本次过年笔者重新细读了论文,发现其在50多页的论文中有着不少细节,本文对该工作进行读后感笔记。

2024-02-17 16:59:53 1047

原创 【论文极速读】LVM,视觉大模型的GPT时刻?

LVM,视觉大模型的GPT时刻?

2023-12-10 02:15:47 536 2

原创 【论文极速读】IMAGEBIND —— 通过图片作为桥梁桥联多模态语义

image bind,充分利用多模态异构数据~

2023-09-30 10:52:18 494

原创 【论文极速读】Prompt Tuning——一种高效的LLM模型下游任务适配方式

Prompt tuning是一种高效的LLM下游任务适配方式

2023-09-29 15:18:51 1775

原创 VQ-VAE的实现方法分析——一种基于梯度回调的方法

基于梯度回调的VQ-VAE实现

2023-05-06 19:44:58 570 1

原创 增强型语言模型——走向通用智能的道路?!?

增强型语言模型,正在突破我们的想象走向通用智能

2023-05-05 10:05:47 1021

原创 【论文极速读】VQ-VAE:一种稀疏表征学习方法

VQ-VAE进行视觉稀疏化

2023-02-26 10:57:58 781

原创 【论文极速读】 指令微调BLIP:一种对指令微调敏感的Q-Former设计

之前笔者在[1]中曾经介绍过BLIP2,其采用Q-Former的方式融合了多模态视觉信息和LLM,本文作者想要简单介绍一个在BLIP2的基础上进一步加强了图文指令微调能力的工作——InstructBLIP,希望对诸位读者有所帮助。

2024-03-31 20:57:32 930

原创 【见闻录系列】再论系统复杂度控制:错误控制与复盘

3年工作经验分享

2024-03-12 23:12:33 786

原创 BLIP2——采用Q-Former融合视觉语义与LLM能力的方法

大规模语言模型(Large Language Model,LLM)是当前的当红炸子鸡,展现出了强大的逻辑推理,语义理解能力,而视觉作为人类最为主要的感知世界的手段,亟待和LLM进行融合,形成多模态大规模语言模型(Multimodal LLM, MLLM),BLIP-2这篇文章利用已经充分训练好的图片编码器和LLM模型,通过Q-Former巧妙地融合在一起,在引入少量待学习参数的同时,取得了显著的效果。本文将对BLIP2进行笔记和笔者个人感想纪录,希望对诸位读者有所帮助。

2024-02-03 18:45:31 1237

原创 【论文极速读】视频检索中的模态均衡方法

多模态落地过程中的模态不均衡问题

2023-12-07 13:10:57 267

原创 【论文极速读】EMT——评估多模态LLM中的灾难性遗忘问题

评估多模态LLM模型的灾难性遗忘现象

2023-10-07 20:39:56 412

原创 告读者:本账号不再更新

2022-12-03 14:05:19 584 3

原创 【论文极速读】ERNIE VIL 2.0,多模态模型的一种多视角预训练范式

ERNIE VIL 2.0 多视角多模态的预训练方法

2022-12-03 13:23:15 292

原创 【数据物语系列】 漫谈数据分布可视化分析

可视化数据分布的一些常用方法

2022-11-27 01:43:38 737

原创 模型无关的全局特征依赖分析方法 I ——部分依赖曲线分析与条件依赖曲线分析

模型无关的全局特征依赖分析方法——关于模型调试分析的一些事儿

2022-10-30 18:28:47 1039

原创 【论文极速读】FILIP: 一种基于交互的细粒度图文预训练模型

FILIP,基于交互的细粒度图文匹配模型

2022-10-16 01:47:34 1154

原创 【Debug危机系列】Embedding层的千层套路

Embedding层也没那么简单喔

2022-09-17 01:21:29 1292

原创 万字长文详解静态图和动态图中的自动求导机制

万字长文详解静态图和动态图中的自动求导机制

2022-09-11 10:09:07 688

原创 为何基于树的模型在表格型数据中能优于深度学习?

为什么树模型在表格型数据上会优于神经网络模型呢?

2022-09-10 18:58:42 1304 1

原创 【见闻录系列】浅谈搜索系统与推荐系统的一点区别

推荐系统和搜索系统的一些见解

2022-09-03 23:01:17 1090

原创 【Hadoop Streaming实践系列】 大规模字段提取的实践

Hadoop Streaming的大规模字段提取实践

2022-08-30 00:30:57 575

原创 【Debug危机系列】 记一次opencv相关的debug过程

debug笔记,这次关于opencv的imencode和cvtColor

2022-08-28 11:09:14 847

原创 hinge loss的一种实现方法

hinge loss的实现

2022-08-20 11:42:52 841

原创 【见闻录系列】我所理解的搜索业务二三事

搜索系统全链路的二三事

2022-08-07 17:42:08 796 1

原创 学习资源推荐

资源推荐

2022-06-29 10:13:13 347

原创 浅论分布式训练中的recompute机制

分布式训练中的重计算机制,一个小注意点

2022-06-12 08:47:01 877 3

原创 混合精度训练场景中,对比学习损失函数的一个注意点

对比学习在半精度训练过程中的小问题

2022-06-08 22:46:49 1143

原创 【工程实践系列】在paddle数据加载器中返回URL或者其他文本信息

paddle Dataloader里面传递字符串

2022-06-02 08:03:34 601

原创 【见闻录系列】我所理解的“业务”

技术赋能业务的理解

2022-06-01 10:12:52 396

原创 linux日常工作shell命令与工具汇总

本文作为笔者的日常工作linux使用过程中的备忘录文件操作文件record去重对文件内的record进行去重,可采用uniq和sort命令进行,比如文件record为,不同字段用\t隔开,为了将其中重复的record挑选出来,或者将非重复的record挑选出来,有以下几种命令可供使用。# filename: dup_recordmike 30nancy 45jacky 45mike 67nancy 25nancy 57nancy 25mike 30mike 67jacky 45

2022-05-16 14:55:49 233

原创 【git笔记】git使用杂问题收录

本文作为笔记记录git使用的一些杂问题。git bash中文文件名无法正确显示git终端的文件名无法正常显示,如git bash 客户端第一次查看文件时,无法正确显示中文的文件名,输入以下命令即可解决git config --global core.quotepath false # 显示 status 编码git config --global gui.encoding utf-8 # 图形界面编码git config --global i18n.co

2022-05-14 08:51:14 209

原创 python使用日常备忘录

python使用日常

2022-04-29 08:14:38 1129

原创 在多模态模型训练时,如何合适地融合单模态损失

多模态训练时候导致的单模态缺损,需要同时考虑单模态损失

2022-04-21 10:27:47 3743 1

原创 集群深度学习训练实践笔记——高性能分布式多任务数据读取

高性能的分布式多任务数据读取方式

2022-04-07 21:22:03 561

原创 【用户行为学研究】 从用户点击数据中构造隐式反馈

笔者在前文[4]中介绍了LTR模型中常用的GBRank模型,在文章末尾提到了根据用户点击数据构造隐式反馈,从而构建出有序对数据进行训练,因而引出了`Skip-Above`这个构建隐式反馈的方法,该方法在文章[1]中提出,作者根据翔实的用户行为学实验和分析,得出了包括`Skip-Above`在内的一系列通过点击信号来构建隐式反馈的方法。

2022-04-02 17:12:32 832

原创 搜索系统中的Learning To Rank模型:GBRank

GBRank模型介绍以及推导

2022-03-27 01:04:29 885

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除