- 博客(155)
- 资源 (2)
- 收藏
- 关注
原创 Knowledge-QA-LLM: 基于本地知识库+LLM的开源问答系统
Knowledge-QA-LLM: 基于本地知识库+LLM的问答系统。
2023-07-29 20:27:31 1256
原创 国内丐丐版overleaf--Write Papers Easy beta版来了
而国内高校毕业论文的LaTeX模板正处于野蛮生长阶段,学校认可的LaTeX毕业论文模板较少,大部分学生或者校友在自发维护。(关注本公众号,后台回复赞助,即可看到,注意添加备注。现在的终于可以平稳运行了。针对第二个痛点,结合znsoft大佬的实际需求出发,我们尝试在服务器上搭建了社区版的overleaf,znsoft大佬起名为。作为目前平台搭建和运营者,我是没有兴趣和想法去窥探他人隐私的,你可以放心使用。此刻,今年将要毕业的无数莘莘学子正在奋笔疾书写着自己的毕业论文,淹没于繁琐的论文排版格式中。
2024-03-26 20:08:06 403
原创 OCR-free相关论文梳理
Donut的结构有些像Text Spotting任务(检测和识别都在一个模型中完成),但是Donut做的要比Text Spotting任务更进一步。该工作将OCR中多个子任务都集成到了一个End-to-End的网络中,网络是基于transformer的编解码结构。这应该是第一篇将Transformer 编解码结构应用到整个OCR任务中的工作,包括文档分类、文档信息提取和文档问答三个任务。现阶段,Transformer技术的发展,让通用文档理解任务变得不再是那么遥不可及,出现了很多OCR-free的工作。
2024-03-13 08:28:31 788
原创 无线表格识别模型LORE转换库:ConvertLOREToONNX
这次吸取教训,环境文件采用Anaconda导出的,更加详细记录当前转换环境。以下是转换仓库的README,感兴趣小伙伴可以点击文末的“阅读原文”跳转到转换仓库尝试。总有小伙伴问到阿里的无线表格识别模型是如何转换为ONNX格式的。这个说来有些惭愧,现有的ONNX模型是很久之前转换的了,转换环境已经丢失,且没有做任何笔记。今天下定决心再次尝试转换,庆幸的是转换成功了。
2024-03-10 15:08:50 199
原创 近年来文本检测相关工作梳理
STKM工作是直接从image representations中decoding文本信息,本篇工作则通过仔细设计的pre-training任务(image-text contrasitive learning, masked language modeling, word-in-image predictioin)中,增加文本信息和图像信息的mutual alignment和cross-modal interaction,从而进一步增强backbone的能力。因此,两阶段的OCR方案一直是优先考虑的。
2024-03-09 20:42:43 995
原创 论文阅读:Vary-toy论文阅读笔记
如何基于Vary-tiny + pipeline产生一个更加practical vision vocabulary?如何在不损坏Qwen-1.8B模型特征前提下,利用new vision vocabulary来使Vary-toy-1.8B产生新的特征?
2024-01-24 21:46:53 1117
原创 论文阅读:Vary论文阅读笔记
Figure 1:主要想说明Vary在产生vocabulary时,采用两阶段策略:在第一阶段,通过自回归方法,先产生一个新的vocabulary,在第二阶段,将新的vocabulary与原始的融合,作为一个新的vocabulary。该部分主要聚焦于fine-grained perception,例如文档智能和图表理解,说是为了弥补CLIP的不足,因此这部分网络输入都是图像,没有文本输入的分支。因此,就以旷视出的这篇工作Vary作为切入点,借此来学习LLM在文档智能领域的相关工作。
2024-01-18 22:12:34 1313
原创 解决! LaTeX Error: File ‘xxxx.sty‘ not found.问题
命令安装,二是手动搜索对应包,放到对应LaTeX安装目录下。在本地编译tex文件时,总会遇到。一般解决方案有两种:一是直接通过。经过网上查找得知,可以通过安装。和其对应的包名不对应,直接用。安装,会存在找不到的情况。这里存在一个问题:缺少的。从以上错误来看,缺少。
2024-01-12 15:36:00 1467
原创 论文阅读:TinyGPT-V 论文阅读及源码梳理对应
QFormer来自论文BCLI2工作中,用来弥补Frozen Image encoder和Frozen LLM之间的gap。将prompt除Image部分其他部分依次转为向量。再将两者mix,得到最终向量。基于Bert作为初始化的。
2024-01-11 21:52:22 1216
原创 TableStructureRec: 表格结构识别推理库来了
目前 PaddleOCR 中表格识别暂未整理到这个仓库中,后续会整理进来。欢迎持续关注。
2023-11-23 22:38:09 992
原创 Python环境下LaTeX数学公式转图像方案调研与探讨
目前,公开的公式识别数据集,已经有很多了,包括一些公式识别的比赛以及开源项目中都有涉及,我这里就不在一一列举了,大家可自行寻找。
2023-10-28 22:02:20 640
原创 rapidocr_paddle[gpu]:GPU端推理库来了
系列包是基于PaddlePaddle框架作为推理引擎的,支持CPU和GPU上推理。值得说明的是,这个包和PaddleOCR相比,代码基本都是一样的,只不过这个库将里面核心推理代码抽了出来,更加精简而已。推荐GPU上用这个,CPU端还是以和为主。毕竟PaddlePaddle的CPU端还是比较重的。封装这个包的原因是为了弥补GPU端推理的空缺。因为面对成千上万的图像需要提取文字时,CPU端上推理速度还是较慢,不能满足需求。
2023-10-22 22:49:20 903
原创 Table Recognition Metric: 表格识别算法评测工具包及相关评测基准数据集
Table Recognition Metric: 表格识别算法评测工具包及相关评测基准数据集
2023-07-13 22:11:55 274 1
原创 [RapidVideOCR周边] RapidVideOCR高级教程(有python基础的小伙伴)
安装使用VideoSubFinder软件。安装rapid_videocr。
2023-07-06 08:44:20 193
原创 [RapidVideOCR周边] RapidVideOCR初级教程(界面版 下载解压即可使用)
上述都填好之后,点击OK按钮,即可开始识别。(以Windows平台为例)
2023-07-06 08:43:09 353
原创 论文阅读: (CVPR2023 SDT )基于书写者风格和字符风格解耦的手写文字生成及源码对应
论文阅读: (CVPR2023 )基于书写者风格和字符风格解耦的手写文字生成及源码对应
2023-06-28 09:40:05 1160
原创 ExtractOfficeContent: 提取Office文件中文本、表格和图像
ExtractOfficeContent: 提取Office文件中文本、表格和图像
2023-06-10 16:02:43 1340
原创 Github + Sphinx+Read the docs 实战入门指南(三)
Github + Sphinx+Read the docs 实战入门指南(三)
2023-04-02 15:34:30 514 4
原创 Github + Sphinx+Read the docs 实战入门指南(二)
Github + Sphinx+Read the docs 实战入门指南(二)
2023-04-02 15:33:00 497
原创 [RapidVideOCR周边] RapidVideOCR中级教程(python小白)
[RapidVideOCR周边] RapidVideOCR保姆级教程(从小白到上手使用)
2023-03-27 09:31:28 1056 2
原创 RapidAI/paddleocr_convert:PaddleOCR中模型快速转换为ONNX格式
RapidAI/paddleocr_convert:PaddleOCR中模型快速转换为ONNX格式
2023-03-21 14:32:00 720
多角度人物跟踪matlab源码
2017-09-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人