- 博客(325)
- 资源 (3)
- 收藏
- 关注
原创 模式识别与人工智能(程序与算法)系列讲解 - 总目录
人工智能和硬件设计博士生、CSDN与阿里云开发者博客专家,多项比赛获奖者,发表SCI论文多篇。o( ̄▽ ̄)dლ(°◕‵ƹ′◕ლ)希望在传播知识、分享知识的同时能够启发你,大家共同进步。ヾ(◍°∇°◍)ノ゙。
2023-07-10 18:51:56 826 5
原创 博客便捷检索目录
目录Leetcode刷题Verilog刷题CSDN操作tensorflow 学习matlab数字图像处理python-opencv模式识别与机器学习实战练习深度学习强化学习模型的压缩与加速1. 理论分析2. 练习实现3. 剪枝阅读4. 模型设计阅读5. 量化阅读6. 硬件加速网络结构搜索1. 理论分析2.论文阅读实验软件使用与程序语法pytorch使用积累Leetcode刷题Leetcode题目Verilog刷题HDLBits(1)——Modules:HierarchyCSDN操作1.CSDN字
2020-05-15 11:23:49 2204 3
原创 【Image captioning】论文阅读八—ClipCap: CLIP Prefix for Image Captioning_2021
在图像描述任务中,目标是为给定输入图像提供一个有意义且有效的自然语言描述。这个任务面临两个主要挑战。第一个是语义理解。这涵盖了从简单任务(如检测主要对象)到更复杂任务(如理解图像中所描绘部分之间的关系)的各个方面。例如,在图1左上角的图像中,模型理解到对象是一个礼物。第二个挑战是描述同一图像的可能方式很多。在这方面,训练数据集通常会决定给定图像的首选描述方式。图1. 我们的ClipCap模型生成了描述相应图像的标题。这里的结果是使用Conceptual Captions数据集进行训练的模型的结果。
2024-01-27 21:43:09 871
原创 图像字幕中一些广泛使用的技术
Faster R-CNN的工作原理与Fast R-CNN类似,都是先将输入图像送入卷积神经网络生成一个卷积特征图,然后使用这个特征图生成区域建议。但是,不同于Fast R-CNN的是,Faster R-CNN使用一个单独的网络来预测区域建议,而不是使用选择性搜索算法。GRU是LSTM的一个变体,它通过减少门的数量来简化模型结构,这使得GRU比LSTM更容易训练,并且在处理较小或较不频繁的数据集时可能表现得更好。不过,随着研究的不断深入,新的模型和技术也在不断出现,为处理序列数据提供了更多的可能性。
2024-01-26 22:05:35 728
原创 【Image captioning】论文阅读七—Efficient Image Captioning for Edge Devices_AAAI2023
近年来,图像描述技术取得了快速发展。然而,对大容量存储和复杂计算负担的需求限制了这些图像描述模型在移动设备上的部署。主要的障碍在于沉重的视觉特征提取器(即目标检测器)和复杂的跨模态融合网络。为此,我们提出了。
2024-01-25 17:23:05 363
原创 AI研究必备!这些网站你不可不知
在人工智能的浪潮中,你是否感到手足无措?别担心,今天我就为大家揭晓那些AI研究者们的秘籍——他们常用的网站。这些网站不仅包含了丰富的资源,还能让你的研究之路更加顺畅。让我们一起探索这些宝藏,让你的AI之旅更加精彩!
2024-01-24 19:36:59 950
原创 机器学习工程师在人工智能时代的角色
在当今的数字时代,人工智能(AI)已成为许多行业不可或缺的一部分。从流程自动化到增强客户体验,人工智能具有改变企业的巨大潜力。这一变革性技术的核心是机器学习,该领域专注于开发算法,使计算机系统能够在无需明确编程的情况下学习并做出预测或决策。机器学习工程师在各种应用中实施和部署机器学习模型方面发挥着至关重要的作用。他们弥合了传统软件工程和数据科学之间的差距,结合编码和数学知识来创建强大的人工智能系统。在本文中,我们将深入探讨机器学习工程的理解、技能、责任、挑战和未来前景。
2024-01-23 14:00:48 1092 1
原创 Awesome Image Captioning
Awesome Image Captioning目录Awesome Image Captioning2024年2023年2022年2021年2024年2023年2022年2021年
2024-01-22 21:43:49 72
原创 Win11桌面路径改为其他盘的简单教程
在使用电脑的过程中,桌面文件夹是我们经常会使用到的地方,而默认情况下,桌面文件夹都会存放在系统安装盘的C盘上。随着时间的推移和文件的增多,C盘的磁盘空间可能会越来越紧张,这时候我们可以考虑修改桌面路径,将其移动到其他分区,以减轻C盘的压力,提升电脑的运行速度。
2024-01-22 10:23:56 512
原创 【Image captioning】论文阅读六—Semantic-Conditional Diffusion Networks for Image Captioning_CVPR2023
作为视觉和语言领域中的基础任务之一,图像描述旨在使用自然语句描述感兴趣的语义。这项任务自然地将计算机视觉和自然语言处理连接在一起,通过感知场景中的视觉内容并将其解释为人类语言,模拟了人类智能的基本能力。目前,当前最先进技术中的主导力量是利用编码-解码结构,并以自回归方式构建学习过程。特别地,图像编码器负责将视觉内容编码为高级语义,而句子解码器学习逐字解码顺序句子(图1a)。然而,这种自回归进展仅允许单向的文本信息传递,并且通常依赖于随着句子长度的平方增长的大量计算资源来进行。
2024-01-21 11:22:34 579
原创 【Image captioning】图像描述标注(Image captioning)软件的设计与实现
大家好!我是一位对图像字幕(Image captioning)生成感兴趣的研究者。在研究过程中,我不可避免地需要对图像进行标注。然而,早期阶段我使用TXT记事本进行语言描述时,遇到了一些效率低下、错标和漏标等问题。为了提高工作效率,我设计了一款基于QT的图像描述标注软件。
2024-01-20 19:32:41 223
原创 【Image captioning】论文阅读五—Towards local visual modeling for image captioning(PR期刊)
图像字幕的任务是生成一个流畅的句子来描述给定的图像。近年来,这一领域得到了迅速的发展,并得到了一系列新方法[1,2]和数据集[3,4]的支持。受到自下而上注意方法(自下而上Attention)的巨大成功[5]的启发,现有的图像字幕方法大多采用目标检测器提取的区域特征作为视觉表示,如Faster R-CNN[6]。由于检测器是在大规模视觉基因组数据集上进行预训练的[7],因此它可以对图像中的显著区域生成判别表示,并为字幕提供完整的对象信息。为此,基于区域特征的图像字幕已经取得了重大进展[2,8,9]。
2024-01-12 15:32:09 108 1
原创 使用python爬虫语言调用有道翻译实现英中互译(2023实现)
如果你想使用这段代码进行翻译,需要先在有道翻译官网申请一个开发者账号,并获取到相应的API密钥。然后将密钥替换到代码中的。作者简介:人工智能和硬件设计博士生、CSDN与阿里云开发者博客专家,多项比赛获奖者,发表SCI论文多篇。ლ(°◕‵ƹ′◕ლ)希望在传播知识、分享知识的同时能够启发你,大家共同进步。ヾ(◍°∇°◍)ノ゙。
2023-10-23 10:37:32 957
原创 使用python语言调用百度翻译接口实现中英互译(详细教程)
通用翻译API支持提供200+语种互译的在线文本翻译服务,支持多达4万多个语言方向,且支持多语种自动检测。您只需调用通用翻译API,传入待翻译的内容,并指定要翻译的源语言(支持源语言语种自动检测)和目标语言,即可得到相应的翻译结果。这个结果是一个JSON格式的字符串,通过将其解析为Python字典,可以提取出翻译后的文本结果。请求方式: 可使用 GET 或 POST 方式,如使用 POST 方式,Content-Type 请指定为:application/x-www-form-urlencoded。
2023-10-23 09:34:30 423
原创 使用Python找到相似图片的方法
在日常生活中,我们可能会遇到需要查找相似图片的情况。例如,我们可能有一张图片,并希望找到文件夹中与该图片相似的其他图片。本文将介绍如何使用Python代码来快速找到相似图片。
2023-10-19 08:30:00 324
原创 使用Python找到重复图片的方法
在日常生活中,我们可能会遇到需要清理计算机中的大量图片文件的情况。其中一个常见的问题是重复的图片占据了大量的存储空间,因此我们需要找到并删除这些重复的图片。本文将介绍如何使用Python代码来快速找到重复图片,并将它们复制到指定文件夹。
2023-10-18 09:13:20 416
原创 使用PyQt5创建图片查看器应用程序
作者:安静到无声在本教程中,我们将使用PyQt5库创建一个简单的图片查看器应用程序。这个应用程序可以显示一系列图片,并允许用户通过按钮切换、跳转到不同的图片。
2023-10-13 19:45:00 522
原创 【image captioning】CaMEL: Mean Teacher Learning for Image Captioning(实现流程)
作者:安静到无声。
2023-10-02 19:53:19 329 2
原创 如何在远程服务器下运行tensorboard,并在本地服务器看运行情况
为了更好地进行数据分析和可视化,我们可以在远程服务器上运行TensorBoard,并通过SSH端口转发,在本地服务器上查看TensorBoard的运行情况。这样,我们可以使用远程服务器的强大计算能力,同时也能够更加直观地展示和查看数据,为数据分析和决策提供更加有力的支持。
2023-10-01 18:01:49 919
原创 Image captioning数据集、评价指标和算法性能比较
可以发现,基于深度学习的图像描述算法正在从不同的角度解决相关技术挑战,包括传递更加丰富的特征信息的Show,AttendandTell、SCA-CNN、Up-Down、LBPF、DLCT、DRT和GroupCap等算法,解决暴露偏差问题的SCST等算法,生成多样性的图像描述的SGAE、Dual-GCN、ASG2Caption、rAIRL和LSTM-P等算法,实现图像描述的可控性的Show,ControlandTell、CGO、VSR、StyleNet和SemStyle等算法。
2023-10-01 16:32:16 960 3
原创 成功解决安装spacy==2.x出现的问题:功解决sre_constants.error: bad escape \p at position 173
作者:安静到无声。
2023-09-27 19:01:58 157
原创 【Image captioning】Dual-Level Collaborative Transformer for Image Captioning在自定义数据集的调试与实现(过程完整详细)
作者:安静到无声。
2023-09-11 22:54:47 424 12
原创 【Image captioning】 Dual-Level Collaborative Transformer for Image Captioning实现流程
作者:安静到无声。
2023-09-11 22:20:24 244
原创 【Image captioning】S2 Transformer for Image Captioning 实现流程
发布了视觉特征(ResNeXt-101和ResNeXt-152)。我们的代码实现也是基于他们的。模型的集成,在在线COCO测试服务器上报告了我们模型的性能。详细的在线测试代码可以在此。**注意:**运行我们的代码需要Python 3。评估指标,因为该指标的计算代价较高。你可以在评估模型时添加它:下载此文件。**注意:**我们已删除训练过程中的。**更新:**图像特征文件已上传至。来确定训练使用的GPU数量。来训练我们的模型,你可以在。准备的原始标注,以及来自。**注意:**我们使用。文件中相关代码的注释。
2023-09-09 18:46:08 290
原创 【Image captioning】RSTNet: Relationship-Sensitive Transformer Network在自定义数据集的调试与实现
作者:安静到无声。
2023-09-09 18:10:46 193
转载 【Image captioning】RSTNet: Relationship-Sensitive Transformer Network论文阅读
作者发现Transformer在image captioning任务上处理grid特征,会有两个缺点。第一,grid特征的二维相对位置信息被破坏了。第二,模型在生成单词的时候并不一定需要关注视觉特征。因此,作者提出了GA和AA两个模块来解决这个问题,并将这两个模块嵌入到Transformer中形成RSTNet,在COCO数据集上达到了SOTA的性能。转载自:https://mp.weixin.qq.com/s/Xs9aNiMcuDrXhcDgWzAweg。
2023-09-08 09:56:54 179
原创 【Image captioning】RSTNet: Relationship-Sensitive Transformer Network代码实现流程
作者:安静到无声。
2023-09-06 20:18:13 256 2
原创 【Image captioning】基于Defense of Grid Features for Visual Question Answering代码生成自定义数据集的网格特征
作者:安静到无声。
2023-09-05 22:24:03 145
原创 成功解决安装spacy==2.x出现的问题:OSError: [E050] Can‘t find model ‘en_core_web_sm‘. It doesn‘t seem to be .....
作者:安静到无声
2023-09-03 11:50:00 109
原创 【Image captioning】Attention on Attention for Image Captioning之训练与调试
作者:安静到无声。
2023-09-01 20:15:02 217
原创 Pyecharts教程(十三):使用pyecharts绘制K线图并设置ItemStyle的讲解
K线图是用于展示股票或其他金融产品价格走势的图表之一。在本文中,我们将使用pyecharts库来生成K线图,并通过设置ItemStyle来自定义K线和蜡烛图的样式。本文介绍了如何使用pyecharts库绘制K线图,并通过设置ItemStyle来自定义K线和蜡烛图的样式。通过这个例子,你可以进一步了解如何使用pyecharts进行数据可视化,并灵活地定制图表的外观。
2023-08-29 21:58:37 432
原创 Pyecharts教程(十二):使用pyecharts创建带有数据缩放滑块和位置指示器的K线图
本博客将详细解释如何使用Python中的pyecharts库创建一个带有数据缩放滑块和位置指示器的K线图。我们将讨论代码中每个部分的功能和作用,并给出相应的示例代码。本篇博客中,我们使用pyecharts库创建了一个带有数据缩放滑块和位置指示器的K线图。我们首先导入必要的模块和函数,然后定义了K线图的数据。接下来,我们创建了一个K线图对象,并添加了X轴和Y轴的数据。在设置全局配置项时,我们为X轴和Y轴指定了一些属性,包括数据缩放滑块和位置指示器的位置。最后,我们将图表渲染到HTML文件中。
2023-08-29 21:43:06 326
[2015年国赛MATLAB创新奖B题]西安电子科技大学-“互联网+”时代的出租车资源配置.zip
2023-08-27
[2015年国赛MATLAB创新奖D题]解放军重庆通信学院-众筹筑屋规划方案设计模型.zip
2023-08-27
[2014年国赛MATLAB创新奖A题]浙江工业大学-嫦娥三号软着陆轨道设计与控制策略.zip
2023-08-27
[2013年国赛MATLAB创新奖D题]烟台职业学院-城市公共自行车服务系统运行状况和效率分析.zip
2023-08-27
[2013年国赛IBM SPSS创新奖D题]赣南师范学院-公共自行车服务系统评价模型研究.zip
2023-08-27
图像描述标注(Image captioning)软件的设计与实现
2024-01-22
FPGA+图像soble滤波+ZYBO+verilog(这是一个特别完整的工程代码)
2023-08-31
FPGA+Verilog搭建一个卷积运算单元的简单实现+ZYBO+verilog(这是一个特别完整的工程代码)
2023-08-31
FPGA+彩色图片显示+verilog+ZYBO(这是一个特别完整的工程代码)
2023-08-31
FPGA+彩条显示+ZYBO(这是一个特别完整的工程代码)
2023-08-31
如何撰写数学建模论文()
2023-08-31
Python可视化典型例程(phcarts,matploible,seaborn)
2023-08-29
[2017年国赛MATLAB创新奖C题]南京铁道职业技术学院-颜色与物质浓度的辨识问题.zip
2023-08-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人