自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(51)
  • 收藏
  • 关注

原创 机器学习之——诈骗号码识别

主要采用sklearn和pandas对电话号码诈骗识别进行建模和对一些用户数据进行预处理

2023-12-04 17:58:14 1324

原创 Pandas loc和iloc 以及 pivot和melt详解

pandas数据筛选 iloc loc 数据格式变换:pivot,melt

2023-12-04 15:04:07 1076

原创 python可视化之——seaborn简单图绘制指南

该文主要介绍python下的seaborn绘图库,包含了大部分seaborn中的图形绘制。

2023-12-01 18:26:43 1133

原创 python合并excel

摘要:python实现对多个excel合并成一个excel,1 实现简单合并,2 实现vlookup功能。

2023-11-30 10:13:14 760

原创 chatgpt catgpt

如何使用gpt

2023-03-28 16:00:11 10110 2

原创 linux安装mysql

linux安装hive-3.1.2和安装mysql

2022-11-08 10:38:43 942

原创 CentOS 网络配置之ping不通

centos网络配置

2022-11-07 12:44:33 4541

原创 python读取json文件报错

在跑目标检测任务时,python读取annotation里instance_train2014报如下错:ValueError: Unterminated string starting at: line 1 column 18194403 (char 18194402)ValueError: Expecting object: line 1 column 49012736 (char 49012735)ValueError: Expecting object: line 1 column 11.

2022-02-28 11:25:09 2441

原创 python对比两个excel表 【超简单】

注:由于我们不是专门做数据处理与分析的,因此懂的也少,所以编写的python程序是简单易懂的,如果存在bug或者可以有更好的方法,欢迎大佬指出!!!主要思路:就是将excel表中每条数据变成一个字典,然后添加到列表中,组成一个元素为字典类型的列表(由于数据不可公开,所以做了马赛克)。如下:excel数据:表1​excel数据:表2可以看到每个excel表数据很多,都几千条,如果一个个看很费时。import openpyxl# 加载第一个Exceldata_raw= openpyxl..

2021-06-02 18:48:43 11038 4

原创 知识蒸馏之手写体识别

知识蒸馏本文主要是根据该网站视频(https://www.bilibili.com/video/BV1s7411h7K2?t=906)进行总结,如有理解误差,望批评指点1. 首次提出首次提出:https://arxiv.org/pdf/1503.02531.pdf作者的动机是想找到一个方法,把多个模型的知识提炼给单个模型。虽然现在很多分类模型都采用交叉熵衡量预测值与真实值,然而真实值采用的one-hot向量所能提共的信息没有概率分布多。原理:概率分布比onehot更能提供信息-暗知识。lo

2021-04-22 11:56:45 416 2

原创 RuntimeError: CUDA out of memory. Tried to allocate 22.00 MiB (GPU 0; 10.76 GiB total capacity; 9.61

RuntimeError: CUDA out of memory. Tried to allocate 22.00 MiB (GPU 0; 10.76 GiB total capacity; 9.61 GiB already allocated; 4.50 MiB free; 332.12 MiB cached)有时遇到这种情况,怎么改batchsize都还是会报内存溢出错误,nVidia-smi时发现gpu很多空闲,这时出现的原因极可能就是中间变量数据导致的,这时可以检查loss,acc,pred等中间

2021-04-04 13:30:29 3224 1

原创 【论文阅读笔记】SCR: Self-Critical Reasoning for Robust Visual Question Answering

论文地址:https://arxiv.org/pdf/1905.09998v3.pdf项目地址:https://github.com/jialinwu17/Self_Critical_VQA摘要Visual Question Answering (VQA) deep-learning systems tend to capture superfi-cial statistical correlations in the training data because of strong language

2021-03-23 17:13:19 448

原创 关于pytorch复现模型的一些报错总结

1.RuntimeError: One of the differentiated Tensors does not require grad关于这个报错的意思是:有一个参数不需要计算导数此torch.autograd.grad函数参数如下:outputs,inputs,函数功能是求outputs关于inputs的导数,此处的inputs需要加requires_grad_()定义:v = Variable(v).to(device).requires_grad_()2. RuntimeError:

2021-03-17 20:13:44 5896

原创 pytorch安装进度为0解决方法

在终端添加以下源conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forgeconda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anac

2021-03-09 17:35:18 1960

原创 视觉问答VQA论文近期总结

声明:全是结合论文加自己简单理解,可能存在理解错误,望见谅,不足很多没写,欢迎补充。论文笔记总结1. 写在前面模型的实验准确度对比如下:Y/NNumOtherAlltest-std All年份SAN79.336.646.158.758.92016H-COA79.738.751.761.862.12017MUTAN85.1439.8158.5267.4267.362017BAN85.4254.0460.52.

2020-12-22 19:02:31 1475 1

原创 Detecting Visual Relationships with Deep Relational Networks

用深度关系网络检测视觉关系物体之间的关系在图像理解中起着重要的作用,以前的研究方法将“关系”作为一个分类问题,每一种关系类型(如:‘骑’)或每个不同的视觉短语(如‘人-骑-马’)作为一个类别。但这种存在缺陷,例如视觉外观多样,视觉短语多样。针对此,本文建立一个综合框架来解决这个问题。框架的核心就是 深度关系网络1. 引言早期将视觉关系视为一个分类任务,考虑将对象和关系谓词的不同组合作为一个类,但是会遇到很多不平衡类,例如视觉基因组中有超过75k不同的视觉短语,每个短语的样本数量从少量到超过10k不等,

2020-12-13 18:51:00 328

原创 图卷积网络在文本和视频的关系对齐中的应用

1.写在前面原文来自知网《基于视觉-文本关系对齐的跨模态视频片段检索》这是一篇关于利用文本进行视频片段检索的论文。2.论文要点论文总结了前人研究工作的缺点,并借助图结构在表达关系时的强大能力与图卷积网络的近年发展,,提出了跨模态关系对齐的图卷积框架 CrossGraphAlign,具体就是CrossGraphAlign首先为查询文本和待检索视频分别生成文本关系图和视觉关系图。接着CrossGraphAlign中的视觉-文本关系对齐的图卷积网络试图匹配一段时间内的文本关系图和视觉关系图。最后基于匹配

2020-12-13 11:34:08 413

原创 从linux服务器配置到远程访问

1.下载NVIDIA所需驱动首先输入nvidia-smi便知道nvidia的驱动是否安装,图中提示没有安装。可按如下步骤安装按它给的命令下载相应驱动图中的sudo apt install nvidia-340图中的sudo apt install nvidia-utils-390按ubuntu推荐的驱动直接安装查看显卡型号:输入:ubuntu-drivers devices自动安装:sudo ubuntu-drivers autoinstall执行好后就直接reboot.重

2020-12-08 18:08:53 343

原创 【结果分析】之murel项目结果分析

1.murel:视觉问答VQA中的多模态关系推理项目介绍本次结果是第20个epoch,采用的是验证集的results文件,由于中途断了,导致没有执行测试集test.2.结果分析我们评估采用的使官网提供的eval,2.1 结果Overall Accuracy is: 64.50Per Question Type Accuracy is the following:none of the above : 58.44what are the : 50.41what is : 43.08

2020-11-23 18:09:19 311

原创 【结果分析】之block项目

blockvqa项目介绍1.vqaEval# This code is based on the code written by Tsung-Yi Lin for MSCOCO Python API available at the following link: # (https://github.com/tylin/coco-caption/blob/master/pycocoevalcap/eval.py).import sysimport reclass VQAEval: de

2020-11-23 16:57:25 454

原创 VQA-ReGat 项目运行遇到的错误

VQA-ReGat:关系感知图形注意网络用于VQA项目地址论文地址1.torch报错:StopIteration: Caught StopIteration in replica 0 on device 0.原因:多GPU运行此项目报错,可能是torch版本错误。修改:按照别的博客将 weight = next(self.parameters()).data改为weight = torch.float322.仍报错:AttributeError: 'torch.dtype' no att

2020-11-21 10:34:56 3604 19

原创 【数据分析】之ReGat的VQAFeaturesDataset加载

1 .VQAFeatureDataset此类是ReGat项目对torch自带的from torch.utils.data import Dataset的重写,是模型运行的时候训练集和测试集的加载,加载的数据是模型forward函数的参数。如下:regat.forward(): def forward(self, v, b, q, implicit_pos_emb, sem_adj_matrix, spa_adj_matrix, labels): "

2020-11-17 12:34:25 517 3

原创 【数据处理】之读取hdf5文件

hdf5文件HDF5是一种常见的跨平台数据存储文件,可以存储不同类型的图像和数码数据,并且可以在不同类型的机器上传输,同时还有统一处理这种格式的函数库HDF5文件一般以.h5和.hdf5作为后缀名,hdf5文件结构中有2个主要对象:Groups和Datasets,Groups:类似于文件夹,每个hdf5文件其实就是根目录groupDatasets:类似于Numpy中的数组hdf5读取参考#!/usr/bin/python# -*- coding: UTF-8 -*-## Create

2020-11-14 17:43:24 5830 1

原创 论文解读之VQA视觉问答

VQA:Visual Question AnsweringAbstract 摘要本文提出了以自由形式和开放式的视觉问答任务。给定图像和关于图像的自然语言问题,这个任务会给出一个精确的自然语言答案。视觉问题是有选择性的在图片不同区域包括背景细节或者基础上下文。与产生通用图片标题的系统相比,VQA上成功的系统通常需要对图像和复杂的推理有更详细的了解。此外,VQA易于进行自动评估,因为许多开放式答案内容仅仅需要几个单词或者是在多选题中提供的一组相近的答案,本文提供的数据集包括25万张图片,约76万个问题和10

2020-11-12 11:19:10 1106 1

原创 VQA-object_counting代码项目分析

0. 写在前面本文主要介绍《LEARNING TO COUNT OBJECTS IN NATURAL IMAGES FOR VISUAL QUESTION ANSWERING》的代码项目,也就是别人的代码加上自己的注释。。。博客地址:https://blog.csdn.net/snow_maple521/article/details/109190431论文地址:https://github.com/Cyanogenoid/vqa-counting项目地址:https://openreview.n

2020-11-12 11:16:20 992 3

原创 视觉问答项目

视觉问答项目1. 项目地址本笔记项目包括如下:MCAN(Deep Modular Co-Attention Networks for Visual Question Answering)用于VQA的深层模块化的协同注意力网络项目地址:MCAN_paper代码地址:MCAN_codemurel(Multimodal Relational Reasoning for Visual Question Answering)视觉问答VQA中的多模态关系推理项目地址:murel_paper

2020-11-12 11:15:04 1698 7

原创 【数据处理】pth文件读取

1. 数据处理首先将json文件(如下),经过一系列处理好保存在trainset.pth文件中1.1 json文件数据预处理----trainset.pth文件 self.path_trainset = osp.join(self.subdir_processed, 'trainset.pth') #将vqa2.0json文件处理好后存放的地方 def process(self): dir_ann = osp.join(self.dir_raw, 'annota

2020-11-12 11:02:10 9574 1

原创 【数据处理】之读取csv文件报错

报错1:OverflowError: Python int too large to convert to C long将csv.field_size_limit(sys.maxsize)更改为下:import sysmaxInt = sys.maxsizedecrement = Truewhile decrement: decrement = False try: csv.field_size_limit(maxInt) except OverflowE

2020-11-12 09:25:18 904 1

原创 添加自己的参数和网络

1. add networkfrom .net import Netfrom .my_net import MyNetdef factory(engine=None): Logger()('Creating mnist network...') if Options()['model']['network']['name'] == 'net': network = Net() # 要设置好网络的名字 #model: # name: simple #

2020-11-08 23:04:35 211

原创 pytorch之Bootstrap简单介绍

根据 bootstrap.pytorch官方翻译的1 简介Bootstrap是启动深度学习项目的高级框架。它旨在通过提供只关注数据集和模型的强大工作流来加速研究项目和原型开发。1.1 下载pip install bootstrap.pytorch2 内容bootstrap包含Engine(启动引擎),Dataset(数据集),Model(模型),Options(选择),Logger(日志),View(评估可视化)模块,具体内容如下:2.1 EngineBoostrap的核心是boo.

2020-11-08 22:36:07 1427 2

原创 [论文阅读笔记]:LEARNING TO COUNT OBJECTS IN NATURAL IMAGES FOR VISUAL QUESTION ANSWERING

物体计数在VQA任务中的应用摘要Visual Question Answering (VQA) models have struggled with counting objects in natural images so far. We identify a fundamental problem due to soft attention in these models as a cause. To circumvent this problem, we propose a neural net

2020-10-22 12:24:33 809 1

原创 Multi-modality Latent Interaction Network for Visual Question Answering 面向视觉问题回答的多模态潜在交互网络

摘要现有的VQA技术大多是对单个视觉区域和单词之间的关系进行建模,这不足以正确回答问题,从人类角度考虑,回答视觉问题需要理解视觉和问题信息的概要。本文提出MLI模块,能够学习潜在的视觉和语言的概要之间的跨模态关系,该模式将视觉区域和问题汇总为少量的潜在表示,从而避免对单个区域和单词关系进行建模。这种潜在的表示融合了两种模式的有价值的信息,并被用于更新视觉和语言的特征。这个MLI模块可以堆叠多个阶段,以对两种模式之间的复杂和潜在关系进行建模。1.引言在视觉问答技术中,之前的研究涉及:获取更好的图像特征和

2020-10-11 11:39:44 505

原创 将CSDN博客变成pdf笔记

步骤:打开要打印的csdn笔记—按f12—在控制台(console)下:输入以下代码后enter即可。(function(){ 'use strict'; var articleBox = $("div.article_content"); articleBox.removeAttr("style"); $("#btn-readmore").parent().remove(); $("#side").remove(); $("#comment_title,

2020-10-08 19:11:41 439 2

原创 MUREL: 多模态关系建模

MUREL本文主要简洁介绍下模型的主要内容,具体引言,相关工作和与别的模型比较的地方,先不介绍。1. 论文的主要贡献提出了MuRel概念(多模态关系),引入了MuRel Cell 包含(通过双线性模型融合来表示问题向量q和区域向量si之间的丰富的细粒度交互(图1左框),对成对结合区域关系进行建模的结构(提供每个区域的上下文感知嵌入xi)(图1右框)),si^ 为si的残差函数是一个cell的输出。MuRel网络,迭代多个MuRel Cell,逐渐细化图像和问题的交互。(图2)

2020-10-06 12:24:02 1143

原创 python writelines或者write写入文件,打开空白问题

在pycharm项目中用 f.write()和f.writelines()写入时正常,不报错,但是发现内容没有进去?解决方法,就是将绝对路径改为相对路径原本:"C:/Users/90647/PycharmProjects/MyNetFunction/data/vocab.txt"修改:out_dir = '../data/vocab.txt'怪不得打开一直是空白!!!!唉...

2020-09-25 11:32:01 1859 1

原创 注意力之双线性模型注意力

本文主要针对两篇论文:双线性注意力网络模型和深度模块化注意力进行总结,加上自己对其的理解。若有不足,还望指出。论文地址:双线性注意力网络深度模块化注意力项目地址:双线性注意力网络深度模块化注意力0. 写在前面首先我们要知道什么是注意力机制和什么是双线性模型0.1 注意力机制注意力一词来源与我们自身的视觉系统,现实生活中,我们观察事物倾向于将信息集中进行分析而忽略掉图像中的无关信息。同样,在计算机视觉研究领域中,也存在类似情况,例如VQA任务,可能只有图像中的个别对象与我们的答案有关,.

2020-09-22 14:23:59 7515 1

原创 MUTAN:Multimodal Tucker Fusion For Visual Question Answering

MUTAN:Multimodal Tucker Fusion For Visual Question Answering1. 摘要虽然Bilinear models(双线性模型)在VQA中能够很好的融合信息,帮助学习问题意义和图像内容之间的高级关联,但是存在高维度问题,所以本文引入MUTAN概念——基于多模态张量Tucker分解,能够有效的在视觉和文本的双线性交互(Bilinear models)的模型中进行参数化,除Tucker分解之外,还设计了基于矩阵的低秩分解 来明确限制交互等级。2. 引言V

2020-09-19 21:34:11 1700 2

原创 Hierarchical Co-Attention for Visual Question Answering----代码细读

分层共同注意力代码解读本文主要是对分层共同注意力的其中一篇代码解读,该代码不是原作者写的,原作者用的是torch,源码地址:https://github.com/jiasenlu/HieCoAttenVQA本文用到的源码地址:https://github.com/karunraju/VQA1. 总体代码结构代码结构主要包含,谁是父类,谁是子类,谁调用谁…等,我将代码的结构,用思维导图表示,如下:详细如下:接下来,分别介绍每个文件。2. dataset.py相应的注释在代码中已标注

2020-09-14 18:23:23 851

原创 神经网络的基础知识

前馈神经网络前馈神经网络是最早被提出的神经网络,熟悉的单层感知机,多层感知机,卷积深度网络等都属于前馈神经网络,之所以叫前馈,可能是因为信息向前流:数据从输入–计算–输出步骤。像RNN有反馈连接的叫反馈神经网络。神经元科学家参考了生物神经元的结构,抽象了神经元模型MP,一个神经元模型包含:输入,计算,输出如图:一个典型的神经元模型:包含n个输入,1个输出,计算功能(先求和,再将结果送入f激活函数中) 图中箭头代表连接,每个箭头都会包含一个权值w。一个神经网络的训练算法就是让权重的值调整到最佳,使得整

2020-09-12 21:25:20 468

原创 神经网络之模型搭建和参数优化---基于CNN

模型搭建与参数优化本文主要是复习pytorch实战计算机视觉的内容,模型采用CNN,数据集是手写体1.模型搭建class Model(torch.nn.Module): def __init__(self): super(Model,self).__init__() self.conv1 = torch.nn.Sequential( torch.nn.Conv2d(1,64,kernel_size=3,stride=1,padding

2020-09-11 20:55:39 409

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除