自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

QQ704630835的博客

记录自己的学习过程

  • 博客(140)
  • 资源 (3)
  • 收藏
  • 关注

原创 几篇关于对比学习处理遥感图像的文章小结

对比学习在遥感领域的一点成果

2022-08-22 10:12:35 1712 1

原创 快速抽取resnet_v2_152中间的特征层

基于tensorflow做resent抽取中间层特征

2022-07-29 18:01:53 936

原创 安装opencv时报错:Could not build wheels for opencv-python which use PEP 517 and cannot be installed direc

一、问题背景最近写一批程序,需要用到opencv里面的函数,但是导入cv2的时候,新电脑提示没有安装,所以首先安装opencv的库,直接pip install opencv-python,不过报错了。然后从镜像站中安装opencv,直接pip install -i https://mirrors.aliyun.com/pypi/simple opencv-python,不过仍然报错,报错原因和上一次一样:Could not build wheels for openc...

2022-05-03 23:52:10 35856 18

原创 【文献阅读】路径感知的图注意力做运动预测(Fang Da等人,ArXiv,ICRA 2022)

一、背景文章题目:《Path-Aware Graph Attention for HD Maps in Motion Prediction》文章下载地址:2202.13772.pdf (arxiv.org)https://arxiv.org/pdf/2202.13772.pdf文献引用格式:Fang Daand Yu Zhang. "Path-Aware Graph Attention for HD Maps in Motion Predict...

2022-05-03 11:13:56 881

原创 【文献阅读】用对比学习做弱监督语义分割(Sung-Hoon Yoon等人,ArXiv,2021)

一、背景文章题目:《Exploring Pixel-level Self-supervision for Weakly Supervised Semantic Segmentation》 文章下载地址:2112.05351.pdf (arxiv.org)https://arxiv.org/pdf/2112.05351.pdf 文献引用格式:Sung-Hoon Yoon,Hyeokjun Kweon, Jaeseok Jeong, Hyeonseong ...

2022-02-21 16:44:59 4408

原创 【投稿经验】生成对抗网络提取冰湖

一、背景情况 这篇文章大概是19年就构思好了开始在做了,但是由于手头一直有其他事情,这篇文章也就一直脱到今年才投出去。本来觉得应该能投一个挺好的期刊的,因为当初开始做的时候,并没有人用深度学习来提取冰湖,而今年的时候看到了两篇用Unet来做的,所以其实这篇的新意就没那么大了。最后只投了一个二区的期刊。二、文章简要内容 文章创新点有三: (1)制作了一个Landsat数据集用于冰湖提取。总计约4600张图,采用三种不同的采样方式获得。 ...

2021-12-02 11:20:57 1708

原创 使用Landsat系列数据来检测喜马拉雅地区的冰湖溃决(Georg Veha等人,RSE,2018)

一、背景 这是一篇做冰湖溃决的文章,作者主要使用了random forest来检测喜马拉雅地区的冰湖溃决现象,这项成果发表在了Remote Sensing of Environment上。 文献连接:https://doi.org/10.1016/j.rse.2017.12.025文献引用:Georg Veha, Oliver Korupa, Sigrid Roessnerb, Ariane Walz.Detecting Himalayan glac...

2021-10-26 21:37:43 695 1

原创 【文献阅读】深度时空网络风力预测(Jiangyuan Li等人,ArXiv,2021)

一、背景文章题目:《Deep Spatio-Temporal Wind Power Forecasting》 文献下载地址:2109.14530.pdf (arxiv.org)https://arxiv.org/pdf/2109.14530.pdf文献引用格式:Jiangyuan Li and Mohammadreza Armandpour. "Deep Spatio-Temporal Wind Power Forecasting". arXiv pr...

2021-10-25 15:08:40 1760

原创 【文献阅读】ST-GDN——图神经网络预测交通流量(Xiyue Zhang等人,ArXiv,2021)

一、背景 文章题目:《Traffic Flow Forecasting with Spatial-Temporal Graph Diffusion Network》 文献下载地址:2110.04038.pdf (arxiv.org)https://arxiv.org/pdf/2110.04038.pdf文献引用格式:Xiyue Zhang, Chao Huang, Yong Xu, Lianghao Xia, Peng Dai,Liefeng Bo,...

2021-10-14 16:22:41 2448 6

原创 【文献阅读】图神经网络综述:方法,应用和机遇(L. Waikhom等人,ACM,2021)

一、文章概况 文章题目:《Graph Neural Networks: Methods, Applications, and Opportunities》 文章下载地址:[2108.10733] Graph Neural Networks: Methods, Applications, and Opportunities (arxiv.org)https://arxiv.org/abs/2108.10733 文章引用格式:LILAPATI WAIKHOM and RIPON PAT...

2021-10-12 14:49:26 542

原创 【文献阅读】小目标检测综述:挑战,技术和数据集(M. MUZAMMUL等人,ACM,2021)

一、文章概况 文章题目:《A Survey on Deep Domain Adaptation and Tiny Object Detection Challenges, Techniques and Datasets》 这篇文章的内容实在太长了,这里就挑要点进行介绍了。 文章下载地址:https://arxiv.org/ftp/arxiv/papers/2107/2107.07927.pdf 文章引用格式:MUHAMMAD MUZAMMUL and XI LI....

2021-09-04 00:21:08 2161

原创 【文献阅读】AdVQA——人为干扰下的视觉问答数据集(Sasha Sheng等人,ArXiv,2021)

一、背景 文章题目:《》 文献下载地址: 文献引用格式: 项目地址:

2021-08-18 10:39:14 467

原创 基于随机森林的冰湖提取算法(python语言实现)

一、背景这一篇本身是和《基于双峰阈值分割的冰湖提取算法(python语言实现)》一起做的。而随机森林比阈值分割麻烦一点,就是需要先验知识作为训练数据。训练数据我也同时一并上传了,可以参见:然后算法本身也不必多说,随机森林也是很成熟的算法了,原理什么的就不多说了。下面直接看代码。二、代码随机森林稍微复杂一点点,因为需要先验数据来训练模型。但是相对于阈值分割来说,它的优势在于不用做DN转TOA,无脑训练就可以了。三、实验结果这里给出一个实验结果:这个算法本来是和双峰阈值分割算法一

2021-05-10 11:39:07 1835 7

原创 【文献阅读】GraphVQA——语言导向的GNN解决场景图的问答(Weixin Liang等人,ArXiv,2021)

一、背景文章题目:《GraphVQA: Language-Guided Graph Neural Networks for Scene Graph Question Answering》和【文献阅读】LRTA——图网络解释VQA的答案生成过程(W. Liang等人,NeurIPS,2020)这一篇是同一个作者,内容也比较相似。文章下载地址:https://arxiv.org/pdf/2104.10283.pdf文章引用格式:Weixin Liang, Yanhao Jiang, Zixuan

2021-04-28 10:44:04 1285 1

原创 基于双峰阈值分割的冰湖提取算法(python语言实现)

一、背景之前介绍过这个算法,不过用的IDL语言,可以参见:基于双峰阈值分割的冰湖提取算法(IDL语言实现),最近由于需要重新用到这个算法,就把它用python语言实现了下,下面直接上代码。PS,这里需要注意一点的是,双峰阈值分割可以理解为和方差有关的加权平均值,所以分母应该是方差,而不是均值。二、代码def bimodal(img, save_path, initial_threshold=0.1): if not os.path.exists(save_path):

2021-04-22 17:04:17 1766 5

原创 【文献阅读】MMQA——基于图像、文本和表格的问答(Alon Talmor等人,ICLR,2021)

一、背景文章题目:《MultiModalQA: Complex Question Answering Over Text, Tables and Images》文章下载地址:https://arxiv.org/pdf/2104.06039.pdf文章引用格式:Alon Talmor, Ori Yoran, Amnon Catav, Dan Lahav, Yizhong Wang, Akari Asai, Gabriel Ilharco, Hannaneh Hajishirzi and Jonat

2021-04-20 15:16:18 1640

原创 【文献阅读】PQA——感知问答的数据集和方法(Y. Qi等人,CVPR,2021)

一、背景文章题目:《PQA: Perceptual Question Answering》文章下载地址:https://arxiv.org/pdf/2104.03589.pdf文章引用格式:Yonggang Qi, Kai Zhang, Aneeshan Sain, Yi-Zhe Song. "Density Map Guided Object Detection in Aerial Images." In The IEEE Conference on Computer Vision and P

2021-04-09 17:49:46 846

原创 【文献阅读】SLAKE——医学图像的VQA双语数据集(Bo Liu等人,ArXiv,2021)

一、背景文章题目:《SLAKE: A Semantically-LabeledKnowledge-Enhanced Datasetfor Medical Visual Question Answering》文章下载地址:https://arxiv.org/pdf/2102.09542.pdf文章引用格式:Bo Liu,Li-Ming Zhan, Li Xu, Lin Ma, Yan Yang,Xiao-Ming Wu."SLAKE: A Semantically-LabeledKn...

2021-03-22 10:37:46 2127 2

原创 【文献阅读】VQA能干啥?VQA相关现实应用和未来挑战(Silvio Barraa等人,ArXiv,2021)

一、背景文章题目:《Visual Question Answering: which investigated applications?》文章下载地址:https://arxiv.org/pdf/2103.02937.pdf文章引用格式:Silvio Barraa, Carmen Bisognib, Maria De Marsicoc, Stefano Ricciardi."Visual Question Answering: which investigated applications..

2021-03-12 17:38:10 2891 3

原创 喜马拉雅地区冰湖提取的一般流程——以ISODATA和K-means非监督分类方法为例

一、背景偶然搜文献的时候看到了这一篇,这是一本书中的一个章节,就专门写一篇文章介绍一下。作者是来自印度理工的Jagadeesh Thati, Samit Ari, 和Kajal Agrawal,文章内容也比较简单,故直接介绍。下载链接:https://reader.elsevier.com/reader/sd/pii/B9780128221334000049?token=BBD37F215C9C60914350C3BBB2329DE1FB4AC135548A8CCC48BD40DF91A7FD2D4

2021-03-08 16:33:16 1648 1

原创 【文献阅读】BGN+AN——将答案看做属性组成的小样本VQA学习(D. Guo等人,ArXiv,2021)

一、文章概况文章题目:《Learning Compositional Representation for Few-shot Visual Question Answering》文章下载链接:https://arxiv.org/pdf/2102.10575.pdf文章引用格式:Dalu Guo and Dacheng Tao."Learning Compositional Representation for Few-shot Visual Question Answering".arXi...

2021-03-01 17:26:33 802

原创 【文献阅读】XVQA——一篇关于VQA的解释性研究(K. Alipour等人,ArXiv,2020)

一、文章概况文章题目:《A Study on Multimodal and Interactive Explanations for Visual Question Answering》文章下载链接:https://arxiv.org/pdf/2003.00431.pdf文章引用格式:Kamran Alipour,Jurgen P. Schulze,Yi Yao,Avi Ziskindand Giedrius Burachas."A Study on Multimodal and I...

2021-02-25 10:13:54 836

原创 【文献阅读】FloodNet——洪水灾害的VQA问答数据集(M. Rahnemoonfar等人,ArXiv,2020)

一、背景文章题目:《FloodNet: A High Resolution Aerial Imagery Dataset for Post Flood Scene Understanding》文章下载:https://arxiv.org/pdf/2012.02951.pdf文章引用:Maryam Rahnemoonfar, Tashnim Chowdhury, Argho Sarkar, Debvrat Varshney, Masoud Yari and Robin Murphy."Floo..

2020-12-21 17:16:34 2155 1

原创 【文献阅读】HieCoAttenVQA——分层协同注意力网络VQA(J. Lu等人,NIPS,2016,有代码)

一、背景文章题目:《Hierarchical Question-Image Co-Attention for Visual Question Answering》这篇文章比较早,所以就挑一些重要的内容来写。文章下载地址:https://arxiv.org/pdf/1606.00061.pdf文章引用格式:Jiasen Lu, Jianwei Yang, Dhruv Batra, Devi Parikh. "Hierarchical Question-Image Co-Attention fo

2020-12-08 16:03:04 1614 7

原创 【文献阅读】LRTA——图网络解释VQA的答案生成过程(W. Liang等人,NeurIPS,2020)

一、背景文章题目:《LRTA: A Transparent Neural-Symbolic Reasoning Framework with Modular Supervision for Visual Question Answering》这篇文章的核心内容只有5页,但是做的挺好,方法很新,读起来也非常容易理解。文章下载地址:https://arxiv.org/pdf/2011.10731.pdf文章引用格式:Weixin Liang,Feiyang Niu, Aishwarya Reg.

2020-12-03 11:18:28 1295

原创 【文献阅读】SelResVQA——具有自适应选择的学习模态内的关系(J. Hong等人,Neurocomputing,2020)

一、背景文章题目:《Selective residual learning for Visual Question Answering》文章下载地址:https://linkinghub.elsevier.com/retrieve/pii/S0925231220304859文章引用格式:Jongkwang Hong, Sungho Park, Hyeran Byun. Selective residual learning for Visual Question Answering.Neuro.

2020-11-26 15:11:11 1532 4

原创 【文献阅读】MLIN——对视觉区域和问题单词之间的关系进行建模(P. Gao等人,ICCV,2019)

一、背景文章题目:《Multi-modality Latent Interaction Network for Visual Question Answering》文章下载地址:https://openaccess.thecvf.com/content_ICCV_2019/papers/Gao_Multi-Modality_Latent_Interaction_Network_for_Visual_Question_Answering_ICCV_2019_paper.pdf文章引用格式:Linj

2020-09-28 11:37:11 919

原创 【文献阅读】用于zero-shot识别的双曲视觉嵌入学习网络(S. Liu等人,CVPR,2020)

一、背景文章题目:《Hyperbolic Visual Embedding Learning for Zero-Shot Recognition》文章下载地址:https://openaccess.thecvf.com/content_CVPR_2020/papers/Liu_Hyperbolic_Visual_Embedding_Learning_for_Zero-Shot_Recognition_CVPR_2020_paper.pdf文献引用格式:Shaoteng Liu,Jingjing.

2020-09-07 16:51:15 1689 3

原创 【文献阅读】ReGAT——关系感知图注意力网络来提高VQA对图像中复杂语义的理解(L. Li等人,ICCV,2019)

一、背景文章题目:《Relation-Aware Graph Attention Network for Visual Question Answering》文章下载地址:https://ieeexplore.ieee.org/document/9010056或者https://openaccess.thecvf.com/content_ICCV_2019/papers/Li_Relation-Aware_Graph_Attention_Network_for_Visual_Question_A..

2020-09-01 14:35:16 2343

原创 【文献阅读】基于格网注意力的VQA比基于区域注意力的VQA更快更轻?(H. Jiang等人,CVPR,2020)

一、背景文章题目:《In Defense of Grid Features for Visual Question Answering》文章下载地址:https://openaccess.thecvf.com/content_CVPR_2020/papers/Jiang_In_Defense_of_Grid_Features_for_Visual_Question_Answering_CVPR_2020_paper.pdf文献引用格式:Huaizu Jiang, Ishan Misra, Mar

2020-08-25 15:12:42 531 1

原创 【文献阅读】MFB——结合协同注意力的多模态矩阵分解的双线性池化方法(Z. Yu等人,ICCV,2017,有代码)

一、背景文章题目:《Multi-modal Factorized Bilinear Pooling with Co-Attention Learning for Visual Question Answering》文章下载地址:https://arxiv.org/pdf/1708.01471.pdf文章引用格式:Zhou Yu, Jun Yu, Jianping Fan, Dacheng Tao. "Multi-modal Factorized Bilinear Pooling with Co-

2020-08-19 16:58:18 4960

原创 【文献阅读】seada-VQA对数据进行对抗增强并保留语义正确性(R. Tang等人,ArXiv,2020)

一、背景文章题目:《Semantic Equivalent Adversarial Data Augmentation for Visual Question Answering》文章下载地址:https://arxiv.org/pdf/2007.09592.pdf文章引用格式:Ruixue Tang, Chao Ma, Wei Emma Zhang, Qi Wu, and Xiaokang Yang. "Semantic Equivalent Adversarial Data Augmenta

2020-08-06 10:52:36 931 1

原创 【文献阅读】ChangeNet——变化检测网络(A. Varghese等人,ECCV,2018)

一、背景文章题目:《ChangeNet: A Deep Learning Architecture for Visual Change Detection》这篇文章思路非常简单,觉得能中ECCV还是有点牵强啊。变化检测一般就是孪生网络+反卷积,能还原出变化的mask就行,考虑到不同尺度下的变化特征,引入多尺度特征层就可以了。即使不看这篇文章,一般人也能想到这个思路。感觉能中ECCV有点玄学,因为亮点不多。文章下载地址:文章引用格式:Ashley Varghese, Jayavardhana

2020-08-04 17:07:20 4665 1

原创 【文献阅读】在VQA的答案空间中引入相似性测度(Corentin Kervadec等人,ArXiv,2020)

一、背景文章题目:《Estimating sementic structure for the VQA answer space》和前面的那篇文章是同一个团队:【文献阅读】GQA-OOD——测试低频样本问答的数据集和评估方法(Corentin Kervadec等人,ArXiv,2020,有代码),这篇文章的思路其实也比较好理解,就是因为一般答案环节都是用分类来做的, 无法度量相似类别,因此作者在答案空间进行了修改。文献下载地址:https://arxiv.org/pdf/2006.05726.p

2020-07-28 11:29:52 646 1

原创 【文献阅读】结合对抗网络和知识蒸馏,对多模态源的遥感图像分类(S. Pande等人,ICCV,2019)

一、背景文章题目:《An Adversarial Approach to Discriminative Modality Distillation for Remote Sensing Image Classification》遥感图像分类一直都是一个热门话题,这篇文章结合对抗网络和知识蒸馏来做遥感图像分类。亮点在于结合不同模态的数据。文章下载地址:https://openaccess.thecvf.com/content_ICCVW_2019/papers/CROMOL/Pande_An_Ad

2020-07-27 17:36:25 3029 1

原创 用LaTex排版IEEE Trans文章的一些步骤及资料记录

一、准备需要下载IEEE Trans的模板,并准备Latex软件。LaTeX软件我用的是Tax Live,下载地址:http://tug.org/texlive/acquire-netinstall.htmlIEEE Trans的模板,下载地址:https://template-selector.ieee.org/secure/templateSelector/publicationType,不同的期刊模板稍微有点区别,可以到这个下载地址里找自己想要投稿的期刊,下载相应的模板就行了。

2020-07-24 16:01:52 14629 5

原创 【文献阅读】FPAIT——小样本学习与VQA(X. Dong等人,ACM MM,2018,有代码)

一、背景文章题目:《Fast Parameter Adaptation for Few-shot Image Captioning and Visual Qestion Answering》之前看小样本学习的时候看到的一篇few-shot+VQA,不过一直没仔细看,现在回过头来看一下这篇文章。文章下载地址:忘了这篇文章是从哪下载的了。。。文章引用格式:Xuanyi Dong, Linchao Zhu, De Zhang, Yi Yang, Fei Wu. 2018. Fast Paramet

2020-07-21 16:33:49 770

原创 【文献阅读】用GAN来做遥感图像的变化检测(M. A. Lebedev等人,ISPRS,2018)

一、背景文章题目:《Change Detection In Remote Sensing Images Using Conditional Adversarival Networks》文章比较简单,且技术不是很新,所以这篇简要记录一下。文献下载地址:https://www.int-arch-photogramm-remote-sens-spatial-inf-sci.net/XLII-2/565/2018/isprs-archives-XLII-2-565-2018.pdf文献引用格式:M.

2020-07-17 11:12:19 2305 2

原创 【文献阅读】在遥感图像中引入密度图导向的目标检测(C. Li等人,CVPR,2020)

一、背景文章题目:《Density Map Guided Object Detection in Aerial Images》一篇目标检测的文章。文献下载地址:https://openaccess.thecvf.com/content_CVPRW_2020/papers/w11/Li_Density_Map_Guided_Object_Detection_in_Aerial_Images_CVPRW_2020_paper.pdf文献引用格式:Changlin Li, Taojiannan Y

2020-07-16 15:48:08 1909 2

原创 【文献阅读】EST-VQA——基于事实的场景文本VQA(X. Wang等人,CVPR,2020)

一、背景文章题目:《On the General Value of Evidence, and Bilingual Scene-Text Visual Question Answering》这篇文章是关于场景文本的研究。文章下载地址:https://openaccess.thecvf.com/content_CVPR_2020/papers/Wang_On_the_General_Value_of_Evidence_and_Bilingual_Scene-Text_Visual_CVPR_202

2020-07-14 10:30:18 1481 2

随机森林冰湖提取的训练数据

利用随机森林算法提取冰湖需要训练数据,这里提供一组训练数据,里面包含一张256*256*7的landsat影像和相应的冰湖mask。具体使用参考https://blog.csdn.net/z704630835/article/details/116591447

2021-05-10

布朗大学2010年春季计算图形学课件和参考书

具体描述参见:https://blog.csdn.net/z704630835/article/details/89419336。该文件是布朗大学2010年春季的课程,计算图形学,文件内包含参考书以及课程所有的ppt。

2019-04-22

cartoonGAN_dataset

这个文件是自己爬取的数据集,并经过了预处理,所有影像的大小均为256*256,包括647张《言叶之庭》的图像,5400张现实风景影像,10张测试影像;用于cartoonGAN模型的训练,cartoonGAN的实现过程可参考:https://blog.csdn.net/z704630835/article/details/84336398

2018-11-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除