松鼠的承诺-CSDN博客

原创 Few-shot Learning for Multi-label Intent Detection

在本文中，我们研究了用于用户意图检测的少数快照多标签分类。对于多标签意图检测，最新的工作估计了标签实例相关性得分并使用阈值来选择帐篷标签中的多个相关标签。要确定适当的阈值，只需一个举几个例子，我们首先学习数据丰富域上的通用阈值体验，然后将阈值调整为某些基于非参数学习的校准的少数镜头域。为了更好地计算标签实例关联性得分，我们将标签名称嵌入作为表示空间中的一个关键点，从而细化了不同类别的表示，使其彼此很好地分离。在两个数据集上的实验表明，提出的模型一次都明显优于强基准和5-shot设置。

2021-01-28 18:21:13 1368 1

原创 Learning FRAME Models Using CNN Filters for Knowledge Visualization

使用CNN过滤器学习FRAME模型以进行知识可视化卷积神经网络（ConvNet或CNN）已被证明在许多任务中非常成功就像计算机视觉领域的人一样在此概念文件中，我们研究了可分辨CNN的生成视角。尤其是，我们建议使用CNN在卷积层预先学习的高表达滤波器来学习生成FRAME（滤波器，随机场和最大熵）模型。我们证明了该学习算法可以在自然场景中生成逼真的丰富对象和纹理图案。我们解释说，每个学习的模型在该模型采用的过滤器层之上的一层对应一个新的CNN单元。我们进一步证明这是可能的使用生成的CNN模型（专家模

2020-11-08 16:36:16 256

原创 Generating Images from Captions with Attention

注意从字幕生成图像基于生成模型的最新进展，我们引入了一种根据自然语言描述生成图像的模型。提出的模型以迭代方式在画布上绘制补丁，同时注意描述中的相关单词。在接受Microsoft COCO培训后，我们将我们的模型与几个基准生成模型进行了图像生成和检索任务比较。我们证明，与其他方法相比，我们的模型可以产生更高质量的样本，并且可以生成具有新颖场景组成的图像，这些图像与数据集中以前看不到的字幕相对应。1 引言统计自然图像建模仍然是计算机视觉和图像理解中的基本问题。这项任务具有挑战性，激发了采用深度神经

2020-11-08 15:58:22 895

原创 Order-Embeddings of Images and Language

图像和语言的顺序嵌入上位性，文本含义和图像标题可以看作是单词，句子和图像上单个视觉语义层次的特殊情况。在本文中，我们提倡对这种层次结构的偏序结构进行显式建模。> 为了实现这一目标，我们介绍了一种学习有序表示的通用方法，并展示了如何将其应用于涉及图像和语言的各种任务。> 我们表明，所得到的表示形式相对于上调预测和图像标题检索的当前方法提高了性能。1引言计算机视觉和自然语言处理越来越紧密地交织在一起。视觉方面的最新工作已经超越了对固定对象类别的区分，而是自动生成了图像的开放式语言描述（V

2020-10-25 15:58:43 885 2

原创 Show, Attend and Tell: Neural Image Caption Generation with Visual Attention

显示，参加和讲述：具有视觉注意的神经图像字幕生成摘要：受机器翻译和对象检测领域最新工作的启发，我们引入了一种基于注意力的模型，该模型可以自动学习描述图像的内容。> 我们描述了如何使用标准的反向传播技术，以确定性的方式训练模型，并通过最大化变分下界随机地训练模型。> 我们还通过可视化展示了模型如何能够自动学习将注视固定在显着对象上，同时在输出序列中生成相应的单词。> 我们通过三个基准数据集（Flickr8k，Flickr30k和MS COCO）的最新性能验证了注意力的使用。1.简介

2020-10-25 15:31:07 2109

原创 Expressing an Image Stream with a Sequence of Natural Sentences

用自然句序列表达图像流摘要：我们提出了一种检索图像流的自然句子序列的方法。由于普通用户经常在他们的特殊时刻拍摄一系列照片，因此最好考虑整个图像流以产生自然的语言描述。尽管几乎所有以前的研究都涉及单个图像和单个自然句子之间的关系，但我们的工作将输入和输出维度扩展到了图像序列和句子序列。为此，我们设计了一种称为相干递归卷积网络（CRCN）的多模式体系结构，它由卷积神经网络，双向递归神经网络和基于实体的局部相干模型组成。我们的方法直接从大量用户生成的博客文章资源中学习，作为文本图像并行训练数据。我们通过定量测

2020-10-18 23:28:09 270

原创 Learning like a Child: Fast Novel Visual Concept Learning from Sentence Descriptions of Images

像孩子一样学习：快速新颖的视觉概念，从图像的句子描述中学习摘要：在本文中，我们从一些带有句子描述的图像中解决了学习新颖的视觉概念及其与其他概念的相互作用的任务。利用语言环境和视觉特征，我们的方法能够有效地假设新单词的语义并将其添加到单词词典中，从而可以用来描述包含这些新颖概念的图像。我们的方法有一个基于[38]的图像字幕模块，并进行了一些改进。特别是，我们提出了一种换位的权重分配方案，该方案不仅可以提高图像字幕的性能，而且可以使模型更适合于新颖的概念学习任务。我们提出了防止过度适应新概念的方法。此外，针

2020-10-18 15:17:29 398

原创 Guiding the Long-Short Term Memory Model for Image Caption Generation

指导长时记忆以生成图像字幕摘要：在这项工作中，我们专注于图像标题生成的问题。我们提出了长期短期记忆（LSTM）模型的扩展，简称为gLSTM。特别是，我们将从图像中提取的语义信息作为额外输入添加到LSTM块的每个单元中，目的是将模型引向更紧密地耦合到图像内容的解决方案。此外，我们探索了用于波束搜索的不同长度归一化策略，以防止偏爱短句。在各种基准数据集（例如Flickr8K，Flickr30K和MSCOCO）上，我们获得的结果与当前的最新技术相当，甚至超越其水平。1. 简介视觉分类的最新成

2020-10-12 21:44:03 591

原创 Long-term Recurrent Convolutional Networks for Visual Recognition and Description

基于深度卷积网络的模型主导了最近的图像解释任务。我们调查了也经常使用的模型是否对涉及序列，视觉和其他方面的任务有效。我们描述了一类递归卷积体系结构，它是端到端可训练的并且适合于大规模的视觉理解任务，并展示了这些模型对于活动识别，图像字幕和视频描述的价值。与先前的模型假定固定的视觉表示或对顺序处理执行简单的时间平均相比，循环卷积模型“加倍深入”，因为它们学习时空的构图表示。当非线性被合并到网络状态更新中时，学习长期依赖性是可能的。可区分的递归模型之所以吸引人，是因为它们可以将可变长度的输入（例如视频）直接映射

2020-10-11 21:48:23 1555 1

原创 Mind‘s eye: A recurrent visual representation for image caption generation

摘要：在本文中，我们探索图像之间的双向映射及其基于句子的描述。对于我们的方法而言，至关重要的是一个递归神经网络，它会在生成或读取字幕时尝试动态构建场景的视觉表示。代表会自动学会记住长期的视觉概念。我们的模型既可以在给定图像的情况下生成新颖的字幕，又可以在给定图像描述的情况下重建视觉特征。我们在一些任务上评估我们的方法。这些包括句子生成，句子检索和图像检索。显示了用于生成新颖图像描述的任务的最新结果。与人工生成的字幕相比，我们自动生成的字幕在21.0％的时间内等于或偏爱人类。对于使用类似视觉特

2020-10-09 21:13:11 363

原创修改热力图颜色条的字体和大小

#绘制混淆矩阵df_cm=pd.DataFrame(conmatrix,index=['消极','中性','积极'], columns=['消极','中性','积极'])plt.figure(figsize=(10,8))f, ax= plt.subplots(figsize = (10, 8))h=sns.heatmap(df_cm,annot=True,cmap="binary",fmt='.20g',ax=ax,linewidths=2, .

2020-07-10 18:10:20 13857

原创基于矢量量化的图像压缩

引言矢量量化是19世纪70年代后期发展起来的一种数据压缩技术，其基本思想是将若干个标量数据组构成一个矢量，然后在矢量空间给以整体量化，从而压缩了数据而不损失多少信息。矢量量化编码也是在图像、语音信号编码技术中研究得较多的新型量化编码方法，它的出现并不仅仅是作为量化器设计而提出的，更多的是将它作为压缩编码方法来研究的。在传统的预测和变换编码中，首先将信号经某种映射变换变成一个数的序列，然后对...

2020-05-03 21:46:35 4142 2

原创基于LSTM实现新闻文本分类

1 相关知识介绍目前对于中文语句的分析来讲，其分词技术多采用Jieba分词技术，该技术是基于前缀词典实现高效的词图扫描，生成句子中汉字所有可能成词情况所构成的有向无环图(DAG)；采用了动态规划（DP）查找最大概率路径，找出基于词频的最大切分组合；对于像各类专有分词、缩写词与新增词等未登录词没有收录在分词词表中，但是必须要切分出来，是采用基于汉字成词能力的HMM模型，使用了维特比(Vit...

2020-04-10 22:56:18 5556 45

原创 Sort_1000pics数据集利用CNN实现图像分类

1、数据集说明从给的Sort_1000pics数据集中了解到，该数据集中包括10类图片，对图片进行查看了解到，0-99对应与人(people)；100-199对应与沙滩(beaches)；200-299对应与建筑(buildings)；300-399对应与大卡车(trucks)；400-499对应与恐龙（dinosaurs）；500-599对应与大象（elephants)；600-...

2020-04-10 22:55:06 1863 27

原创利用Sort_1000pics数据集实现图像分类

2020-04-10 22:43:31 2081 1

原创 AI Studio上安装TensorFlow GPU版本

AI Studio是百度开发的基于其深度学习框架paddlepaddle(飞桨)的AI一站式平台，通过为大家提供免费的顶级GPU（Tesla v100）来推广飞桨框架的，整体感觉paddle还是挺好用的，废话不多说了，接下来看下我们如何在AI studio上安装TensorFlow的GPU版本吧！Step1：打开部署的环境进入终端。Step2:新建一个文件夹来保存我们要下载的Tens...

2020-04-10 22:35:12 3136 6

原创利用kmeans聚类算法对五大联赛球队实力进行分析

利用聚类算法对五大联赛球队实力进行分析数据整理从给的5张表中把数据进行整理，把不必要的数据进行删除，如德甲、法甲等名字;排名、场次这两列对数据的聚合影响不大进行去除，同时将红/黄牌数据列进行剔除，最后保留的信息如图1所示。正在上传…重新上传取消把5张表分别做同样的处理保留在该Excel的Sheet2表中。特别说明18-19年的数据中，德甲的数据都是总场数的数据需要转为场均数...

2020-03-09 22:34:18 2012 1

原创 Cookie+Session+Request+Response总结

Cookie总结保存在客户端中文文件下载：针对浏览器类型，对文件名字做编码处理Firefox(Base64)、IE、Chrome…使用的是URLEncoder./** 如果文件的名字带有中文，那么需要对这个文件名进行编码处理* 如果是IE ，或者 Chrome （谷歌浏览器），使用URLEncoding 编码* 如果是Firefox ，使用Base64编码*///获取来访的客...

2019-09-27 17:15:34 1115

原创 Http协议+Servlet+XML+Tomcat总结

Http协议总结协议：双方在交互、通讯的时候，遵守的一种规范、规则。http协议：针对网络上的客户端与服务器端在执行http请求的时候，遵守的一种规范。其实就是规范了客户端在访问服务器端的时候，要带上那些东西，服务器端返回数据的时候，也要带上什么东西。Http请求数据解释：请求行、请求头、请求体Http响应数据解析：响应行、响应头、响应体post数据是以流的方式写过去，不会在地址栏上面...

2019-09-27 17:14:53 228

原创 MySQL+JDBC+BootStrap总结

MySQL总结SQL的分类：DDL:数据库的定义，与数据库/表结构，create,drop,alterDML:数据操纵语言，操作表数据,insert,update,deleteDCL:数据控制语言，设置用户的访问权限，安全DQL:数据查询语言，select from where …数据库：创建数据库:create database …(数据库的名字)删除数据库:drop datab...

2019-09-27 17:14:21 454

原创关于matlab 2014以前版本过期问题解决

双十一之后打开后matlab 2014以前版本过期提示%%%%%%%%%%%%%%%%%%%%%%%%%%%%INCREMENT Aerospace_Blockset MLM 99 permanent uncounted \ A05070F00D1EB1F92326 VENDOR_STRING=QQ=47399897 HOSTID=ANY \ ck=216 S

2017-11-29 21:22:30 4462

模型可视化软件.zip

很多时候，复现人家工程的时候，需要了解人家的网络结构。但不同框架之间可视化网络层方法不一样，这样给研究人员造成了很大的困扰。前段时间，发现了一个可视化模型结构的神奇：Netron

2021-07-26

characterData.zip

深度学习，图像识别，目标检测

2021-04-13

2015-Chen_Minds_Eye_A_2015_CVPR_paper

在本文中，我们探索图像之间的双向映射及其基于句子的描述。对于我们的方法而言，至关重要的是一个递归神经网络，它会在生成或读取字幕时尝试动态构建场景的视觉表示。代表会自动学会记住长期的视觉概念。我们的模型既可以在给定图像的情况下生成新颖的字幕，又可以在给定图像描述的情况下重建视觉特征。我们在一些任务上评估我们的方法。这些包括句子生成，句子检索和图像检索。显示了用于生成新颖图像描述的任务的最新结果。与人工生成的字幕相比，我们自动生成的字幕在21.0％的时间内等于或偏爱人类。对于使用类似视觉特征的方法，结果比图像和句子检索任务上的最新结果更好或可比。

2020-10-09

模板匹配之信用卡识别

利用目标检测出信用卡卡号的位置并框出，利用模板匹配得到最高的得分的数字保存并显示在最后的识别结果上，是学习深度学习和机器学习的很好借鉴

2020-06-10

利用UDP实现局域网通信

本程序是利用java实现了UDP下的局域网通信，并打包成了EXE可执行文件，不需要java环境就可以直接运行在自己的电脑上，是学习网络通信的很好的例子

2020-06-10

基于双向GRU和贝叶斯分类器的文本分类

基于BiGRU和贝叶斯分类器的文本分类，利用搜狐新闻数据集进行实现，对12个种类进行分类，里面设计BiGRUB提取文本特征，TF-IDF特征权重赋值，Bytes分类进行实现，学习深度学习和机器学习很好的借鉴。

2020-06-10

基于矢量量化的图像压缩

矢量量化（VQ）实际上就是一种逼近的形式，它的思想和“四舍五入”有异曲同工之妙，都是用一个和一个数最接近的整数来近似表示这个数。VQ问题可以这样描述：给定一个已知统计属性的矢量源（也就是训练样本集，每一个样本是一个矢量）和一个失真测度。还给定了码矢的数量（也就是我们要把这个矢量空间划分为多少部分，或者说量化为多少种值），然后寻找一个具有最小平均失真度（数据压缩，肯定是失真越小越好）的码书和空间的划分。

2020-05-03

LSTM实现新闻分类.zip

在本次实例的过程中，采取的数据集为50000条已经标注好的新闻文本信息，其中新闻的种类分别为：体育、娱乐、家居、房产、教育、时尚、时政、游戏、科技和财经，保存在cnew.txt文件中。把文件读取出来，把文本信息和标签信息分别存储在sentences和labelbanes中，由于标签信息为中文，在模型训练的过程中，不能传入非结构化的数据，所以进行向量化，定义label2id将标签和序号相对应，并且把labelnames中的文字信息转化为数字存储在labels。具体的操作如图2所示。

2020-04-10

CNN实现图片分类.zip

数据预处理：将数据集按照类别进行分组处理，分别对应的目录为0-9，读取图片，保存数据集；将数据集和标签按照相同的种子进行打乱处理，然后按照标签的比例进行分割数据集，80%作为训练集（训练集中的10%作为验证集，查看是否过拟合），20%作为测试集。构建CNN模型，这里是基于TensorFlow2.0进行搭建的，具体代码如图所示：其中包括输入层（32*32的图像，3通道），两个卷积层，1个池化层，重复一次，展平经过全连接层，最后输出层，除了输出层的激活函数是softmax，其他的都是relu。模型训练，将处理后数据经过模型训练模型预测，将处理后的测试集数据经过模型进行预测，分别输出模型对于测试集的召回率，精确率和F1测度。根据预测结果和实际结果构建混淆矩阵

2020-04-10

Bytes_SVM_决策树实现代码.zip

Step 1：根据目录分别把图像信息进行读取。 Step2：处理图像数据，先进行尺度变换到256*256，然后进行灰度化处理，再把灰度化处理后的数据进行归一化，把数据保存到矩阵X中；对读取的文件的名字进行处理，截取数字进行除100取商进行标签处理，把得到的标签保存到矩阵Y中。 Step3：根据原数据集的信息分别对0-9进行命名。 Step4：把处理后的数据X，Y按照Y中的比例进行分割处理，其中测试集为20%，训练集为80%。 Step5：建立模型（bytes、决策树、SVM） Step6：把训练集带入模型进行训练。 Step7：把测试集带入训练好的模型进行预测，输出模型对测试集的准确率，召回率和F1测度。

2020-04-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

松鼠

原创 Few-shot Learning for Multi-label Intent Detection

原创 Learning FRAME Models Using CNN Filters for Knowledge Visualization

原创 Generating Images from Captions with Attention

原创 Order-Embeddings of Images and Language

原创 Show, Attend and Tell: Neural Image Caption Generation with Visual Attention

原创 Expressing an Image Stream with a Sequence of Natural Sentences

原创 Learning like a Child: Fast Novel Visual Concept Learning from Sentence Descriptions of Images

原创 Guiding the Long-Short Term Memory Model for Image Caption Generation

原创 Long-term Recurrent Convolutional Networks for Visual Recognition and Description

原创 Mind‘s eye: A recurrent visual representation for image caption generation

原创修改热力图颜色条的字体和大小

原创基于矢量量化的图像压缩

原创基于LSTM实现新闻文本分类

原创 Sort_1000pics数据集利用CNN实现图像分类

原创利用Sort_1000pics数据集实现图像分类

原创 AI Studio上安装TensorFlow GPU版本

原创利用kmeans聚类算法对五大联赛球队实力进行分析

原创 Cookie+Session+Request+Response总结

原创 Http协议+Servlet+XML+Tomcat总结

原创 MySQL+JDBC+BootStrap总结

原创关于matlab 2014以前版本过期问题解决

模型可视化软件.zip

characterData.zip

2015-Chen_Minds_Eye_A_2015_CVPR_paper

模板匹配之信用卡识别

利用UDP实现局域网通信

基于双向GRU和贝叶斯分类器的文本分类

基于矢量量化的图像压缩

LSTM实现新闻分类.zip

CNN实现图片分类.zip

Bytes_SVM_决策树实现代码.zip

Kmeans_class.py

java与matlab混合编程

微信小程序——商城类

空空如也