自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Breeze

keep up,一直在进步就好呀!

  • 博客(57)
  • 资源 (3)
  • 收藏
  • 关注

原创 Pointnet语义分割任务S3DIS数据集上的注意点

前言Pointnet的网络结构和源码解释,已在之前写了次总结,本次主要针对论文中的数据集以.h5为TensorFlow的输入格式进行解释,记录如何将制作H5文件,以提供给TensorFlow,PyTorch框架中进行训练。首先,Pointnet一文中针对三个不同的任务使用到了三个数据集,分别为:点云分类(3D Object Classification)——ModelNet40,下载命令在...

2020-04-09 21:44:56 20459 49

原创 深度可分离卷积 Depthwise Seperable Convolution

前言在原始图像卷积网络的基础上,经过不断的改进和优化,出现了如分组卷积(Group convolution)、空洞卷积(Dilated convolution 或 À trous),深度可分离卷积(Depthwise Seperable Convolution)等各式各样的卷积改进形式。Depthwise(DW)卷积与Pointwise(PW)卷积,合起来被称作深度可分离卷积,是首先由Goog...

2020-03-27 05:19:45 9088

原创 CNN全连接层和卷积层的转化

深度学习网络中很多全连接的实现的部分实际上是使用了较小卷积核的卷积方式,CS231n对于这部分的内容有比较详细地讲解,我会结合自己的理解进行整理。先来看下CS231n中的内容:把全连接层转化成卷积层全连接层和卷积层之间不同在于:卷积核中的权值每次滑动计算时只是局部连接,且在卷积列中的神经元共享参数——计算局部信息,而全连接层神经元的权值与所有输入相连——计算全局信息。但二者都是采用的矩阵的点...

2020-03-26 22:33:35 7131

原创 Pointnet网络结构与代码解读

Pointnet网络个人笔记Pointnet开创性地将深度学习直接用于三维点云任务。由于点云数据的无序性,无法直接对原始点云使用卷积等操作。Pointnet提出对称函数来解决点的无序性问题,设计了能够进行分类和分割任务的网络结构,本文结合源码与个人的理解对于T-net网络和对称函数进行分析。点的无序性针对点的无序性问题实际上是文章提出了三个方案:对于无序点集进行排序(Pointcnn...

2020-03-18 18:31:41 22859 13

原创 2023-一种无监督目标检测和实例分割方法【Cut and Learn for Unsupervised Object Detection and Instance Segmentation】

与之前的工作相比,CutLER更简单,兼容不同的检测架构,并检测多个对象。利用自监督模型的特性在没有监督的情况下“发现”目标,并将其放大以训练没有任何标签的最先进的检测模型。CutLER 首先使用作者提出的 MaskCut 方法为图像中的多个对象生成粗蒙版mask,然后使用设计的鲁棒损失函数学习这些掩模上的检测器。目标检测和分割依赖海量数据的标注,模型训练耗时最大的是数据采集和标注过程,无监督学习在目标检测和分割中的应用较少。

2023-01-29 16:56:50 2753 2

原创 Ubuntu中安装钉钉无法输入中文解决记录

1. Ubuntu(18.04及其以上版本): 下载安装下载链接下载到本地后,使用dpkg命令安装sudo dpkg -i com.alibabainc.dingtalk_1.3.0.20214_amd64.deb钉钉卸载方法sudo dpkg -r com.alibabainc.dingtalksudo dpkg -P com.alibabainc.dingtalk2.针对ubuntu安装后出现无法进行中文输入的情况原因: 钉钉的Elevator.sh指定了是用fcitx的,可以直接修

2022-03-16 16:25:33 2108

原创 CaDDN模型理解

基于摄像机图像进行3D视觉任务的方法已经有了很多不错的工作。本文中的CaDDN网络(Categotical Depth Distribution Network),通过为每个像素预测出深度分布,将图像特征(2D特征)投影到3D空间中适当的深度区间。然后使用鸟瞰图(BEV)投影和单级检测器产生最终输出检测结果,评测效果提升明显。CaDDN PaperCaDDN 源码CaDDN模型理解单目3D检测通常会生成中间的特征表示形式,主要可以划分为以下三类:直接法:结合2D图像平面和3D空间的几何关系

2021-12-21 14:37:28 3378 7

原创 C++标准容器

C++ 里的容器很多,但可以按照不同的标准进行分类,常见的一种分类是依据元素的访问方式,分成顺序容器、有序容器和无序容器三大类别。1. 容器的基本特征容器就是对数据结构的抽象和封装,即能够“容纳”“存放”元素的一些数据结构。C++ 标准库里的容器帮助我们实现了最基本和最经典的数据结构,且容器的性能和优化水平已经非常完善,这一块不需要自己造轮子。容器的基本特性:保存元素采用的是“值”(value)语义,容器里存储的是元素的拷贝、副本,而不是引用。关于拷贝操作容器操作元素的很大一块成本就是值的拷贝,

2020-06-26 05:25:53 4009

原创 GNN的部分理论补充-03

本部分是理论支撑关于不动点定理参考知乎不动点:函数的不动点或定点指的是被这个函数映射到其自身的一个点,即ξ=f(ξ)\xi=f(\xi)ξ=f(ξ)。压缩映射:设fff在区间[a,b][a,b][a,b]上定义,f([a,b])⊂[a,b]f([a, b]) \subset[a, b]f([a,b])⊂[a,b],并存在一个常数kkk,满足0<k<10<k<10<k<1,使得对一切x,y∈[a,b]x, y \in[a, b]x,y∈[a,b]都成立不等式∣f

2020-06-21 04:21:58 3392

原创 PyTorch自动计算梯度

在PyTorch中,torch.Tensor类是存储和变换数据的重要工具,相比于Numpy,Tensor提供GPU计算和自动求梯度等更多功能,在深度学习中,我们经常需要对函数求梯度(gradient)。PyTorch提供的autograd包能够根据输入和前向传播过程自动构建计算图,并执行反向传播。本篇将介绍和总结如何使用autograd包来进行自动求梯度的有关操作。1. 概念Tensor是这个pytorch的自动求导部分的核心类,如果将其属性.requires_grad=True,它将开始追踪(trac

2020-06-21 00:30:54 5374

原创 PyTorch中的clone(),detach()及相关扩展

clone() 与 detach() 对比Torch 为了提高速度,向量或是矩阵的赋值是指向同一内存的,这不同于 Matlab。如果需要保存旧的tensor即需要开辟新的存储地址而不是引用,可以用 clone() 进行深拷贝,首先我们来打印出来clone()操作后的数据类型定义变化:(1). 简单打印类型import torcha = torch.tensor(1.0, requires_grad=True)b = a.clone()c = a.detach()a.data *= 3b

2020-06-20 19:38:25 35094 9

原创 PyTorch中的拷贝和就地操作总结

PyTroch中我们经常使用到Numpy进行数据的处理,然后再转为Tensor,但是关系到数据的更改时我们要注意方法是否是共享地址,这关系到整个网络的更新。In-place操作pytorch中原地操作的后缀为_,如.add_()或.scatter_(),就地操作是直接更改给定Tensor的内容而不进行复制的操作,即不会为变量分配新的内存。Python操作类似+=或*=也是就地操作。(我加了我自己~)为什么in-place操作可以在处理高维数据时可以帮助减少内存使用呢,下面使用一个例子进行说明,定义以下

2020-06-16 06:05:30 11313 4

原创 NLP模型小结

NLP 领域发展的三个主要阶段1.Word Embedding• Word2Vec• GloVe2.使用RNN及改进• LSTM/GRU• Seq2Seq• Attention/Self-Attention3.语义 Word Embedding• ELMo• OpenAI GPT• BERT深度迁移学习的目的解决 Word Embedding 不足充分利用无标注的数据能够在NLP任务中也用上更深的模型设计模型从无标注数据中学习到复杂的上下文表示成为主要方向。..

2020-06-15 05:44:24 10204

原创 PyTorch模块方法速查整理

Notes: PyTorch 常用的 modules 和 functions 快速查询1. Tensor Operations [Docs]torch├── (Tensor)│ ├── view(*shape) # e.g. x.view(-1, 3, 12) │ │ ## -1 automatically filled│ └── item() # get if Tensor is a scalar│├.

2020-06-13 17:45:08 919

原创 GNN图神经网络详述-02

本文作为第2部分,主要根据原始论文介绍几篇基础的工作,主要包括GNN,GCN及变体,DCNN,Tree-LSTM,包括模型的详解和模型训练,以及模型评价。1. The Graph Neural Network Model论文:2009 -《The Graph Neural Network Model 》这篇论文是第一个提出Graph Neural Network模型的论文,它将神经网络使用在图结构数据上,并细述了神经网络模型了结构组成、计算方法、优化算法、流程实现等等。论文后面还对模型的复杂度进行

2020-05-27 06:25:19 10677 1

原创 GNN图神经网络详述-01

最近的有GNN学习需要,但这部分的资料整理还不算太多。本篇主要是作为知识梳理,主要参考综述性论文:Graph Neural Networks: A Review of Methods and Applications,在此基础上结合理解进行翻译和补充,首先想搞清楚目前的发展状况和一些主要的研究方向。注:下文中出现的所有名词图的说法即为Graph,在此不讨论Graph与Network的区别。个人理解图是数学上提出的概念,网络是一种特殊的图,图由其邻接矩阵中包含的结构信息定义,网络可能在其顶点具有任意数量的

2020-05-27 05:19:25 9954

原创 机器学习模型评价指标整理

最近对这几个指标最近又有点生疏了,整理个笔记方便查看:分类/回归问题评估指标:分类问题回归问题准确率 – AccuracyMSE(均方误差)精确率(查准率)- PrecisionMAE (平均绝对误差)召回率(查全率)- Recall均方根误差(RMSE)F1分数R方 (R Squared)ROC曲线——AUC曲线——混淆矩阵...

2020-04-24 06:30:09 2188

原创 斯坦福大学AI系列课程传送门

美国计算机学科四大名校:加州大学伯克利分校(UC Berkeley)麻省理工学院(MIT)斯坦福大学(Stanford)卡耐基梅隆大学(CMU)。最近在学习斯坦福的机器学习和深度学习相关课程,在此留个课程传送门。1. 人工智能人工智能介绍:cs121: Introduction to Artificial Intelligence人工智能:原理与技术:cs221: Artif...

2020-04-12 20:27:10 802

原创 GNN-图神经网络基础内容概述

前言过去的十多年中,神经网络在图像和文本等结构化数据中已经表现的十分出色。CNN,RNN,自编码器(Autoencoders)等很多流行的模型在以矩阵或向量作为输入的结构形式数据上都能很好地工作,我称这些结构化的数据为表格数据。而这些模型在非结构化数据上的表现怎样呢?比如最近大家在研究中频繁碰到的图结构数据,如果不将这些非结构化的图数据经过复杂的转换变为表格格式的话,使用传统的方法基本无从下手,...

2020-04-12 06:37:44 16646

原创 python使用seaborn和matplotlib绘图介绍

最近有些朋友做毕设时寻求绘图帮助,但又说不清楚自己的要求,写个博客简单介绍一下python中做分析图表常用的seaborn与matplotlib这两个功能强大库,如果你还没学会强大的matlab制作数据图,恰巧又想学或者懂些python使用,那这两个库可能会让你在短时间内得到满意的图,因为官方给出的演示文档实在是丰富。1. Seaborn库Seaborn是一个使用Python制作统计图形的库,...

2020-04-03 03:52:34 4562 3

原创 点云的球面投影理解

前言球面投影或正视图投影是将3D点云数据表示为2D图像数据的一种方式,因此从本质上讲,它还充当降维方法。球形投影方法正越来越多地用于处理点云深度学习解决方案中。应用最广泛的领域是对点云中对象进行分类和分割任务,这个投影方法在多个工作中使用,例如:PointSeg,SqueezeSeg, SalsaNet等,以及在上一篇总结到的最新的语义分割网络3D-MiniNet也用到了球面投影。将点云表示为...

2020-04-02 06:27:19 16837 12

原创 3D-MiniNet实时LIDAR点云语义分割的深度学习方法整理

3D-MiniNet: 从点云中学习2D表示以实现快速有效的3D LIDAR语义分割西班牙Zaragoza大学的研究人员提出的最新3D点云语义分割的深度学习方法,提出新的滑动框搜索球形投影后的“像素点”,使用改进的MiniNetV2发布的两种网络设置在SemanticKITTI和KITTI数据集上刷新了成绩,成为新的SoTA。源码可能会在四月份开源,作者提到实现部分将会参照RangeNet++和...

2020-04-01 22:15:47 4305 1

原创 PyTorch迁移学习入门——VGG16 图像分类

前言迁移学习指的是保存已有问题的解决模型,并将其利用在其他不同但相关问题上。 比如说,用来辨识汽车的知识也可以被用来提升识别卡车的能力。很多情况下迁移学习能够简化我构建机器学习和深度学习模型,降低模型构建的难度,甚至取得不错的结果。本文将针对一个小的图片数据集,使用PyTorch进行迁移学习演示,包括如何使用预训练模型,并将结果自己搭建的卷积神经网络模型进行性能比较。预训练模型预训练模型是...

2020-03-31 06:00:48 10072 12

原创 结合代码理解Pointnet++网络结构

Pointnet++个人笔记前言Pointnet提取的全局特征能够很好地完成分类任务,由于网络将所有的点最大池化为了一个全局特征,因此局部点与点之间的联系并没有被网络学习到,导致网络的输出缺乏点云的局部结构特征,因此PointNet对于场景的分割效果十分一般。在点云分类和物体的Part Segmentation中,这样的问题可以通过中心化物体的坐标轴部分地解决,但在场景分割中很难去解决。原文...

2020-03-26 05:38:34 14862 4

原创 PyTorch1.4.0-torchvision参考(一)

torchvision参考简介对于使用pytorch进行CV深度学习而言,torchvision工具包确实很香,可以很方便的进行模型搭建或迁移学习的工作,还支持对视频的操作。Pytorch官方文档做了相当多的工作,对于这一部分的实例演示也很丰富,如果你恰巧学会如何正常使用google云盘,并且能够正常打开colab的话,那还可以更香地体验notebook形式提供的所有用例。PyTorch1....

2020-03-23 07:22:09 9440

原创 ROS基础学习笔记1

1.CMakeLists.txt规定了catkin编译的规则例如:源文件,依赖项,目标文件,会总动生成命令模板2.Package.xml定义了包的属性生成包括:包名,版本号,作者,依赖属性的模板常用的包管理指令:rospack#查找某个pkg的地址$ rospack find <package_name>#列出本地所有的pkg$ rospack list...

2020-03-18 18:19:21 242

原创 Transformer简要介绍

本篇整理 Transformer 架构,及在 Transformer 基础上衍生出来的 BERT 模型,最后给出相应的应用案例。1.Transformer的架构Transformer 网络架构架构由 Ashish Vaswani 等人在 **[Attention Is All You Need]**一文中提出,并用于机器翻译任务,和以往网络架构有所区别的是,该网络架构中,编码器和解码器没...

2020-03-07 20:22:41 3055

原创 词嵌入方法

引言对于自然语言处理任务,我们不能直接使用纯文本字符串作为输出,而是需要将文本字符转化为连续值的向量。词嵌入的主要思想是将文本转换为较低维度空间的矢量表示。对于这种转化后的向量有两个重要的要求:较低维度空间:尽量降低编码词向量产生的稀疏性。保证上下文相似性:为了使语言模型更好的预测文本的含义。总的来说,词嵌入就是一种**从文本语料库构建低维向量表示的方法,可以保留单词的上下文相似性。...

2020-03-07 19:57:28 2354

原创 BERT简要介绍

BERT(Bidirectional Encoder Representation from Transformers) 网络架构由 Jacob Devlin 等人提出用于预训练,学习在给定上下文下给出词的 Embedding 表示。BERT 采用了 Transformer 架构的编码器部分用于学习词在给定上下文下词的 Embedding 表示。考虑到语言模型任务为从左往右或从右往左预测下一个词...

2020-03-07 19:53:20 1770

原创 Java的内存划分

Java的内存需要划分为五个部分:1. 栈(Stack):存放的都是方法中的局部变量,方法的运行一定在栈中;方法的参数,或者是方法{}内部的变量;2. 堆(Heap):凡是new 出来的东西都在堆中;堆内存里存放的东西都有一个地址值:16进制堆内存中的数据都有默认值,规则:如果是整数 默认为0;如果是浮点数 默认为0.0;如果是字符 默认为‘\u000’;如果是...

2019-11-05 22:07:42 192

原创 Python如何高效使用位运算符

Python位运算符按位运算符是把数字看作二进制来进行计算的。Python中的按位运算法则如下:变量 a 为 60,b 为 13,二进制格式如下:a = 0011 1100;b = 0000 1101;运算符描述实例&按位与运算符:参与运算的两个值,如果两个相应位都为1,则该位的结果为1,否则为0(a & b) 输出结果 12 ,二进制解释:...

2019-11-02 20:28:42 751

原创 语义分割最新指南2019版

之前出现的深度学习语义分割指南2017版(A 2017 Guide to Semantic Segmentation with Deep Learning ),作者总结了当年各个具有代表性的语义分割算法与相关贡献。今年Namespace Africa 数据科学家Derrick Mwiti 对该领域的再一次梳理(原文链接),希望对大家有帮助。语义分割指的是将图像中的每一个像素关联到一个类别标签上...

2019-10-10 02:42:08 13857

原创 HMM、MEMM、CRF模型的比较

一,HMMHMM模型中2个假设:输出观测值XiX_iXi​之间相互独立;齐次一阶Markov,即状态的转移过程中当前状态只与前一状态有关。二、MEMMMEMM模型打破了观察值之间相互独立产生的问题,但是由于状态之间的假设理论,使得该模型存在 标注偏置问题(label bias problem)。三、CRF(Conditional Random Field)...

2019-10-09 02:31:16 1107

原创 VMware中Ubuntu系统网络无法连接

VMware中Ubuntu系统网络无法连接一般在VMware虚拟机设置中安装的ubuntu系统采用两种链接网络的模式:桥接模式,ubuntu单独想有一个物理ip,也就是说外部主机和Ubuntu分别拥有自己的IP;NAT模式,Ubuntu系统与外部宿主机共享ip,只要外部宿主机可以上网,虚拟机就可以上网。当外部主机可以上网时,是NAT模式,但Ubuntu仍然不能上网:尝试以下两...

2019-09-24 06:34:27 13600 2

原创 关于机器学习特征选择的方法总结

机器学习特征选择的方法总结1.特征选择的重要性随着深度学习的发展, 大大缩减了特征提取和设计的任务。 不过, 特征工程依然是各种机器学习应用领域的重要组成部分。其中对于特征选择(排序)的研究对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能:1.减少特征数量、降维,...

2019-09-12 15:28:33 3688

翻译 目标检测 3—— 人脸检测

笔记来源:DeepLearning-500-questions上次学习了目标检测的基本概念 Two Stage和 One Stage 算法:1.目标检测Two Stage2.目标检测One Stage4 人脸检测在目标检测领域可以划分为了人脸检测与通用目标检测,往往人脸这方面会有专门的算法(包括人脸检测、人脸识别、人脸其他属性的识别等等),并且和通用目标检测(识别)会有一定的差别,着主要...

2019-08-12 13:54:05 7456

翻译 目标检测 2—— One Stage目标检测算法

笔记来源:DeepLearning-500-questions上次学习了目标检测的基本概念和一些经典的Two Stage算法:1.目标检测Two Stage3. One Stage目标检测算法我们将对单次目标检测器(包括SSD系列和YOLO系列等算法)进行综述。我们将分析FPN以理解多尺度特征图如何提高准确率,特别是小目标的检测,其在单次检测器中的检测效果通常很差。然后我们将分析Focal ...

2019-08-12 12:39:42 8549

翻译 目标检测 1——基本概念和Two Stage网络模型

笔记来源:DeepLearning-500-questions1.基本概念1.1 什么是目标检测?​ 目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标(物体),确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具有挑战性的问题。​ 计算机视觉中关于图像识别...

2019-08-09 17:28:46 3876

原创 调用百度Ai飞桨平台人流量估计API【亲测可用】

最近搞了下高密度人群数量估计,参考了很多资料,首先是想自己动手搭建一个CSRnet进行训练,这个网络的代码实现可以参照论文和代码如下,有兴趣的可以动手自己做:CVPR 2018 Paper : https://arxiv.org/abs/1802.10062Keras实现:https://github.com/DiaoXY/CSRnet官方Pytorch实现:https://githu...

2019-08-06 18:09:49 2495

原创 批归一化(Batch Normalization)详细解释笔记

批归一化(Batch Normalization)的详细解释​ 以前在神经网络训练中,只是对输入层数据进行归一化处理,却没有在中间层进行归一化处理。要知道,虽然我们对输入数据进行了归一化处理,但是输入数据经过矩阵乘法以及非线性运算之后,其数据分布很可能被改变,而随着深度网络的多层运算之后,数据分布的变化将越来越大。如果我们能在网络的中间也进行归一化处理,是否对网络的训练起到改进作用呢?答案是肯定...

2019-07-31 11:14:40 4616

紧急车辆识别emergency_vs_non-emergency_dataset

内含两千多张,224x224彩色图像,用于训练一个紧急车辆的识别网络,我会利用该数据集,做一个Pytorch的预训练模型多重CNN实现模型的对比实验。

2020-03-30

ATT人脸识别数据

由剑桥大学AT&T实验室创建,包含40人共400张面部图像,部分志愿者的图像包括了姿态,表情和面部饰物的变化.该人脸库在人脸识别研究的早期经常被人们采用,但由于变化模式较少,多数系统的识别率均可以达到90%以上,因此进一步利用的价值已经不大.

2018-10-14

协方差矩阵

通过探索线性变换与所得数据协方差之间的关系提供协方差矩阵一个直观的几何解释。大部分教科书基于协方差矩阵的概念解释数据的形状。相反,我们采取一个反向的方法,根据数据的形状来解释协方差矩阵的概念。在《为什么样本方差除以N-1?》的文章中,我们会讨论方差的概念,并提供了众所周知的估算样本方差公式的推导和证明。

2018-10-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除