自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Mars_WH的专栏

一个自我修炼、再修炼的嵌入式AI码农-DaPalm.com

  • 博客(80)
  • 收藏
  • 关注

原创 动态调用动态库函数的两种方法

动态调用动态库函数的两种方法#include <dlfcn.h>//dllopenvoid *dllhandle_;char *dllerror_;typedef HI_S32 (*HI_RUNTIME_Connector_Compute)(HI_RUNTIME_SRC_BLOB_ARRAY_S* pstConnectorSrc, HI_RUNTIME_DST_BLOB_ARRAY_S* pstConnectorDst, HI_U64 u64SrcId, HI_VOID* pParam

2021-02-04 14:33:53 1207

原创 Receptive Field Block Net for Accurate and Fast Object Detection CVPR2017论文翻译

1.绪论部分:当前顶级目标检测器依赖于非常深的CNN主干网络,例如ResNet-101和Inception,优点是它们具有强大的特征表现能力,但是耗时严重。相反地,一些基于轻量级模型的检测器满足实时处理,但是精度是诟病。在RFBNet这篇论文中,主要想利用一些技巧使用轻量级模型达到速度和精度并举的检测器。灵感来自人类视觉的感受野结构Receptive Fields (RFs) ,提出了新奇的RF block(RFB)模块,来验证感受野尺寸和方向性的对提高有鉴别鲁棒特征的关系。RFBNet是以主干网络(b

2020-11-12 09:31:15 337

转载 目标检测中的不平衡问题及解决方案论文汇总

转载自https://github.com/kemaloksuz/ObjectDetectionImbalanceA Repository of the Papers Addressing Imbalance Problems in Object DetectionThis repository provides an up-to-date the list of studies addres...

2020-01-28 19:12:20 1084

原创 TVM tutorials代码学习-from_darknet.py

TVM tutorials代码学习-from_darknet.py准备环境详解小结准备环境要运行tvm源码下tutorials/frontend/from_darknet.py代码需要额外安装cffi和cv2包 pip install cffi pip install opencv-python详解#导入包import numpy as np #计算库import matpl...

2019-10-05 10:49:36 975 1

转载 嵌入式和移动深度学习研究

转载自:https://github.com/EMDL/awesome-emdl文章目录EMDLPapersSurveyModelSystemQuantizationPruningApproximationCharacterizationLibrariesInference FrameworkOptimization ToolsResearch DemosWebTutorialsGeneralN...

2019-08-30 16:52:22 1599

原创 VPM 行人局部特征可见感知学习ReID

文章目录简介理论实验总结paper: 《Perceive Where to Focus: Learning Visibility-aware Part-level Features for Partial Person Re-identification》arxiv: https://arxiv.org/pdf/1904.00537.pdfgithub: 暂无简介理论实验可见...

2019-08-22 09:11:25 509

原创 ScarfNet 多尺度融合与特征重分配增强目标检测 论文简记

简介首先paper提出bottom-level特征限制目标检测性能,提出2点来解决问题:使用双向LSTM融合上下文多尺度特征channel-wise 注意力模型重分配每个尺度的特征模型ScarfNet结构网络结构,主体结构借鉴RetinaNet中的FPN,关键是加入尺度结合网络ScNet和注意力重分配网络ArNet。ScNet:利用双向LSTM融合四个不同尺度分支的特征,这样做...

2019-08-07 08:41:53 517

翻译 使用MXNet实现生产级神经网络模型量化推理

文章目录使用MXNet实现生产级神经网络模型量化推理介绍模型量化加速部署你的模型准备校准部署INT8推理检测可视化性能使用MXNet实现生产级神经网络模型量化推理介绍在深度学习中,推理用于部署预训练的神经网络模型来执行图像分类,对象检测和其他预测任务。在现实世界中,尤其是企业中,推理非常重要,因为它是分析流程的一个阶段,根据生产级数据向终端用户提供有价值的结果。来自终端用户的大量推理请求不断...

2019-06-17 22:49:38 2237 6

翻译 TVM Compiler中文教程:TVM为NVIDIA GPU自动调优卷积网络

文章目录TVM为NVIDIA GPU自动调优卷积网络加载依赖库定义网络设置调优选项开始调优使用多个设备扩展测量范围TVM为NVIDIA GPU自动调优卷积网络针对特定设备和工作负载进行自动调优对于获得最佳性能至关重要。这篇教程是关于TVM如何为NVIDIA GPU调优整个卷积网络。TVM中NVIDIA GPU的算子实现是以模板template形式编写的。模板有许多可调旋钮knobs(平铺ti...

2019-06-16 19:46:15 3183 2

翻译 TVM Compiler中文教程:TVM使用autotvm调优NVIDIA GPU上的高性能卷积

文章目录TVM使用autotvm调优NVIDIA GPU上的高性能卷积加载依赖库步骤一:定义搜索空间步骤二:搜索空间TVM使用autotvm调优NVIDIA GPU上的高性能卷积这是为NVIDIA GPU编写高性能可调模板的高级教程。通过在此模板上运行自动调优器,在许多情况下,我们可以胜过供应商提供的CuDNN库。加载依赖库安装步骤与TVM Compiler中文教程:使用TVM编写可调模板...

2019-06-15 10:34:25 6231 5

翻译 TVM Compiler中文教程:使用TVM编写可调模板和使用自动调优器

文章目录使用TVM编写可调模板和使用自动调优器加载依赖库第一步:定义搜索空间参数化调度使用更好的空间定义API第二步:搜索空间在TVM中使用自动调优器开始调优使用TVM编写可调模板和使用自动调优器这是TVM中auto-tuning模块的入门教程。auto-tuning分两个步骤:第一步定义搜索空间;第二步是运行搜索算法来探索这个空间。在本教程中,你可以了解如何在TVM中执行这两个步骤。下面通...

2019-06-14 23:26:26 4794 1

翻译 TVM Compiler中文教程:TVM如何优化CPU GEMM(矩阵乘法)

文章目录TVM如何优化CPU GEMM(矩阵乘法)准备和基线Opt1:分块Opt2:向量化Opt3:循环排布permuteOpt4:数组打包Opt5:为块写cacheOpt6:并行TVM如何优化CPU GEMM(矩阵乘法)TVM提供抽象接口,允许用户分别描述算法和算法的实施组织(所谓的调度Schedule)。通常,写高性能调度的算法时,会破坏算法的可读性和模块性。此外,尝试各种看似有用的调度是...

2019-06-13 23:06:42 4818 2

翻译 TVM Compiler中文教程:TVM如何生成优化GPU卷积

文章目录TVM如何优化GPU卷积准备和算法内存层次结构分块虚拟线程分裂并发数据获取生成CUDA内核TVM如何优化GPU卷积本教程,我们将演示如何在TVM中编写高性能卷积实现。我们使用方形尺寸的输入张量和滤波器作为示例,并假设卷积的输入具有大批量。在此示例中,我们使用不同的布局来存储数据,以实现更好的数据局部性。缓冲区布局为HWCN,代表高度,宽度,通道,批次。准备和算法我们使用固定尺寸14...

2019-06-12 22:51:02 3601 2

翻译 TVM Compiler中文教程:TVM使用张量化Tensorize利用硬件内联函数

文章目录TVM使用Tensorize利用硬件内联函数定义矩阵乘法调度矩阵乘法定义GEMV张量内联函数TVM使用Tensorize利用硬件内联函数这篇教程是关于在TVM中如何执行张量化的介绍。通过使用调度原语tensorize,人们可以用相应的内联函数替换计算单元,从而可以轻松利用手工制作的微内核函数,和扩展TVM来支持新的硬件架构。本教程的目的是展示tensorize的功能和用法,而不是提...

2019-06-11 13:07:16 3633

翻译 TVM Compiler中文教程:TVM调度原语(Schedule Primitives)

文章目录TVM调度原语(Schedule Primitives)分裂split平铺tileTVM调度原语(Schedule Primitives)TVM是用于高效内核代码构建的版本领域专用语言(Domain-Specialed-Language,DSL) 。这篇教程,我们将展示通过TVM提供的各种原语怎么去调度计算。from __future__ import absolute_impor...

2019-06-10 13:03:22 7783 1

翻译 TVM Compiler中文教程:TVM使用内联和数学函数

文章目录TVM使用内联和数学函数直接声明外部数学函数调用统一内联函数调用内部Lowering规则总结TVM使用内联和数学函数TVM支持基础算术运算操作,但是在很多情况下我们需要更复杂的內建函数。例如exp指数函数。这些內建函数取决于目标系统,在不同的平台可能有不同的名字。这个教程中,我们将学习调用目标特定的內建函数,和怎么能够通过TVM内联API统一接口。from __future__ i...

2019-06-09 22:06:10 1890

翻译 TVM Compiler中文教程:TVM中Compute和Reduction如何使用元组输入

Compute和Reduction使用元组输入我们通常希望在单个循环内计算具有相同维度的多个输出,或者,执行涉及argmax等多个值的缩减。在这篇教程,我们将介绍在TVM中元组输入。from __future__ import absolute_import, print_functionimport tvmimport numpy as npbatch计算对于具有相同维度的运算...

2019-06-07 10:51:45 1671

翻译 TVM Compiler中文教程:TVM调用外部张量函数的三种方法

外部张量函数虽然TVM支持透明代码生成,但有时将手动编写的代码合并到管道中也很有帮助。例如,我们想去为部分卷积和使用cuDNN和定义其他阶段。TVM原生支持黑盒函数调用。TVM支持兼容DLPack的所有张量函数。这意味着我们可以使用POD类型(pointer,int,float)或指向DLTensor的指针作为参数调用任何函数。from __future__ import absolute_...

2019-06-04 21:53:12 1566

翻译 TVM Compiler中文教程:TVM.Relay使用外部库

文章目录TVM.Relay中使用外部库创建一个简单的网络使用cuda后端构建和运行卷积层使用cuDNN实现验证结果结论TVM.Relay中使用外部库这篇教程介绍怎么在Relay中使用cuDNN、cuBlas这样的外部库。Relay在内部使用TVM生成特定目标的代码。例如,使用cuda作为后端,TVM为用户提供的网络生成所有层的cuda kernel代码。但是有时,将设备厂商提供的外部库合并到...

2019-06-03 22:21:21 3534 1

翻译 TVM Compiler中文教程:TVM部署SSD模型

部署SSD模型我们使用GluonCV预训练SSD模型和转换成Relay IR中间表示import tvmfrom matplotlib import pyplot as pltfrom tvm.relay.testing.config import ctx_listfrom tvm import relayfrom tvm.contrib import graph_runtimef...

2019-06-03 09:46:22 2005 3

翻译 TVM Compiler中文教程:TVM编译ONNX模型并执行

编译ONNX模型下面描述使用Relay如何部署ONNX模型:#安装onnx,https://github.com/onnx/onnxpip install onnx --user首先导入所需要的python包:import onnx import numpy as npimport tvmimport tvm.relay as relayfrom tvm.contrib.dow...

2019-06-03 09:45:24 3444

原创 智能AI计算芯片对比

下面是本人接触到的AI芯片,主要涉及华为、比特大陆-算丰、英伟达。其他还有寒武纪、地平线、瑞芯微等没有接触过就不对比了。易开发性:比特大陆>英伟达>华为性能:华为>英伟达>比特大陆(性能不是很好对比,每家实现的算子性能有差异,不能单纯对比TOPS)算力内存带宽(GB/s)解码编码功耗备注昇腾31016TOPS INT8LPDDR4x...

2019-05-29 15:12:49 4812

原创 [剪枝]Channel Pruning for Accelerating Very Deep Neural Networks

[ICCV2017] Channel Pruning for Accelerating Very Deep Neural Networksarxiv:https://arxiv.org/abs/1707.06168github:https://github.com/yihui-he/channel-pruning序言最近在系统学习DL的相关理论知识,猛然看到无监督学习中关于“稀疏编码”...

2019-04-28 10:00:07 452

翻译 PocketFlow自定义模型和数据集

文章目录自定义模型要点概括数据输入管道网络定义执行脚本PocketFlow中训练网络自定义模型整合自定义模型需要实现一个ModelHelper类。ModelHelper包含数据输入管道和网络前向传播和损失函数的定义。使用自定义的ModelHelper,网络可以无限制的使用FullPrecLearner训练,或者使用其他如ChannelPrunedLearner和UniformQuantTFLe...

2019-04-08 12:04:30 1031 6

原创 PocketFlow ChannelPrunedLearner代码详解

文章目录PocketFlow框架安装cifar10数据集准备执行代码程序入口-`main.py`通道裁剪学习器-`channel_pruning/learner.py`模型封装器-`channel_pruning/model_wrapper.py`通道裁剪器-`channel_pruning/channel_pruner.py`下面代码不包括DDPG强化学习参数优化器和Distill蒸馏训练P...

2019-04-04 15:56:30 811 2

原创 Object Detection(目标检测神文)(二)

文章目录[CVPR2019] Region Proposal by Guided Anchoring[CVPR2019] Feature Selective Anchor-Free Module for Single-Shot Object Detection[CVPR2019] Region Proposal by Guided Anchoringintro: CUHK - SenseTi...

2019-03-22 09:49:31 11069 12

原创 [CVPR2019] Region Proposal by Guided Anchoring

文章目录GA-RPN近期更新

2019-03-21 11:28:12 743

原创 [CVPR2019]:Feature Selective Anchor-Free Module for Single-Shot Object Detection

文章目录近期更新

2019-03-21 11:26:05 539

原创 NLP发展大事件

前段时间看到一篇文章,忘了作者,当时就保留了一张NLP发展大事件的图片,在这里贴出来,如果有机会再行研究。数据集CNN/Daily MailChildren Book TestSQuAD 1.1TriviaQARACENarrativeQASQuAD 2.0HotpotQA算法Attentive ReaderStanford Attentive ReaderMatc...

2019-03-08 08:30:29 445

原创 车道线分割预研

文章目录分割的含义语义分割和实例分割车道线分割预研VPGNetSCNNMaskRCNNDeepLabv3+车道线方案经验总结总结分割的含义语义分割和实例分割mIOU_category,mIOU_class:两者的度量指标是不同的.前者是大的类别,而后者需要把每个目标都分割出来。通常前者大于后者车道线分割预研VPGNet框架:Caffe显存:813前向时间:15-18ms...

2019-03-06 11:53:45 1508 8

原创 [CVPR2019]Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

IoU和GIoU作为Loss的具体公式GIoU很容易理解,就多了一个两个BBox所占最大面积A1,与并集的区别在于多算了不属于BBox的一部分面积A2,就用A2除以A1,得到一个比例P1,paper中的意思是这个比例代表预测BBox与真实BBox的回归效果,效果也好比值越低,最后用传统的IoU减去P1得到GIoU。...

2019-03-01 16:50:19 2319

转载 程序员的自我进化:技术的广度与深度怎么权衡

原文:https://blog.csdn.net/qq_36330643/article/details/82820377作者:Soyoger工作2-3年了,如果你已经走在自己喜欢和感兴趣的技术路上,那么首先恭喜你了;如果你还在技术圈迷茫和困惑,也请保持微笑。无论你属于那种情况,对于绝大多数人来说,不妨停下脚步来看看,我们应该如何看待技术。我们都希望自己的技术既有广度又有深度,但事实上,鱼与...

2019-02-27 20:47:32 612

原创 ShuffleNetV2网络结构图及实现

具体实现参考GitHub:https://github.com/opconty/keras-shufflenetV2

2019-01-16 17:14:54 6165 2

原创 2018 新一代人工智能院士高峰论坛 总结文章

新一代人工智能院士高峰论坛」开幕,概览中国人工智能企业最新技术成果旷视科技首席科学家孙剑:如何打造云、端、芯上的视觉计算(含30张 PPT) | CCF-GAIR 2018阿里怎样做城市大脑?华先胜这样解读字节跳动马维英:人工智能赋能内容创作和交流 ...

2018-12-18 15:52:38 923

原创 Deep Compression/Acceleration(模型压缩加速总结)

模型压缩论文目录结构`structure`量化`quantization`Binarized Neural Networks: Training Deep Neural Networks with Weights and Activations Constrained to +1 or -1FINN: A Framework for Fast, Scalable Binarized Neural ...

2018-12-07 22:42:46 3218 3

原创 Pytorch YOLOv3 网络结构

github:https://github.com/talebolano/yolov3-network-slimmingPytorch YOLOv3 结构ModuleList((0): Sequential((conv_with_bn_0): Conv2d(3, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=F...

2018-12-07 17:59:06 995

原创 Rethinking the Smaller-Norm-Less-Informative Assumption in Channel Pruning of Convolution Layers论文翻译

重新思考卷积通道剪枝中的更小范数、更小信息量的假设摘要模型剪枝已成为一种可以提高深度学习的计算效率的有用技术,从而让深度学习模型在资源有限的场景中部署成为可能。相关工作中,广泛使用的实践假设:较小范数的参数或含较少信息的特征在推理中起着较小的作用。在本文中,我们提出了一种用于加速深度卷积神经网络(CNN)计算的通道剪枝技术,该技术并不严格依赖于这种假设。相反,它侧重于CNN的通道到通道计算图的...

2018-12-03 20:55:14 2957 5

原创 TensorRT 5 开发者手册 中文版 使用深度学习框架(三-6)

原创作品,转载时请务必以超链接形式标明文章原始出处: http://www.dapalm.com/?p=206,作者:大数据,怕了么?  本手册为TensorRT 4.0.1.6 GA版英文手册翻译而来,主要作为备忘所用,分享出来以供更多开发者使用。TensorRT Developer Guide手册一共分为四个章节,主要内容在第二、三章,看懂这两章,写代码够用了。第一章为TensorRT综述,...

2018-11-28 09:56:12 9322 11

原创 TensorRT 4 开发者手册 中文版 自定义层/混合精度校准/部署(三-5)

原创作品,转载时请务必以超链接形式标明文章原始出处: http://www.dapalm.com/?p=206,作者:大数据,怕了么?  本手册为TensorRT 4.0.1.6 GA版英文手册翻译而来,博主英文水平一般般,主要作为备忘所用,分享出来以供更多开发者使用。TensorRT Developer Guide手册一共分为四个章节,主要内容在第二、三章,看懂这两章,写代码够用了。第一章为...

2018-08-25 14:08:04 3886 6

转载 Object Detection(目标检测神文)

目标检测神文,非常全而且持续在更新。转发自:https://handong1587.github.io/deep_learning/2015/10/09/object-detection.html,如有侵权联系删除。Papers———————————————————————————————————-Deep Neural Networks for Object DetectionOv...

2018-08-21 14:25:28 67024 21

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除