自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AI数据工厂

Python应用、cv数据处理、论文笔记、深度学习、目标检测、语义分割相关知识点分享

  • 博客(177)
  • 资源 (8)
  • 收藏
  • 关注

原创 PeLK: 大卷积核强势回归,高达101 × 101,提出了外围卷积

PeLK:超大卷积核,高达101*101!

2024-04-27 14:45:42 1517

原创 RKNN:yolov8模型转换与板端推理流程

记录了“yolov8的torch模型转onnx再转rknn,并在瑞芯微RK3588上进行推理验证”的过程。

2024-04-27 14:35:54 1334

原创 ShuffleMixer:一个高效的图像超分辨率卷积网络

介绍了一篇关于轻量SR的论文——ShuffleMixer

2024-04-25 13:36:44 712

原创 RepViT:当MobileNet遇到ViT

近期,在资源受限的的移动设备上,轻量ViTs表现出了比CNNs更好的性能和更低的延迟。研究人员发现了轻量级vit和轻量级cnn之间的许多结构联系。然而,尚未充分检查它们之间的块结构、宏观和微观设计的显着架构差异。在这项研究中,我们从 ViT 的角度重新审视轻量级 CNN 的有效设计,并强调它们对移动设备的前景。具体来说,我们通过集成轻量级 ViT 的有效架构设计,逐步增强标准轻量级 CNN(即 MobileNetV3)的移动友好性。这最终得到了一系列新的纯轻量级cnn,即RepViT。

2024-04-24 10:00:04 863

原创 Python语法糖大全

Python语法糖大全,汇总了各种语法糖,可以作为一个查询手册。

2024-04-24 09:40:00 2208 1

原创 FSRCNN:加速超分辨率卷积神经网络,SRCNN的加速版

FSRCNN:改进版的SRCNN,速度更快、性能更高!

2024-04-23 09:17:03 774 3

原创 SRCNN:深度学习单图超分开山之作【附代码】

介绍了单图SR开山之作——SRCNN,并给出了网络结构的实现代码。

2024-04-23 09:16:39 1173

原创 Minio: 文件类型数据存储

另一种方式是,将这些文件以对象的方式存储到云服务器上,这样既没有丢失风险,也不必担心本地磁盘被撑爆,同时也方便给他人分享数据。我们这里提供了一种客户端实现,可以将文件或者对象上传到指定的服务器路径上,并根据指定的“bucket”进行查询与自动创建。在这里,我们利用了一个叫做Minio的对象存储方式,它可以提供安全、可靠、边界的存储及分享方式。:param bucket_names: 桶名称,用于存放数据的根目录。支持两种上传方式:文件形式、对象形式。:param secret_key: 密码。

2024-04-07 11:39:32 834

原创 MQTT:通过消息队列进行消息传递

简要介绍了一个利用消息队列进行算法结果上传的方法,并给出了Python代码实现。

2024-04-07 11:38:37 913

原创 NWPU-MOC:密集多类别目标计数,方法和benchmark

目标计数是CV领域的一个热门任务,其目的在于估计给定图像中的目标个数。然而,当前大多数方法都是针对单类别的,这对于需要同时对多种类别进行计数的场景来说就不适用了,尤其在航拍图中。为了解决这个问题,本文引入了一个多类别目标计数(MOC)任务,来估计在一个航拍图中不同类别目标(如车、建筑、船等)的个数。考虑到缺乏相关数据集,同时也构造了一个包含了3416个场景、1024*1024分辨率、14个精细标注类别的大型数据集——NWPU-MOC。

2024-03-22 10:06:53 688

原创 FcaNet:频率通道注意力,进阶版SE

注意力机制,尤其是通道注意力,在CV领域取得了巨大成功。大部分研究都集中在如何设计更高效的通道注意力机制,却忽略了一个基本问题,也即:他们都是使用全局平均池化(GAP)来作为预处理方法。尽管GAP十分简单高效,但他的捕获的信息也确实不足。对注意力进行重新思考,并从数学上证明了GAP就是频域特征分解的一个特例。基于此,作者将通道注意力机制的预处理泛化到了频域,并基于。2)DCT可以看做输入的加权和,上述DCT公式中的cos部分可以当做权重。在CNN中常用通道注意力来对不同通道的特征进行加权。

2024-03-22 10:05:07 1152

原创 YOLO-World初体验:Ultralytics版本,可直接上手,离线运行

YOLOv8官方新增了对YOLO-World的支持,本文利用其提供的模型及接口进行了体验。

2024-02-20 10:17:11 6654 23

原创 YOLO-World:实时开放词汇目标检测

本文通读了YOLO-World的论文,翻译了其关键内容。

2024-02-20 10:17:01 2130

原创 Objects365数据集下载与信息统计

介绍了Objects365数据集,并提供了百度网盘下载链接;同时,给出了数据集的统计信息。

2024-01-30 08:28:47 1333

原创 RTMO: 超越YOLO-pose的高性能、单阶段、多人姿态估计

提出的RTMO框架如下图所示:网络框架描述如下:输入图像经过backbone(CSPDarknet)后,最后三层feature map经过Hybrid Encoder得到16、32倍下采样的空间feature mapP4、P5,送入Heads;每个Head生成一个得分feature、一个坐标姿态feature,其中坐标姿态feature用于预测bbox、关键点坐标、关键点可见性。****强行插入一段*****:关于坐标分类,没做过的小伙伴可能有点懵,我们可以从SimCC这篇文章中的方法一窥其貌。

2023-12-14 17:14:20 1048

原创 Triton算法服务部署:初识与试用【Hello world】

介绍了Triton,并结合官方文档给出了一个Hello World级别的使用示例。

2023-12-13 09:47:45 276

原创 Flask基本用法:一个HelloWorld,搭建服务、发起请求

Flask是一个轻量的web服务框架,我们可以利用它快速搭建一个服务,对外提供接口,其他人可以轻松调用我们的服务。这对算法工程师来说比较关键,我们通常不擅长搞开发,这种框架十分适合将算法封装成服务的形式提供给其他人使用。更多介绍可从搜索引擎找到,这里不过多介绍。我们直接给出一个使用示例,相信大家看了后能快速掌握Flask的基本用法。

2023-12-13 09:47:20 1230

原创 gRPC基本用法:以人脸识别为例,搭建一个简单的gRPC服务

内含一个完整的人脸识别gRPC服务的github代码;文章以人脸识别为例,提供了一个gRPC的基本用法

2023-12-11 08:38:54 1474

原创 【媒体开发】利用FFMPEG进行推拉流

给出了一种利用FFMPEG进行推拉流的方法与使用步骤

2023-12-11 08:38:31 1274

原创 T-Rex:检测一切 | 基于视觉提示的开集检测器,检测并计数

T-Rex,一种开集检测一切、计数一切、实例分割一切的模型,主页可以试玩。

2023-11-29 11:38:03 1868

原创 基于点之间距离的多目标跟踪

目标跟踪是计算机视觉领域一种常用的算法,用于将前后帧中的同一个目标关联起来,从而可以针对某一个特定目标进行分析,如对状态进行投票平滑获取更为稳健的结果。然而,目前流行的跟踪算法大多是基于检测的bbox之间的IOU来匹配的,这对于某些小目标或者点的检测,IOU通常不是一个好的选择,因为目标太小,很容易使得相邻两帧之间的IOU为0。为了解决这个问题,本文提出了一种基于点之间距离的跟踪方法:将目标建模为一个点,通过计算前后帧点之间的距离,利用匈牙利匹配来进行跟踪。

2023-11-22 11:15:42 487

原创 MODNet:基于目标分解的实时trimap-free肖像抠图

本文提出了一种轻量级、trimap-free的目标分解网络(MODNet),关键思想是通过显式约束同时优化一系列子目标。此外,还提出了一个高效的 空洞空间金字塔池 (e-ASPP) 模块来融合多尺度特征以进行语义估计,一种自监督子目标一致性(SOC)策略,使MODNet适应真实世界的数据,以解决无trimap方法常见的域转移问题

2023-11-08 13:42:08 743

原创 Python中 lambda 的妙用

Python中使用lambda高效处理一些问题的案例

2023-11-08 13:41:17 154

原创 Deep Image Matting:深度学习Matting开山之作

在此之前的Matting方法要么是用传统方法,要么是传统+深度学习的组合,他们都难以达到理想效果。因此,本文提出了一个利用trimap来作为辅助输入,并完全使用深度学习方法来进行Matting的方法,这开创了trimap-based Deep Learning Matting的先河。

2023-11-03 14:19:38 356

原创 PP-Matting:trimap free的高精度自然图像抠图

介绍了PP-Matting,一种trimap-free的高精度自然图像抠图方法,通过SCB和HRDB分支分别获取语义上下文和细节特征,从而获取高精度的Matting结果。

2023-11-03 10:57:42 769

原创 几种常见的Matting数据集【附度盘下载链接】

本文整理了多种Matting数据集,可一键下载~

2023-11-03 10:51:25 378

原创 YOLACT: 实时实例分割

one-stage实时实例分割网络——YOLACT,论文解读

2023-11-02 14:45:43 185

原创 一分钟了解:什么是Image Matting?

Image Matting是图像处理领域的一个基本任务,意为“图像背景抠出”或者“抠图”。这项任务在图像处理、影视制作领域广泛应用。比如,拍电影时常用的扣绿,就是演员在绿幕前面表演,后期再把人物抠出来放到一个新的背景上来表现各种惊险刺激的场景。用一个公式表示Matting就是:,其中F为前景,B为背景,α为透明度,可用0~1之间的小数表示。对于完全为前景的部分α就是1,对于完全为背景的部分α就是0,对于前景背景交界的部分,这些地方有前景但由有一定的透明度,这时α就是一个介于0~1之间的小数。

2023-11-02 14:43:56 1109

原创 AdaBins:使用自适应bins进行深度估计

本文主要解决了从单个RGB输入图像估计高质量密集深度图的问题。我们从一个baseline的encoder-decoder CNN结构出发,提出一个问题:信息的全局处理如何帮助提高整体深度估计?为此,我们提出了一种基于transformer的架构块,它将深度范围划分为多个 bin,而每个bin的中心值是根据每个图像自适应估计的,最终的深度值估计为 bin 中心的线性组合。我们将这种新的构造块称为AdaBins。我们的结果显示,在所有指标上,在几个流行的深度数据集上都比现有技术有了决定性的改进。

2023-10-30 17:29:24 370

原创 PP-MobileSeg: 探索移动设备上又快又准的语义分割模型

transformer在CV领域的成功之后,出现了很多在移动设备上使用它们的尝试性工作,但是这些工作在某些实际应用中的表现仍然不能令人满意。为了解决这个问题,本文提出PP-MobileSeg——一个在移动设备上达到SOTA的语义分割模型。包含了4个stage的StrideFormer backbone 由MV3块和SEA注意力模块构建,能够以最小的参数量提取丰富的语义信息与细节特征;AAM则首先通过语义特征集成投票过滤细节特征,然后将它们与语义特征相结合以增强语义信息;

2023-10-30 14:46:37 593

原创 C++ opencv:视频读取、变换颜色风格、保存

C++ opencv视频读写、图片风格变换

2023-08-08 17:04:02 582

原创 linux安装C++ opencv

在linux中安装C++版opencv

2023-08-08 10:27:34 2579

原创 一种人体属性识别的网络结构

人体属性识别,是一个典型的多标签分类场景。每个人体有多个标签,如年龄、性别、衣着颜色等,而每个属性又有多种类别,如年龄分儿童青年老人、性别分男女、颜色分红绿青蓝紫...本文提供了一个网络结构来执行这种任务。

2023-06-22 21:25:25 375

原创 使用双向投影直方图进行裂缝分类

本文提供了一种使用传统图像处理方法对裂缝种类进行分类的方法,并提供了代码、测试效果等内容。

2023-06-22 21:22:34 242

原创 判断一个mask是否近似直线

本文提供了一种判断物体是否近似直线的解决思路,以及对应的实现代码。

2023-06-22 21:21:36 122

原创 图像分块与合并

本文提供了一种将大图分块、将小图合并为大图的方法,并给出了实现代码。

2023-06-22 21:20:03 802 2

原创 利用OpenCV计算条形物体的长度

在图像处理中,我们可能会遇到求一个线条长度的场景,比如,现在有一条裂缝,需要求其长度,或者有一个长条形的零件需要知道其长度。本文利用OpenCV和skimage两个库,提供了一个解决方案。

2023-06-22 21:19:59 2381 10

原创 从duke-attribute数据集中提取性别

该数据集来自DukeMTMC-reID,并提供了属性标注,可以通过对标注文件进行解析获取其中所需的属性信息。本文提供了一个从duke-attribute数据集中提取性别属性的方法,同时也提供了该数据集的下载链接。

2023-06-20 10:11:26 104

原创 从wider_attribute数据集中提取性别

本文提供了一个从wider_attribute数据集中提取性别属性的方法;并提供了数据集的下载链接。

2023-06-20 10:11:09 138

原创 从parse27k数据集中提取性别

本文提供了一个从parse27k数据集中提取性别属性的方法。

2023-06-20 10:10:43 79

cifar10_cifar100合集.zip

python版本的cifar10/cifar100合集,可下载后解压到自定义路径下使用。原下载地址:http://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz,http://www.cs.toronto.edu/~kriz/cifar-100-python.tar.gz

2020-08-14

【全国行政区划对应表】administrative_division_code.sql

身份证各个字段对应的省市区等行政划分: CREATE TABLE `administrative_division_code` ( `sno` int(11) NOT NULL, `province_id` int(2) NOT NULL COMMENT '省级代码(前两位)', `city_id` int(4) NOT NULL COMMENT '地市级代码(前4位)', `district_id` int(6) NOT NULL COMMENT '县区级代码(前6位)', `province_name` varchar(50) NOT NULL COMMENT '省级全称', `province_name_ab` varchar(10) NOT NULL COMMENT '省级简称', `city_name` varchar(50) NOT NULL COMMENT '地市级名称', `district_name` varchar(50) DEFAULT NULL COMMENT '区县级名称', `remark` varchar(1000) DEFAULT NULL COMMENT '备注', `flag` int(1) NOT NULL DEFAULT '1' COMMENT '大陆区划', PRIMARY KEY (`sno`), KEY `idx_adc_province_id` (`province_id`) USING BTREE, KEY `idx_adc_city_id` (`city_id`) USING BTREE, KEY `idx_adc_district_id` (`district_id`) USING BTREE )

2019-06-26

吴恩达《机器学习训练秘籍》中文版

此文档为吴恩达《机器学习训练秘籍》的中文版,旨在帮助大家快速构建自己的机器学习项目。不得不说:老吴出品,必属精品~

2018-11-22

opencv人脸/人眼/人体识别分类器

opencv已训练好的haarcascades分类器,共22个,包括了人脸、人眼、人体等各种分类器。

2018-09-07

拯救纠结症患者

利用Python编写小程序,并打包成exe文件,可在不同电脑上执行。 一个小功能:用户输入自己需要选择的项,系统智能判断,给出结果。

2018-08-27

Python包:baidumapAPI

此为Python包,利用百度地图API实现指定经纬度,返回相应的省市区等位置信息。

2018-08-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除