自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Awesome Computer Vision, 做计算机视觉的程序员

前C++开发工程师,现计算机视觉工程师

  • 博客(61)
  • 资源 (11)
  • 收藏
  • 关注

原创 记第一次参加CV比赛的经历-长三角(芜湖)人工智能视觉算法大赛

参加的比赛叫长三角(芜湖)人工智能视觉算法大赛,参加这个比赛也是挺巧合的,关注了一些公众号,晚上刷公众号的时候刷到了,正好那段时间公司也在问有没有什么比赛可以参加,和同事沟通了一下,当时也不算忙,就决定参加体验一下了,也没有抱着拿奖拿奖金什么的。简单的说就是统计进出的人数,并且判断性别,然后通过工牌做去重。【长三角(芜湖)算法大赛-基于跨时空跟踪的客流统计】-计算机视觉算法竞赛-极市开发者平台 (cvmart.net)大模型时代了,这类比赛不知道今年还有没有了···希望第一次不是最后一次。

2024-02-29 23:58:55 788 1

原创 tx2开发板升级JetPack至最新

tx2整个升级过程还是比较容易的,只要别用虚拟机,满足基础条件。如果出错了,则进入恢复模式,重复这些步骤。官方完整文档:https://docs.nvidia.com/sdk-manager/introduction/index.html。

2024-01-19 23:12:00 504

原创 如何将github copilot当gpt4用

通过大神的项目,如果我们买了copilot,就能免费使用gpt4了,虽然并不是最新的版本,不过也显然比gpt-3.5要强了,赶紧用起来吧···说不准哪天微软把这条路给堵上了。

2024-01-16 21:11:24 2387 1

原创 我的创作纪念日

1.做了 支持N个芯片的测试框架,自认为极大的提升了效率。创作都是在晚上,现在有了书房,幸福了很多。公司快快上市,多多发股票,哈哈哈。

2024-01-10 22:15:48 436

原创 yolov7添加FPPI评价指标

本文简述了在yolov7中增加FPPI评价指标,可以用来直观的表现模型的效果,指导阈值的选取。

2023-12-26 23:04:07 1046 2

原创 新版Edge(120) 侧边栏copilot消失解决办法

edge浏览器自动更新了,更新后侧边栏的copilot(以前的New Bing)图标没了···查了网上的各种方法,说的比较多的是安装Edge Dev, 改地址等等,都比较麻烦,再装一个Edge也是不爽。终于在B站的评论里看到一个贼方便的方法,不需要装Dev。只需要先将语言设置为英文,重启浏览器,然后再改回来即可。

2023-12-12 17:21:54 6770 7

原创 yolov7改进之使用QFocalLoss

深度学习三大件:数据、模型、Loss。一个好的Loss有利于让模型更容易学到需要的特征,不过深度学习已经白热化了,Loss这块对一个成熟任务的提升是越来越小了。虽然如此,也不妨碍我们在难以从数据和模型层面入手时,从这个方面尝试了。

2023-11-01 22:35:32 547

原创 yolov7改进优化之蒸馏(二)

这一篇结合上一篇就可以吧基于FGD算法的蒸馏训练起来了,其他蒸馏的修改也大同小异了。

2023-10-23 22:05:15 574 3

原创 yolov7改进优化之蒸馏(一)

这篇文章简述了一下yolov7的蒸馏过程,更多细节将在下一篇中讲述。

2023-10-17 22:22:26 1515 2

原创 yolov5及yolov7实战之剪枝

这篇文章简述了以下yolov7的剪枝,yolov5也可用,希望对大家有帮助。

2023-09-26 23:45:10 1868 19

原创 基于开源模型的实时人脸识别系统(九):软件说明

前面的文章我们介绍了整个系统里的关键步骤,基于这些步骤我们就可以搭建出属于自己的人脸识别系统了。下面从软件的角度讲解实现的功能。本软件是基于开源的模型实现的一套动态人脸识别系统,该人脸系统会对人脸进行跟踪,并选择最优帧进行人脸识别,并统计人员出现的次数。

2023-09-22 21:52:32 258

原创 基于开源模型搭建实时人脸识别系统(八):优化逻辑

除了上文提到的,还有一些其他的逻辑,如将抓拍照放到底库等,都要根据实际来调整。至此,这个系列中的算法部分就讲完了,后面再介绍一下这个系统的使用就算阶段性结束了。

2023-09-20 22:04:32 200

原创 基于开源模型搭建实时人脸识别系统(七):人脸比对

这里我们简要介绍了人脸比对中的一些概念。

2023-09-19 23:09:02 536

原创 基于开源模型搭建实时人脸识别系统(六):人脸识别(人脸特征提取)

这里我们简要介绍了人脸识别技术的发展过程和主要的一些方法,这里只是一些宽泛的介绍,更深入的算法理解还需要自行阅读论文,可以阅读上述的综述。

2023-09-13 22:35:42 590

原创 在yolov7中训练yolov5模型,yolov5使用OTA loss

通过上述的修改,我们就可以像训练yolov7一样在yolov7项目中训练yolov5了,yolov5也能使用上yolov7的loss了。

2023-09-13 18:33:27 335

原创 基于开源模型搭建实时人脸识别系统(五):人脸跟踪

继续填坑,之前已经讲了人脸检测,,人脸检测是定位出画面中人脸的位置,理论上把检测到的人脸进行提特征就能做人脸识别了,不过直接这样做是有缺陷,一是存在很大的资源浪费,毕竟同一个人出现在画面,我们实际上应该只需要做一次识别就知道他的身份(理想情况下),而不需要每一帧都去做;二是如果对每一帧都进行独立的检测->识别,就会出现频繁的事件,不利于业务的开发。

2023-09-12 22:21:14 575 1

原创 onnx模型修改:将均值和方差放到模型中

训练模型时,一般都会对原始数据进行归一化再送入网络,即减均值和除方差。在部署时,我们也要进行同样的操作。有些推理框架会提供对应的接口,我们只需要设置均值和方差即可,如MNN.也有一些框架不提供这样的功能,如Tensorrt,这时,我们就需要自己去逐像素进行这个操作,不仅繁琐,还可能比较耗时。还有一种方式是将这个操作放到模型中,一个方法是在我们的原始pytorch模型中增加一个固定参数的Batchnorm层,另一种方式就是本文要讲的在导出的onnx模型中插入Sub和Div节点来完成。

2023-08-30 16:35:09 440

原创 yolov8实战之torchserve服务化:使用yolov8x来预打标

最近在做一个目标检测的任务,部署在边缘侧,对于模型的速度要求比较严格(yolov8n这种),所以模型的大小不能弄太大,所以原模型的性能受限,更多的重点放在增加数据上。实测yolov8x在数据集上的效果比小模型要好不少,所以想法是用yolov8x来预打标,然后选择一些置信度高的样本加到训练集来训练yolov8n,减少标注的成本。原始数据是在ceph上,比较直观的方式就是一张张读,然后一张张推理。这样效率不高,毕竟GPU适合组batch去推理,所以为了效率就需要自己去组成batch然后推理,然后再把batch的

2023-08-25 09:36:00 569 3

原创 VSCode如何为远程安装预设(固定)扩展

在使用VSCode进行远程开发时(),特别是远程的机器经常变化时(如机器来源于动态分配),每次连接新的远程时,都不得不手动安装一些开发需要的插件,尽管可以将需要的插件添加到workspace中,然后一键安装,不过总归还是不方便。那么有没有方法能够为我们所有的SSH远程都安装固定的一些插件呢,这样碰到新的远程,不需要再手动装一遍。

2023-08-22 12:03:54 494

原创 基于开源模型搭建实时人脸识别系统(四):人脸质量

这篇我们简要介绍了一下人脸质量评估,不过笔者在这方面涉猎也不深,只是做个简单的总结,需要深入做还是有不少工作。

2023-08-21 22:23:42 1966

原创 yolov8训练进阶:新增配置参数

通过新增参数,我们可以对yolov8的训练和数据读取根据需要进行修改。

2023-08-15 18:20:28 1538 10

原创 yolov8训练进阶:自定义训练脚本,从配置文件载入训练超参数

该脚本通过argparse来接受命令行参数,并设置到超参数字典,和yolov5的启动脚本类似。data: 数据集配置文件hyp: 参数配置文件(上一节我们建立的)model: 模型权重或者模型结构配置文件其他参数根据名字就显而易见了。本文介绍了如何使用自定义训练脚本的方式启动yolov8的训练,有效的结合命令行和配置文件的优点,即可以灵活的修改训练参数,又可以用配置文件来管理我们的训练超参数。并通过修改文件,支持了DDP训练。

2023-08-14 22:56:44 6220 10

原创 Pytorch量化之Post Train Static Quantization(训练后静态量化)

本文介绍了fx graph模式下的Pytorch的PTSQ方法,并实测了一个模型,效果还比较不错。

2023-08-09 23:19:38 1543 5

原创 yolo训练参数scale和multi-scale的区别

scale和multi scale是yolo中的2个尺度相关的参数,不过yolov8把multi scale去掉了,github上项目方说不建议使用这个参数训练。

2023-08-07 22:41:30 1287

原创 VSCode如何在行内显示变量值

在调试时,我们希望能够直接在代码行显示变量的值,而不是总是去侧边栏查看,如下这种,y=12直接显示在代码行。那么VSCode中如何做呢。

2023-08-07 22:14:13 2234

原创 一些不错的VSCode设置和插件

我们做的各项设置,不希望再到其他机器的时候还得再重新配置一次。VSCode中我们可以登陆微软账号或者GitHub账号,登陆后我们可以开启同步设置。开启设置同步,根据提示登陆即可。

2023-08-07 22:05:02 386

原创 从0开始全栈深度学习工程师之路(四):VSCode提效设置和插件

本文简单介绍了一些有效的VSCode设置和插件,通过这些工具,可以有效的提高我们的开发效率。

2023-08-07 18:37:12 226

原创 杭州E类人才申请的常见问题以及福利汇总

续本文是根据交流群(QQ: 782704580)建立后的这段时间的出现较多问题的汇总。

2023-08-03 23:05:29 671 2

原创 人脸识别实战之基于开源模型搭建实时人脸识别系统(三):人脸关键点、对齐模型概览与模型选型

人脸对齐(face alignment)或者人脸关键点(face alignment)是定位人脸上的关键点,是很多基于人脸的任务的前置步骤,比如人脸识别、表情分析、人脸变装(makeup)等。人脸对齐有2D和3D对齐,本篇主要讲2D对齐。人脸姿态对齐:人脸识别等算法都需要对人脸的姿态进行对齐从而提高模型的精度。人脸美颜与编辑:基于关键点可以精确分析脸型、眼睛形状、鼻子形状等,从而对人脸的特定位置进行修饰加工,实现人脸特效美颜,贴片等娱乐功能。

2023-08-03 22:53:24 629

原创 yolov8自定义数据训练报错排查(CUDA error: an illegal memory access was encountered)

可以正常训练,出问题的版本是pytorch 1.13.1。若有碰到相似问题的,不妨换一个pytorch版本。github上有人说是由于数据集中标签有问题,不过我处理了一遍数据,并没有这种情况。

2023-08-03 11:10:24 1845 2

原创 yolov8在rknn(rv1109/1126)模型转换、量化移植过程

yolov8是比较新的目标检测模型,根据论文和开源项目的报告,相对使用比较广泛的yolov5提升还比较明显。YOLOv8 深度详解!一文看懂,快速上手 - 知乎 (zhihu.com)通过对导出的模型进行一定的修改,1109上可以实现yolov8的运行并得到检测框,不过最终的运行速度和精度还有待验证。后处理的方式目前也是完全按照pytorch中的实现,过多的concat和split,可能对于C++并不太友好,后续尝试用更好的实现方式。Todo: 量化精度的测试以及C++部署。

2023-08-02 18:00:16 4375 26

原创 rv1109/1126 rknn 模型部署过程

rv1109/1126是瑞芯微出的嵌入式AI芯片,带有npu, 可以用于嵌入式人工智能应用。算法工程师训练出的算法要部署到芯片上,需要经过模型转换和量化,下面记录一下整个过程。

2023-08-01 22:37:50 2096 1

原创 人脸识别实战之基于开源模型搭建实时人脸识别系统(二):人脸检测概览与模型选型

进行人脸识别首要的任务就是要定位出画面中的人脸,这个任务就是人脸检测。人脸检测总体上算是目标检测的一个特殊情况,但也有自身的特点,比如角度多变,表情多变,可能存在各类遮挡。早期传统的方法有Haar Cascade、HOG等,基本做法就是特征描述子+滑窗+分类器,随着2012年Alexnet的出现,慢慢深度学习在这一领域开始崛起。算法和硬件性能的发展,也让基于深度学习的人脸识别不仅性能取得了很大的提升,速度也能达到实时,使得人脸技术真正进入了实用。

2023-07-31 23:46:31 1213

原创 从0开始深度学习工程师之路(三):Python开发环境搭建(VSCode)

到这里,我们的一个基本的开发环境就配好了,已经可以进行python开发和调试了。VSCode还有一些其他插件和设置有利于我们更好的开发,会在下一篇介绍。

2023-07-29 16:10:59 263

原创 人脸识别实战之基于开源模型搭建实时人脸识别系统(一):引言

人脸识别已经发展了很多年,随着深度学习发展,开源的模型也有很不错的效果了。我们可以在不需要深入各种算法细节的情况下,就能搭建自己的人脸识别系统了,除了用于学习,还可以将我们自己家的摄像头接入到我们自己搭的系统,真正用起来。这个专栏就基于这样一个设想,从开源的模型中寻找适合的算法,一步步搭建一个实时的人脸识别系统出来。

2023-07-28 12:00:41 248

原创 Python爬虫实战之代理访问CSDN

前面2篇分别介绍了从2个免费代理网站爬取免费代理来构建我们自己的代理池。这一篇我们从实战的角度来将我们的代理池用起来,通过代理的方式访问我们的CSDN博客(CSDN会认为是一次访问,访问量+1),从而实现访问量的增长,仅供学习爬虫使用, 切勿滥用…

2023-07-23 23:10:31 599

原创 python爬虫之建立代理池(二)

上一篇讲到从66代理上爬取免费代理,为了进一步扩大我们的代理池,今天讲一下从另一个网址获取。

2023-07-19 22:47:06 648

原创 python爬虫之建立代理池(一)

很多时候我们会使用爬虫或者脚本帮我们爬取数据用于数据分析、模型训练等,常见的反爬手段之一就是限制IP的访问频率,所以为了让爬虫或脚本能够正常运行,我们需要有足够多的IP。代理IP就是通过代理的IP去访问我们需要的网站,对于目标网站表现出的是代理IP, 从而防止同一IP访问频率过高被封。如何拥有足够多的代理地址呢?我们可以使用爬虫手段去自动爬取提供免费代理的网站,建立自己的代理池。本篇以爬取66代理为例,记录整个过程。

2023-07-17 11:37:59 905

原创 免费可用的VSCode/Pycharm GPT插件

发现一款免费可用的VSCode/Pycharm GPT插件,官方宣称是他们自动根据prompt切换3和4,我尝试了下,有一个只有4能答对的问题,它有时对有时错···与其说是一个软件,更准确的说是一个插件,可以在VSCode以及Jetbrains的软件如Pycharm中使用,可以对话,可以解释代码, 话不多说开始。

2023-07-12 22:34:46 1824

原创 python开发之远程开发工具选择

除了本地开发外,还有一种常见的开发方式就是远程开发,一般情况是一台Windows或mac笔记本作为日常使用的电脑,另有一台linux服务器作为开发服务器。开发服务器的性能往往较强,这样远程开发的方式一方面可以让我们在习惯的系统下工作,又能利用强大的服务器,而且linux下开发python往往比win下要方便得多。

2023-07-11 15:10:15 297

1500+AIGC应用工具大全

覆盖文生图、低代码、文生文、图像、数据分析等各类的工具 https://mbd.pub/o/bread/ZJyTmphq

2023-06-28

异或加密caffe模型工具/代码

异或加密caffe模型的C++代码,很容易可以扩展使用其他加密算法,可以用于部署时保护模型的安全

2023-06-26

基于深度学习的人流密度统计

在机场、地铁、公交站等人群容易聚集的场所,常常需要根据人群情况,进行不同的疏导方式,传统的基于检测计数的方式已经不适用于这类遮挡严重的场景。本项目基于人群密度估计可以实时获取当前的拥塞情况,可用于监控场景的人群估计。项目支持本地运行以及通过http服务形式运行。

2023-06-25

Kubeflow for Machine Learning -From Lab to Production

kubeflow机器学习实战英文原版,没有翻译带来的损失。讲述如何利用kubeflow用于深度学习和机器学习的训练,能学到用kubeflow管理训练集群,训练任务,适合于英文不错的开发。

2023-05-15

yolov5二维码检测数据集(3100+张)

yolo格式的二维码数据集,可用于训练商用级的二维码检测模型,搭配训练教程: https://blog.csdn.net/liuhao3285/article/details/120589835?spm=1001.2014.3001.5502。0积分下载地址:https://mbd.pub/o/CoderInCV/work

2023-05-10

SMO-MKL多核学习

多核学习代码

2016-03-30

OpenBlasv0.2.8-x86-64-Win

OpenBlas库,矩阵运算速度很快

2016-03-30

Kinect for Windows Sdk 开发入门

Kinect for Windows Sdk 开发入门资料,从头开始学习 Kinect for Windows Sdk 的好资料

2014-09-22

OpenCV函数查询

OpenCV函数查询,用于方便的查询OPENCV函数的用法

2014-09-22

EMGUCV入门手册(EMGU CV Essentials),英文原版

EMGUCV 是一个用于跨平台计算机视觉开发的 .NET 接口库,它基于 OpenCV(开放源代码计算机视觉库)并与 C# 语言集成。如果您对 EMGUCV 感兴趣并正在寻找英文原版参考书,以下是一段资源介绍: 《EMGU CV Essentials》(EMGU CV 精要)是一本经典的英文原版书籍,作者为 Shin Shi,出版于 Packt Publishing。这本书专注于 EMGUCV 库的基本应用,并提供了入门级的学习材料。通过这本书,您将了解 EMGUCV 的核心功能、图像处理技术和计算机视觉算法的实现方式。 《EMGU CV Essentials》涵盖了许多重要的主题,包括图像加载和保存、像素操作、颜色空间转换、图像滤波、特征检测和匹配、轮廓分析等等。书中以简洁清晰的方式介绍了每个主题,结合代码示例和详细说明,帮助读者理解和应用 EMGUCV。

2014-09-22

Mastering OpenCV with Practical Computer Vision Project

OPENCV的讲解资料,通过实用的例子学习OPENCV,是英文版

2014-09-22

TortoiseSVN-1.8.5中文版手册

TortoiseSVN-1.8.5中文版手册,用来学习代码管理工具TortoiseSVN-1.8.5

2014-09-22

opencv2计算机视觉编程手册(中文)

OPENCV计算机视觉编程手册,中文版的,可以作为OPENCV的参考手册

2014-09-22

yuv和rgb互转的库文件

里面有yuv和rgb转换的函数可以调用,很方便

2014-04-13

Kinect开发应用实战随书代码

《Kinect应用开发实战-用最自然的方式与机器对话》一书的随书代码,用来学习很好

2014-04-13

DS18B20的单片机读写程序

基于单片机的DS18B20测温程序,可显示两路温度,当然修改后也可以用于更多路的测温读写

2012-05-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除