CodingInCV-CSDN博客

原创记第一次参加CV比赛的经历-长三角（芜湖）人工智能视觉算法大赛

参加的比赛叫长三角（芜湖）人工智能视觉算法大赛，参加这个比赛也是挺巧合的，关注了一些公众号，晚上刷公众号的时候刷到了，正好那段时间公司也在问有没有什么比赛可以参加，和同事沟通了一下，当时也不算忙，就决定参加体验一下了，也没有抱着拿奖拿奖金什么的。简单的说就是统计进出的人数，并且判断性别，然后通过工牌做去重。【长三角（芜湖）算法大赛-基于跨时空跟踪的客流统计】-计算机视觉算法竞赛-极市开发者平台 (cvmart.net)大模型时代了，这类比赛不知道今年还有没有了···希望第一次不是最后一次。

2024-02-29 23:58:55 788 1

原创 tx2开发板升级JetPack至最新

tx2整个升级过程还是比较容易的，只要别用虚拟机，满足基础条件。如果出错了，则进入恢复模式，重复这些步骤。官方完整文档：https://docs.nvidia.com/sdk-manager/introduction/index.html。

2024-01-19 23:12:00 504

原创如何将github copilot当gpt4用

通过大神的项目，如果我们买了copilot，就能免费使用gpt4了，虽然并不是最新的版本，不过也显然比gpt-3.5要强了，赶紧用起来吧···说不准哪天微软把这条路给堵上了。

2024-01-16 21:11:24 2387 1

原创我的创作纪念日

1.做了支持N个芯片的测试框架，自认为极大的提升了效率。创作都是在晚上，现在有了书房，幸福了很多。公司快快上市，多多发股票，哈哈哈。

2024-01-10 22:15:48 436

原创 yolov7添加FPPI评价指标

本文简述了在yolov7中增加FPPI评价指标，可以用来直观的表现模型的效果，指导阈值的选取。

2023-12-26 23:04:07 1046 2

原创新版Edge(120) 侧边栏copilot消失解决办法

edge浏览器自动更新了，更新后侧边栏的copilot（以前的New Bing）图标没了···查了网上的各种方法，说的比较多的是安装Edge Dev, 改地址等等，都比较麻烦，再装一个Edge也是不爽。终于在B站的评论里看到一个贼方便的方法，不需要装Dev。只需要先将语言设置为英文，重启浏览器，然后再改回来即可。

2023-12-12 17:21:54 6770 7

原创 yolov7改进之使用QFocalLoss

深度学习三大件：数据、模型、Loss。一个好的Loss有利于让模型更容易学到需要的特征，不过深度学习已经白热化了，Loss这块对一个成熟任务的提升是越来越小了。虽然如此，也不妨碍我们在难以从数据和模型层面入手时，从这个方面尝试了。

2023-11-01 22:35:32 547

原创 yolov7改进优化之蒸馏（二）

这一篇结合上一篇就可以吧基于FGD算法的蒸馏训练起来了，其他蒸馏的修改也大同小异了。

2023-10-23 22:05:15 574 3

原创 yolov7改进优化之蒸馏（一）

这篇文章简述了一下yolov7的蒸馏过程，更多细节将在下一篇中讲述。

2023-10-17 22:22:26 1515 2

原创 yolov5及yolov7实战之剪枝

这篇文章简述了以下yolov7的剪枝，yolov5也可用，希望对大家有帮助。

2023-09-26 23:45:10 1868 19

原创基于开源模型的实时人脸识别系统（九）：软件说明

前面的文章我们介绍了整个系统里的关键步骤，基于这些步骤我们就可以搭建出属于自己的人脸识别系统了。下面从软件的角度讲解实现的功能。本软件是基于开源的模型实现的一套动态人脸识别系统，该人脸系统会对人脸进行跟踪，并选择最优帧进行人脸识别，并统计人员出现的次数。

2023-09-22 21:52:32 258

原创基于开源模型搭建实时人脸识别系统（八）：优化逻辑

除了上文提到的，还有一些其他的逻辑，如将抓拍照放到底库等，都要根据实际来调整。至此，这个系列中的算法部分就讲完了，后面再介绍一下这个系统的使用就算阶段性结束了。

2023-09-20 22:04:32 200

原创基于开源模型搭建实时人脸识别系统（七）：人脸比对

这里我们简要介绍了人脸比对中的一些概念。

2023-09-19 23:09:02 536

原创基于开源模型搭建实时人脸识别系统（六）：人脸识别（人脸特征提取）

这里我们简要介绍了人脸识别技术的发展过程和主要的一些方法，这里只是一些宽泛的介绍，更深入的算法理解还需要自行阅读论文，可以阅读上述的综述。

2023-09-13 22:35:42 590

原创在yolov7中训练yolov5模型，yolov5使用OTA loss

通过上述的修改，我们就可以像训练yolov7一样在yolov7项目中训练yolov5了，yolov5也能使用上yolov7的loss了。

2023-09-13 18:33:27 335

原创基于开源模型搭建实时人脸识别系统（五）：人脸跟踪

继续填坑，之前已经讲了人脸检测，，人脸检测是定位出画面中人脸的位置，理论上把检测到的人脸进行提特征就能做人脸识别了，不过直接这样做是有缺陷，一是存在很大的资源浪费，毕竟同一个人出现在画面，我们实际上应该只需要做一次识别就知道他的身份（理想情况下），而不需要每一帧都去做；二是如果对每一帧都进行独立的检测->识别，就会出现频繁的事件，不利于业务的开发。

2023-09-12 22:21:14 575 1

原创 onnx模型修改：将均值和方差放到模型中

训练模型时，一般都会对原始数据进行归一化再送入网络，即减均值和除方差。在部署时，我们也要进行同样的操作。有些推理框架会提供对应的接口，我们只需要设置均值和方差即可，如MNN.也有一些框架不提供这样的功能，如Tensorrt，这时，我们就需要自己去逐像素进行这个操作，不仅繁琐，还可能比较耗时。还有一种方式是将这个操作放到模型中，一个方法是在我们的原始pytorch模型中增加一个固定参数的Batchnorm层，另一种方式就是本文要讲的在导出的onnx模型中插入Sub和Div节点来完成。

2023-08-30 16:35:09 440

原创 yolov8实战之torchserve服务化：使用yolov8x来预打标

最近在做一个目标检测的任务，部署在边缘侧，对于模型的速度要求比较严格（yolov8n这种），所以模型的大小不能弄太大，所以原模型的性能受限，更多的重点放在增加数据上。实测yolov8x在数据集上的效果比小模型要好不少，所以想法是用yolov8x来预打标，然后选择一些置信度高的样本加到训练集来训练yolov8n，减少标注的成本。原始数据是在ceph上，比较直观的方式就是一张张读，然后一张张推理。这样效率不高，毕竟GPU适合组batch去推理，所以为了效率就需要自己去组成batch然后推理，然后再把batch的

2023-08-25 09:36:00 569 3

原创 VSCode如何为远程安装预设（固定）扩展

在使用VSCode进行远程开发时（），特别是远程的机器经常变化时（如机器来源于动态分配），每次连接新的远程时，都不得不手动安装一些开发需要的插件，尽管可以将需要的插件添加到workspace中，然后一键安装，不过总归还是不方便。那么有没有方法能够为我们所有的SSH远程都安装固定的一些插件呢，这样碰到新的远程，不需要再手动装一遍。

2023-08-22 12:03:54 494

原创基于开源模型搭建实时人脸识别系统（四）：人脸质量

这篇我们简要介绍了一下人脸质量评估，不过笔者在这方面涉猎也不深，只是做个简单的总结，需要深入做还是有不少工作。

2023-08-21 22:23:42 1966

原创 yolov8训练进阶：新增配置参数

通过新增参数，我们可以对yolov8的训练和数据读取根据需要进行修改。

2023-08-15 18:20:28 1538 10

原创 yolov8训练进阶：自定义训练脚本，从配置文件载入训练超参数

该脚本通过argparse来接受命令行参数，并设置到超参数字典，和yolov5的启动脚本类似。data: 数据集配置文件hyp: 参数配置文件（上一节我们建立的）model: 模型权重或者模型结构配置文件其他参数根据名字就显而易见了。本文介绍了如何使用自定义训练脚本的方式启动yolov8的训练，有效的结合命令行和配置文件的优点，即可以灵活的修改训练参数，又可以用配置文件来管理我们的训练超参数。并通过修改文件，支持了DDP训练。

2023-08-14 22:56:44 6220 10

原创 Pytorch量化之Post Train Static Quantization(训练后静态量化)

本文介绍了fx graph模式下的Pytorch的PTSQ方法，并实测了一个模型，效果还比较不错。

2023-08-09 23:19:38 1543 5

原创 yolo训练参数scale和multi-scale的区别

scale和multi scale是yolo中的2个尺度相关的参数，不过yolov8把multi scale去掉了，github上项目方说不建议使用这个参数训练。

2023-08-07 22:41:30 1287

原创 VSCode如何在行内显示变量值

在调试时，我们希望能够直接在代码行显示变量的值，而不是总是去侧边栏查看，如下这种，y=12直接显示在代码行。那么VSCode中如何做呢。

2023-08-07 22:14:13 2234

原创一些不错的VSCode设置和插件

我们做的各项设置，不希望再到其他机器的时候还得再重新配置一次。VSCode中我们可以登陆微软账号或者GitHub账号，登陆后我们可以开启同步设置。开启设置同步，根据提示登陆即可。

2023-08-07 22:05:02 386

原创从0开始全栈深度学习工程师之路（四）：VSCode提效设置和插件

本文简单介绍了一些有效的VSCode设置和插件，通过这些工具，可以有效的提高我们的开发效率。

2023-08-07 18:37:12 226

原创杭州E类人才申请的常见问题以及福利汇总

续本文是根据交流群（QQ: 782704580）建立后的这段时间的出现较多问题的汇总。

2023-08-03 23:05:29 671 2

原创人脸识别实战之基于开源模型搭建实时人脸识别系统（三）：人脸关键点、对齐模型概览与模型选型

人脸对齐（face alignment）或者人脸关键点（face alignment）是定位人脸上的关键点，是很多基于人脸的任务的前置步骤，比如人脸识别、表情分析、人脸变装（makeup）等。人脸对齐有2D和3D对齐，本篇主要讲2D对齐。人脸姿态对齐：人脸识别等算法都需要对人脸的姿态进行对齐从而提高模型的精度。人脸美颜与编辑：基于关键点可以精确分析脸型、眼睛形状、鼻子形状等，从而对人脸的特定位置进行修饰加工，实现人脸特效美颜，贴片等娱乐功能。

2023-08-03 22:53:24 629

原创 yolov8自定义数据训练报错排查（CUDA error: an illegal memory access was encountered）

可以正常训练，出问题的版本是pytorch 1.13.1。若有碰到相似问题的，不妨换一个pytorch版本。github上有人说是由于数据集中标签有问题，不过我处理了一遍数据，并没有这种情况。

2023-08-03 11:10:24 1845 2

原创 yolov8在rknn(rv1109/1126)模型转换、量化移植过程

yolov8是比较新的目标检测模型，根据论文和开源项目的报告，相对使用比较广泛的yolov5提升还比较明显。YOLOv8 深度详解！一文看懂，快速上手 - 知乎 (zhihu.com)通过对导出的模型进行一定的修改，1109上可以实现yolov8的运行并得到检测框，不过最终的运行速度和精度还有待验证。后处理的方式目前也是完全按照pytorch中的实现，过多的concat和split，可能对于C++并不太友好，后续尝试用更好的实现方式。Todo: 量化精度的测试以及C++部署。

2023-08-02 18:00:16 4375 26

原创 rv1109/1126 rknn 模型部署过程

rv1109/1126是瑞芯微出的嵌入式AI芯片，带有npu, 可以用于嵌入式人工智能应用。算法工程师训练出的算法要部署到芯片上，需要经过模型转换和量化，下面记录一下整个过程。

2023-08-01 22:37:50 2096 1

原创人脸识别实战之基于开源模型搭建实时人脸识别系统（二）：人脸检测概览与模型选型

进行人脸识别首要的任务就是要定位出画面中的人脸，这个任务就是人脸检测。人脸检测总体上算是目标检测的一个特殊情况，但也有自身的特点，比如角度多变，表情多变，可能存在各类遮挡。早期传统的方法有Haar Cascade、HOG等，基本做法就是特征描述子+滑窗+分类器，随着2012年Alexnet的出现，慢慢深度学习在这一领域开始崛起。算法和硬件性能的发展，也让基于深度学习的人脸识别不仅性能取得了很大的提升，速度也能达到实时，使得人脸技术真正进入了实用。

2023-07-31 23:46:31 1213

原创从0开始深度学习工程师之路（三）：Python开发环境搭建（VSCode）

到这里，我们的一个基本的开发环境就配好了，已经可以进行python开发和调试了。VSCode还有一些其他插件和设置有利于我们更好的开发，会在下一篇介绍。

2023-07-29 16:10:59 263

原创人脸识别实战之基于开源模型搭建实时人脸识别系统（一）：引言

人脸识别已经发展了很多年，随着深度学习发展，开源的模型也有很不错的效果了。我们可以在不需要深入各种算法细节的情况下，就能搭建自己的人脸识别系统了，除了用于学习，还可以将我们自己家的摄像头接入到我们自己搭的系统，真正用起来。这个专栏就基于这样一个设想，从开源的模型中寻找适合的算法，一步步搭建一个实时的人脸识别系统出来。

2023-07-28 12:00:41 248

原创 Python爬虫实战之代理访问CSDN

前面2篇分别介绍了从2个免费代理网站爬取免费代理来构建我们自己的代理池。这一篇我们从实战的角度来将我们的代理池用起来，通过代理的方式访问我们的CSDN博客（CSDN会认为是一次访问，访问量+1）,从而实现访问量的增长，仅供学习爬虫使用, 切勿滥用…

2023-07-23 23:10:31 599

原创 python爬虫之建立代理池（二）

上一篇讲到从66代理上爬取免费代理，为了进一步扩大我们的代理池，今天讲一下从另一个网址获取。

2023-07-19 22:47:06 648

原创 python爬虫之建立代理池（一）

很多时候我们会使用爬虫或者脚本帮我们爬取数据用于数据分析、模型训练等，常见的反爬手段之一就是限制IP的访问频率，所以为了让爬虫或脚本能够正常运行，我们需要有足够多的IP。代理IP就是通过代理的IP去访问我们需要的网站，对于目标网站表现出的是代理IP, 从而防止同一IP访问频率过高被封。如何拥有足够多的代理地址呢？我们可以使用爬虫手段去自动爬取提供免费代理的网站，建立自己的代理池。本篇以爬取66代理为例，记录整个过程。

2023-07-17 11:37:59 905

原创免费可用的VSCode/Pycharm GPT插件

发现一款免费可用的VSCode/Pycharm GPT插件，官方宣称是他们自动根据prompt切换3和4，我尝试了下，有一个只有4能答对的问题，它有时对有时错···与其说是一个软件，更准确的说是一个插件，可以在VSCode以及Jetbrains的软件如Pycharm中使用，可以对话，可以解释代码, 话不多说开始。

2023-07-12 22:34:46 1824

原创 python开发之远程开发工具选择

除了本地开发外，还有一种常见的开发方式就是远程开发，一般情况是一台Windows或mac笔记本作为日常使用的电脑，另有一台linux服务器作为开发服务器。开发服务器的性能往往较强，这样远程开发的方式一方面可以让我们在习惯的系统下工作，又能利用强大的服务器，而且linux下开发python往往比win下要方便得多。

2023-07-11 15:10:15 297

1500+AIGC应用工具大全

覆盖文生图、低代码、文生文、图像、数据分析等各类的工具 https://mbd.pub/o/bread/ZJyTmphq

2023-06-28

异或加密caffe模型工具/代码

异或加密caffe模型的C++代码，很容易可以扩展使用其他加密算法，可以用于部署时保护模型的安全

2023-06-26

基于深度学习的人流密度统计

在机场、地铁、公交站等人群容易聚集的场所，常常需要根据人群情况，进行不同的疏导方式，传统的基于检测计数的方式已经不适用于这类遮挡严重的场景。本项目基于人群密度估计可以实时获取当前的拥塞情况，可用于监控场景的人群估计。项目支持本地运行以及通过http服务形式运行。

2023-06-25

Kubeflow for Machine Learning -From Lab to Production

kubeflow机器学习实战英文原版，没有翻译带来的损失。讲述如何利用kubeflow用于深度学习和机器学习的训练，能学到用kubeflow管理训练集群，训练任务，适合于英文不错的开发。

2023-05-15

yolov5二维码检测数据集（3100+张）

yolo格式的二维码数据集，可用于训练商用级的二维码检测模型，搭配训练教程： https://blog.csdn.net/liuhao3285/article/details/120589835?spm=1001.2014.3001.5502。0积分下载地址：https://mbd.pub/o/CoderInCV/work

2023-05-10

SMO-MKL多核学习

多核学习代码

2016-03-30

OpenBlasv0.2.8-x86-64-Win

OpenBlas库，矩阵运算速度很快

2016-03-30

Kinect for Windows Sdk 开发入门

Kinect for Windows Sdk 开发入门资料，从头开始学习 Kinect for Windows Sdk 的好资料

2014-09-22

OpenCV函数查询

OpenCV函数查询，用于方便的查询OPENCV函数的用法

2014-09-22

EMGUCV入门手册（EMGU CV Essentials），英文原版

EMGUCV 是一个用于跨平台计算机视觉开发的 .NET 接口库，它基于 OpenCV（开放源代码计算机视觉库）并与 C# 语言集成。如果您对 EMGUCV 感兴趣并正在寻找英文原版参考书，以下是一段资源介绍：《EMGU CV Essentials》（EMGU CV 精要）是一本经典的英文原版书籍，作者为 Shin Shi，出版于 Packt Publishing。这本书专注于 EMGUCV 库的基本应用，并提供了入门级的学习材料。通过这本书，您将了解 EMGUCV 的核心功能、图像处理技术和计算机视觉算法的实现方式。《EMGU CV Essentials》涵盖了许多重要的主题，包括图像加载和保存、像素操作、颜色空间转换、图像滤波、特征检测和匹配、轮廓分析等等。书中以简洁清晰的方式介绍了每个主题，结合代码示例和详细说明，帮助读者理解和应用 EMGUCV。

2014-09-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

1500+AIGC应用工具大全

异或加密caffe模型工具/代码

基于深度学习的人流密度统计

Kubeflow for Machine Learning -From Lab to Production

yolov5二维码检测数据集（3100+张）

SMO-MKL多核学习

OpenBlasv0.2.8-x86-64-Win

Kinect for Windows Sdk 开发入门

OpenCV函数查询

EMGUCV入门手册（EMGU CV Essentials），英文原版

Mastering OpenCV with Practical Computer Vision Project

TortoiseSVN-1.8.5中文版手册

opencv2计算机视觉编程手册(中文)

yuv和rgb互转的库文件

Kinect开发应用实战随书代码

DS18B20的单片机读写程序

空空如也