殷忆枫-CSDN博客

原创 RK3568笔记二十二：基于TACO的垃圾检测和识别

若该文为原创文章，转载请注明原文出处。基于TACO数据集，使用YOLOv8分割模型进行垃圾检测和识别，并在ATK-RK3568上部署运行。

2024-04-16 19:45:27 463 3

原创 RK3568笔记二十一：YOLOv8 实例分割部署

若该文为原创文章，转载请注明原文出处。参考rknn_model_zoo部署YOLOv8 实例分割.

2024-03-27 14:56:22 557

原创 RK3568笔记二十：PP-YOLOE部署测试

若该文为原创文章，转载请注明原文出处。注：转换测试使用的是Autodl服务器，CUDA11.1版本，py3.8。

2024-03-21 20:46:22 814

原创 RK3568笔记十九：Yolov5-seg训练部署

若该文为原创文章，转载请注明原文出处。根据airockchip/yolov5 仓库训练并部署全过程记录。

2024-03-12 00:28:20 1058

MobileNet，它是谷歌研究人员于2017 年开发的一种 CNN 架构，用于将计算机视觉有效地融入手机和机器人等小型便携式设备中，而不会显著降低准确性。后续进一步为了解决实际应用中的一些问题，推出了 v2，v3 版本。MobileNet提出了一种深度可分离卷积（Depthwise Separable Convolutions），该卷积不同于标准卷积，可以大幅度减小模型规模的同时保证模型性能下降很小。深度可分离卷积分为两个操作：深度卷积 (DW) 和逐点卷积 (PW)。

2024-03-03 11:25:04 1012

原创 RK3568笔记十七：LVGL v8.2移植

若该文为原创文章，转载请注明原文出处。本文介绍嵌入式图形库移植到Linux开发板ATK-RK3568上的步骤。

2024-02-16 11:20:31 1403

原创 RK3568笔记十六：Framebuffer实验

FrameBuffer中文译名为帧缓冲驱动，它是出现在2.2.xx内核中的一种驱动程序接口。主设备号为29，次设备号递增。Linux抽象出FrameBuffer这个设备来供用户态进程实现直接写屏。FrameBuffer机制模仿显卡的功能，将显卡硬件结构抽象掉，可以通过FrameBuffer的读写直接对显存进行操作。用户可以将FrameBuffer看成是显示内存的一个映像，将其映射到进程地址空间之后，就可以直接进行读写操作，而写操作可以立即反应在屏幕上。这种操作是抽象的，统一的。

2024-02-15 22:35:46 568 2

原创 RK3568笔记十五：触摸屏测试

若该文为原创文章，转载请注明原文出处。使用正点原子的ATK-RK3568板子，一直在测试屏幕和视频，突然想到触摸屏测试，一直没有用过，原子给的demo跑的是QT系统，触摸功能是正常的，测试一下，并记录。

2024-02-15 12:10:18 1117

原创 RK3568笔记十四：yolov8pose部署

若该文为原创文章，转载请注明原文出处。本篇参考山水无移大佬文章，并成功部署了yolov8pose在RK3568板子上，这里记录下全过程。

2024-02-13 12:54:51 1397 9

原创 RK3568笔记十三：Zlmedia推流测试

若该文为原创文章，转载请注明原文出处。使用正点原子的屏幕竖屏用不习惯，所以想推流用VLC方式显示，而Zlmedia功能很强大，推流拉流都有，拉流在前面有提及。研究了几天，最后还是勇哥帮忙，所以知道了怎么推流。

2024-02-11 12:33:53 1129

原创 RK3568笔记十二：Zlmedia拉流显示测试

若该文为原创文章，转载请注明原文出处。Zlmediakit功能很强大，测试一下拉流，在通过解码显示。

2024-02-07 12:39:58 799

原创 RK3568笔记十一：mpp编解码

若该文为原创文章，转载请注明原文出处。主要是想测试MPP的解码，为后续做测试。

2024-01-22 23:37:48 1252

原创 RK3568笔记十：Zlmediakit交叉编译

ZLMediaKit是一套高性能的流媒体服务框架，目前支持rtmp、rtsp、hls、http-flv等流媒体协议，支持linux、macos、windows三大PC平台和ios、android两大移动端平台。类似于live555的工具，可以用来实现rtsp服务器的功能，且提供c 版本的api，使用起来十分简单，很容易上手。进行交叉编译，需要修改两个地方，一个是指定编译工具链，还有一个是指定已经交叉编译过的openssl库。

2024-01-21 23:06:27 706

原创 RK3568笔记九： DRM显示摄像头

学习DRM的目的是想做类似NVR显示多路实时流，通过勇哥（Marc)的指导，大概流程是通过Zlmedia拉流，RK3568的MPP解码,DRM显示，可以使用HDMI或DIS屏幕，所以为了后面的实现，先测试摄像头采集DRM显示。

2024-01-15 22:29:34 691

原创 RK3568笔记八： Display子系统

modetest 是由 libdrm 提供的测试程序，可以查询显示设备的特性，进行基本的显示测试，以及设置显示的模式。我们可以借助该工具来学习 Linux DRM 应用编程，另外为了深入分析 Rockchip DRM driver，有必要先了解一下这个工具的使用方法和内部实现。

2024-01-14 00:23:04 716

原创 RK3568笔记七：yolov5-seg实例分割测试验证

若该文为原创文章，转载请注明原文出处。记录的目的是想在RK3568上实现实例分割，在github的rknn_mode_zoo仓库里看到了例子，带着疑问测试了一下，结果跑通了，这里记录下全过程。1、硬件：正点原子ATK-DLRK3568板子2、虚拟：使用正点提供的虚拟机3、需要安装的工具（参考03【正点原子】ATK-DLRK3568_AI例程测试手册V1.0.pdf）：以上自行安装，手册里有详细的説明。

2023-12-31 14:07:40 780

原创 AI项目十九：YOLOV8实现目标追踪

目标检测和目标跟踪的区别：目标检测任务要求同时完成对象的定位（即确定对象的边界框位置）和分类（即确定对象的类别）。这意味着目标检测算法必须不仅能够确定对象是否存在，还要知道它是什么。目标检测通常用于识别和定位图像或视频帧中的对象，通常需要明确的目标类别信息。目标跟踪任务更关注对象在帧与帧之间的连续性，通常更注重对象的运动特征，而不要求进行目标的分类。目标跟踪可以不涉及目标的类别，它的主要目标是维护对象的位置和轨迹，以实现在视频序列中的跟踪。

2023-12-24 18:01:39 2309 1

原创 AI项目十八：YOLOV8自训练关键点检测

若该文为原创文章，转载请注明原文出处。记录学习YOLOV8过程，自训练关键点检测模型。清华源：-i。

2023-12-16 19:16:21 2352 27

原创 RK3568笔记六：基于Yolov8的训练及部署

若该文为原创文章，转载请注明原文出处。基于Yolov8的训练及部署，参考鲁班猫的手册训练自己的数据集部署到RK3568,用的是正点的板子。1、

2023-11-28 22:33:51 1975 9

原创 RK3568笔记五：基于Yolov5的训练及部署

环境：Ubuntu20.04、python3.8芯片：RK3568芯片系统：buildroot开发板：ATK-DLRK3568开发主要参考文档：《Rockchip_Quick_Start_RKNN_Toolkit2_CN-1.4.0.pdf》、《Rockchip_User_Guide_RKNN_Toolkit2_CN-1.4.0.pdf》

2023-11-13 22:10:25 1328

原创 RK3568笔记四：基于TensorFlow花卉图像分类部署

TensorFlow 是一个基于数据流编程（dataflow programming）的符号数学系统，被广泛应用于机器学习（machine learning）算法的编程实现，其前身是谷歌的神经网络算法库 DistBelief。使用 tf.keras.Sequential 模型对花卉图像进行分类。

2023-10-20 21:06:14 1535

原创 RK3568笔记三：基于ResNet18的Cifar-10分类识别训练部署

ResNet18 是一种卷积神经网络，它有 18 层深度，其中包括带有权重的卷积层和全连接层。它是ResNet 系列网络的一个变体，使用了残差连接（residual connection）来解决深度网络的退化问题。ResNet（Residual Neural Network）由微软研究院的 Kaiming He 等人在 2015 年提出，ResNet 的结构可以极快的加速神经网络的训练，模型的准确率也有比较大的提升。

2023-10-20 15:42:58 486 1

原创 RK3568笔记三：部署ResNet50模型

若该文为原创文章，转载请注明原文出处。通过ResNet50网络训练了识别10类车的模型并成功了转换成了onnx模型具体训练过程可以参考文章这里部署使用rknn-toolkit2工具转换成RKNN模型并测试rknn-toolkit2工具安装在前面文章有説明了，自行安装。接下来测试并转成RKNN模型。

2023-10-18 23:46:25 568

原创 AI项目十七：ResNet50训练部署教程

ResNet50网络是2015年由微软实验室的何恺明提出，获得ILSVRC2015图像分类竞赛第一名。在ResNet网络提出之前，传统的卷积神经网络都是将一系列的卷积层和池化层堆叠得到的，但当网络堆叠到一定深度时，就会出现退化问题。残差网络的特点是容易优化，并且能够通过增加相当的深度来提高准确率。其内部的残差块使用了跳跃连接，缓解了在深度神经网络中增加深度带来的梯度消失问题。

2023-10-18 23:05:50 1406

原创 AI项目十六：YOLOP 训练+测试+模型评估

YOLOP是华中科技大学研究团队在2021年开源的研究成果，其将目标检测/可行驶区域分割和车道线检测三大视觉任务同时放在一起处理，并且在Jetson TX2开发板子上能够达到23FPS。论文标题：YOLOP: You Only Look Once for Panoptic Driving Perception论文地址: https://arxiv.org/abs/2108.11250官方代码: https://github.com/hustvl/YOLOP。

2023-10-13 21:51:35 1001 3

原创 AI项目十五：PP-Humanseg训练及onnxruntime部署

本文将PaddleSeg的人像分割（PP-HumanSeg）模型导出为onnx，并使用onnxruntime部署，实现人像分割，效果如下图所示。

2023-10-11 23:28:18 632

原创 RK3568笔记二：部署手写数字识别模型

部署手写数字识别模型，使用手写数字识别（mnist）数据集训练了一个 LENET 的五层经典网络模型。Lenet是我们的深度学习入门的必学模型，是深度学习领域中的经典卷积神经网络（CNN）架构之一。过程分为：训练，导出ONNX，转化RKNN，测试。

2023-10-07 07:15:07 542

原创 RK3568笔记一：RKNN开发环境搭建

RK3568开发板使用的是正点原子新出的ATK-DLRK3568 开发板，主要是学习从训练到部署的全过程，并记录，为自己的学习作个总结。关于ATK-DLRK3568 开发板，正点原子正在出教程，资料也开源，手册目前相对少一点，但不影响学习，因为主要是AI部分，所以基本要自己摸索。本篇从开发环境搭建开始记录，大部分在03【正点原子】ATK-DLRK3568_AI例程测试手册V1.0.pdf里有，具体要了解，可以去下载资料。虚拟机和系统自行安装，博主使用的是原子哥提供好的虚拟环境。

2023-10-06 22:21:13 1942 2

原创 Ai项目十四：基于 LeNet5 的手写数字识别及训练

pytorch复现lenet5模型，并检测自己手写的数字图片。利用torch框架搭建模型相对比较简单，但是也会遇到很多问题，网上资料很多，搭建模型的方法大同小异，在我尝试了自己搭建搭建出来模型，无论是训练还是检测都会遇到很多的问题，像这种自己遇到的问题，请教别人也没有用。

2023-10-03 17:10:24 238

原创 AI项目十三：PaddleOCR训练自定义数据集

若该文为原创文章，转载请注明原文出处。续上一篇，PaddleOCR环境搭建好了，并测试通过，接下来训练自己的检测模型和识别模型。

2023-09-30 22:04:33 1121 3

原创 AI项目十二：PaddleOCR环境搭建及测试

OCR识别分为两部分，一是检测出文字，二是识别出文字。PaddleOCR: 基于飞桨的OCR工具库，包含总模型仅8.6M的超轻量级中文OCR，单模型支持中英文数字组合识别、竖排文本识别、长文本识别。PaddleOCR是一款文本识别效果不输于商用的Python库！在RV1126上也部署成功了。后续将部署到RK3568等NPU板子上。

2023-09-30 09:14:40 576 2

原创 RV1126笔记四十一：RV1126移植LIVE555

在移植过程中有遇到几个问题，这里记录一下。未添加c++11支持打开config.myarmlinux在CPLUSPLUS_FLAGS后添加-std=c++11变量成员未找到找到BasicTaskScheduler.cpp，找到上面这段，修改test()为test_and_set()如有侵权，或需要完整代码，请及时联系博主。

2023-09-29 14:23:48 507

原创 AI项目十一：Swin Transformer训练

若该文为原创文章，转载请注明原文出处。续上一篇，训练自己的数据集，并测试。

2023-09-28 21:29:17 372

原创 AI项目十：Swin Transformer目标检测环境搭建

若该文为原创文章，转载请注明原文出处。

2023-09-28 21:06:45 755 5

原创 AI项目九：实例分割

计算机视觉分为四大基本任务(分类、定位、检测、分割)。而这里了解了一下实例分割。机器自动从图像中用目标检测方法框出不同实例，再用语义分割方法在不同实例区域内进行逐像素标记借一个浅显的说法：语义分割不区分属于相同类别的不同实例。例如，当图像中有多只猫时，语义分割会将两只猫整体的所有像素预测为“猫”这个类别。与此不同的是，实例分割需要区分出哪些像素属于第一只猫、哪些像素属于第二只猫。这里以猫为例，基本思路：目标检测+语义分割。

2023-09-26 07:02:52 191

原创 AI项目八：yolo5+Deepsort实现目标检测与跟踪（CPU版）

DeepSORT 是一种计算机视觉跟踪算法，用于在为每个对象分配 ID 的同时跟踪对象。DeepSORT 是 SORT（简单在线实时跟踪）算法的扩展。DeepSORT 将深度学习引入到 SORT 算法中，通过添加外观描述符来减少身份切换，从而提高跟踪效率。这是提供两个demo，一是跟踪计数人员；二是车辆计数跟踪；

2023-09-18 22:21:04 931

原创 AI项目七：WEB端部署YOLOv5

最近接触网页大屏，所以就想把YOLOV5部署到WEB端，通过了解，知道了两个方法：1、基于Flask部署YOLOv5目标检测模型。2、基于Streamlit部署YOLOv5目标检测。代码在github上，个人感觉两个比较好的，所以基于两份代码测试。Streamlit 是一个用于数据科学和机器学习的开源 Python 框架。它提供了一种简单的方式来构建交互式应用程序，使数据科学家和机器学习工程师可以更轻松地将他们的模型展示给其他人。st.write()：打印文本、数据框、图表等。st.title()

2023-09-12 23:05:15 2595 13

原创 AI项目六：基于YOLOV5的CPU版本部署openvino

通过openvino加速，CPU没有GPU下，从原本的20帧左右提升到50多帧，效果还可以，就是用自己的模型，训练出来的效果不怎么好。使用树莓派等嵌入板子使用openvino效果还可以。如有侵权，或需要完整代码，请及时联系博主。

2023-09-12 12:50:54 652 2

原创 AI项目五：结印动作识别

若该文为原创文章，转载请注明原文出处。

2023-09-10 14:40:52 234

原创 RV1126笔记四十：基于Zbar的二维码识别

为什么写二维码识别，二维码识别在日常生活中很常见到。相关的领域有很多，这里介绍一下，Wi-Fi 智能硬件配网什么是配网狭义上配网是指 WiFi 终端设备获取路由器的 SSID/password 等信息并与路由器建立链接的过程。实际上还有一个绑定的过程，即将设备与账户发送到云端进行绑定。1、一键配网（smart config）2、设备热点配网（AP 配网）3、蓝牙配网4、其他（语音识别/扫码识别）这里的扫码识别大部分为二维码识别，在嵌入式中常用的是Zbar.1、ZBar是什么。

2023-08-27 11:09:54 403