自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

GoCoding

Go coding in my way :)

  • 博客(65)
  • 收藏
  • 关注

原创 roop 视频换脸

roop: one click face swap. 只用一张人脸图片,就能完成视频换脸。本文是本地部署的实践记录。

2023-08-01 20:41:21 1323

原创 Flutter ncnn 使用

Flutter 实现手机端 App,如果想利用 AI 模型添加新颖的功能,那么 ncnn 就是一种可考虑的手机端推理模型的框架。本文即是 Flutter 上使用 ncnn 做模型推理的实践分享。

2023-07-18 22:27:03 492 1

原创 Stable Diffusion WebUI 环境

Stable Diffusion 是热门的文本到图像的生成扩散模型,本文介绍了如何准备其 WebUI 环境。

2023-06-13 14:07:58 527

原创 Casdoor 开始

Casdoor 是一个基于 OAuth 2.0 / OIDC 的中心化的单点登录(SSO)身份验证平台,本文是其安装和运行的实践记录。

2023-05-14 16:32:43 460

原创 RustDesk 远程桌面

是一款开源远程桌面软件。有云服务器的话,可以几分钟就搭一个,本文是搭建的记录。

2023-05-09 20:24:25 436

原创 RISC-V 软件环境

RISC-V 想玩起来,第一步,可以先准备软件环境。官方仓库的 GNU 工具链 riscv-gnu-toolchain 里,有 Spike pk 或 QEMU 的仿真环境,可以一次性把编译和仿真环境都准备好。

2023-02-06 09:58:38 220

原创 Isaac SDK & Sim 环境

Isaac 是 NVIDIA 开放的机器人平台

2022-12-02 21:27:56 856

原创 视频结构化 AI 推理流程

「视频结构化」是一种 AI 落地的工程化实现,目的是把 AI 模型推理流程能够一般化。它输入视频,输出结构化数据,将结果给到业务系统去形成某些行业的解决方案。

2022-09-23 23:17:26 872

原创 C++20 以 Bazel & Clang 开始

C++20 如何以 Bazel & Clang 进行构建呢?

2022-07-11 13:43:23 999 1

原创 Flex & Bison 开始

Flex 与 Bison 是为编译器和解释器的编程人员特别设计的工具,本文旨在让大家了解它们,以及它们能帮助我们完成什么样的工作。

2022-06-25 21:11:21 562

原创 TVM 加速模型,优化推断

TVM 是一个开源深度学习编译器,可适用于各类 CPUs, GPUs 及其他专用加速器。它的目标是使得我们能够在任何硬件上优化和运行自己的模型。不同于深度学习框架关注模型生产力,TVM 更关注模型在硬件上的性能和效率。本文只简单介绍 TVM 的编译流程,及如何自动调优自己的模型。更深入了解,可见 TVM 官方内容:文档: https://tvm.apache.org/docs/源码: https://github.com/apache/tvm编译流程TVM 文档 Design and Arch

2022-05-22 10:48:19 674

原创 FRP 内网穿透、反向代理

frp 是一个专注于内网穿透的高性能的反向代理应用,支持 TCP、UDP、HTTP、HTTPS 等多种协议。可以将内网服务以安全、便捷的方式通过具有公网 IP 节点的中转暴露到公网。本文将以暴露内网 Web 服务为例,实践 frp 的安装部署。更多应用场景,可见 frp 示例。安装frp 主要由 客户端(frpc) 和 服务端(frps) 组成,服务端通常部署在具有公网 IP 的机器上,客户端通常部署在需要穿透的内网服务所在的机器上。可以在 Github 的 Release 页面中下载到最新版本的客

2022-02-14 14:58:51 1331

原创 JoJoGAN 实践

JoJoGAN: One Shot Face Stylization. 只用一张人脸图片,就能学习其风格,然后迁移到其他图片。训练时长只用 1~2 min 即可。codepaper效果:主流程:本文分享了个人在本地环境(非 colab)实践 JoJoGAN 的整个过程。你也可以依照本文上手训练自己喜欢的风格。准备环境安装:AnacondaPyTorchconda create -n torch python=3.9 -yconda activate torchconda

2022-02-08 17:12:33 2000 3

原创 TensorRT 开始

TensorRT 是 NVIDIA 自家的高性能推理库,其 Getting Started 列出了各资料入口,如下:本文基于当前的 TensorRT 8.2 版本,将一步步介绍从安装,直到加速推理自己的 ONNX 模型。安装进 TensorRT 下载页 选择版本下载,需注册登录。本文选择了 TensorRT-8.2.2.1.Linux.x86_64-gnu.cuda-11.4.cudnn8.2.tar.gz,可以注意到与 CUDA cuDNN 要匹配好版本。也可以准备 NVIDIA Docker

2022-01-12 22:26:52 719 2

原创 React MobX 开始

MobX 用于状态管理,简单高效。本文将于 React 上介绍如何开始,包括了:了解 MobX 概念从零准备 React 应用MobX React.FC 写法MobX React.Component 写法可以在线体验: https://ikuokuo.github.io/start-react ,代码见: https://github.com/ikuokuo/start-react 。概念首先,ui 是由 state 通过 fn 生成:ui = fn(state)在 React 里,

2021-12-28 19:18:03 358

原创 PDF.js Electron Viewer

PDF.js 是基于 HTML5 解析与渲染 PDF 的 JavaScript 库,由 Mozilla 主导开源。本文旨在介绍 PDF.js 于 Electron 里如何开始使用,实际尝试了用其 API 或嵌入 HTML 的几种方式。代码: https://github.com/ikuokuo/electron-pdf-viewer.git从零准备项目项目采用 Electron React Antd PDF.js 来实现,以下是从零准备项目的过程。Electron React这里用 elec

2021-12-15 17:52:00 1459

原创 PDFium 渲染

PDFium 是 Chromium 的 PDF 渲染引擎,许可协议为 BSD 3-Clause。不同于 Mozilla 基于 HTML5 的 PDF.js,PDFium 是基于 Foxit Software (福昕软件)的渲染代码,Google 与其合作开源出的。此外,Qt PDF 模块也选用了 PDFium ,可见 QtWebEngine / QtPdf。本文将介绍如何用 PDFium 实现一个简单的 PDF 阅读器,代码见:https://github.com/ikuokuo/pdfium-read

2021-12-03 16:46:49 740

原创 OpenAPITools 实践

OpenAPITools 可以依据 REST API 描述文件,自动生成服务端桩(Stub)代码、客户端 SDK 代码,及文档等。其是社区版的 Swagger ,差异可见:OpenAPI Generator vs Swagger Codegen。本文将从零开始设计和编写 API 文件,并生成 Go Gin 服务端代码,与 Python SDK 代码。更多语言或框架,也是一样操作的。快速开始先熟悉下工具,直接用官方 Docker 镜像生成 Petstore 样例的 Go SDK 代码:docker r

2021-11-05 22:53:38 559

原创 K8s 开始

Kubernetes 是用于自动部署,扩展和管理容器化应用程序的开源系统。本文将介绍如何快速开始 K8s 的使用。了解 K8sKubernetes / Overview搭建 K8s本地开发测试,需要搭建一个 K8s 轻量服务。实际部署时,可以用云厂商的 K8s 服务。本文以 k3d 为例,于 macOS 搭建 K8s 服务。于 Ubuntu 则推荐 MicroK8s。其他可替代方案有:Kubernetes / Install Toolskind, minikube, kubeadm

2021-09-18 20:31:45 12366

原创 RTSP H264/HEVC 流 Wasm 播放

本文将介绍 RTSP H264/HEVC 裸流如何于网页前端播放。涉及 WebSocket 代理发送流数据, Wasm 前端解码等。代码: https://github.com/ikuokuo/rtsp-wasm-player相关模块:# RTSP WebSocket ProxyRTSP/Webcam/File > FFmpeg open > Packets > WebSocket# WS Wasm PlayerWebSocket > Packets > Was

2021-09-08 17:32:50 2085

原创 FFmpeg 播放 RTSP/Webcam 流

本文将介绍 FFmpeg 如何播放 RTSP/Webcam/File 流。流程如下:RTSP/Webcam/File > FFmpeg open and decode to BGR/YUV > OpenCV/OpenGL display代码: https://github.com/ikuokuo/rtsp-wasm-player, 子模块 rtsp-local-playerFFmpeg 准备git clone https://github.com/ikuokuo/rtsp-wasm

2021-08-30 14:28:02 983

原创 Ory Kratos 用户认证

Ory Kratos 为用户认证与管理系统。本文将动手实现浏览器(React+AntD)的完整流程,实际了解下它的 API 。代码: https://github.com/ikuokuo/start-ory-kratos了解 Kratos获取代码git clone -b v0.7.0-alpha.1 --depth 1 https://github.com/ory/kratos.git查看 APIgo-swagger 查看:cd kratosswagger serve -F=swagg

2021-07-29 20:05:39 1106

原创 RTSP H264 流 MSE 播放

elsampsa/websocket-mse-demo 项目介绍:It this demo we’re streaming live video from an RTSP camera to your HTML5 browser.Video is streamed as H264 encapsulated in MP4. No transcoding takes place in the stream-to-browser pipeline. No browser-side flash or pure

2021-07-16 23:50:10 566

原创 可微渲染 SoftRas 实践

SoftRas 是目前主流三角网格可微渲染器之一。可微渲染通过计算渲染过程的导数,使得从单张图片学习三维结构逐渐成为现实。可微渲染目前被广泛地应用于三维重建,特别是人体重建、人脸重建和三维属性估计等应用中。安装conda 安装 PyTorch 环境:conda create -n torch python=3.8 -yconda activate torchconda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pyto

2021-06-19 10:12:47 1262 1

原创 Supervisor 开始

Supervisor 是 Linux/Unix 操作系统上的进程管理工具。本文介绍了于 Ubuntu 18 上如何使用 Supervisor 开机启动、保活守护自己的服务进程。安装建议系统方式安装,可开机启动。sudo apt install supervisor -ySystemd 查看服务状态:$ sudo systemctl status supervisor● supervisor.service - Supervisor process control system for UNIX

2021-06-08 22:34:45 127 1

原创 OpenCV 查找轮廓

本文将结合实例代码,介绍 OpenCV 如何查找轮廓、获取边界框。代码: contours.pyOpenCV 提供了 findContours 函数查找轮廓,需要以二值化图像作为输入、并指定些选项调用即可。我们以下图作为示例:二值化图像代码工程 data/ 提供了小狗和红球的二值化掩膜图像:其使用预训练好的实例分割模型来生成的,脚本可见 detectron2_seg_threshold.py。模型检出结果,如下:模型用的 Mask R-CNN 已有预测边框。但其他模型会有只出预测

2021-06-07 23:25:29 2852 8

原创 ONNX 开始

环境基础Anacondaconda create -n onnx python=3.8 -yconda activate onnx# ONNX# https://github.com/onnx/onnxconda install -c conda-forge onnx -ypython -c "import onnx; print(onnx.__version__)"import onnxmodel = onnx.load("model.onnx")简化# ONNX Si

2021-06-03 09:37:13 348

原创 Linux 性能相关工具

来自 Netflix 性能优化大牛 Brendan Gregg 的整理。观测分析测试调优参考Linux Performance

2021-04-25 23:13:00 55

原创 Prometheus + Grafana 快速上手

Prometheus + Grafana 快速上手,监控主机的 CPU, GPU, MEM, IO 等状态。前提Docker客户端Node Exporter用于采集 UNIX 内核主机的数据,这里下载并解压:wget https://github.com/prometheus/node_exporter/releases/download/v1.1.2/node_exporter-1.1.2.linux-amd64.tar.gztar xvfz node_exporter-1.1.2.li

2021-04-23 21:29:16 235

原创 RTSP 流相关工具介绍

RTSP (Real Time Streaming Protocol),实时流协议,是一种应用层协议,专为流媒体使用。本文将介绍 GStreamer, VLC, FFmpeg 这几个工具,如何发送、接收 RTSP 流。前提Ubuntu 18.04 LTS (Bionic Beaver)GStreamer安装:sudo apt install libgstreamer1.0-0 gstreamer1.0-plugins-base gstreamer1.0-plugins-good gstream

2021-04-21 21:25:16 1938

原创 TensorFlow Serving

TensorFlow Serving 可以快速部署 Tensorflow 模型,上线 gRPC 或 REST API。官方推荐 Docker 部署,也给了训练到部署的完整教程:Servers: TFX for TensorFlow Serving。本文只是遵照教程进行的练习,有助于了解 TensorFlow 训练到部署的整个过程。准备环境准备好 TensorFlow 环境,导入依赖:import sys# Confirm that we're using Python 3assert sys.

2021-04-15 19:11:08 255

原创 TensorFlow 的 JupyterLab 环境

TensorFlow 准备 JupyterLab 交互式笔记本环境,方便我们边写代码、边做笔记。基础环境以下是本文的基础环境,不详述安装过程了。UbuntuUbuntu 18.04.5 LTS (Bionic Beaver)ubuntu-18.04.5-desktop-amd64.isoCUDACUDA 11.2.2cuda_11.2.2_460.32.03_linux.runcuDNN 8.1.1libcudnn8_8.1.1.33-1+cuda11.2_amd64

2021-04-14 09:09:08 401

原创 TorchVision Faster R-CNN 微调,实战 Kaggle 小麦检测

本文将利用 TorchVision Faster R-CNN 预训练模型,于 Kaggle: 全球小麦检测 ???? 上实践迁移学习中的一种常用技术:微调(fine tuning)。本文相关的 Kaggle Notebooks 可见:TorchVision Faster R-CNN FinetuningTorchVision Faster R-CNN Inference如果你没有 GPU ,也可于 Kaggle 上在线训练。使用介绍:Use Kaggle Notebooks那么,我们开始

2021-03-04 09:30:39 1911 9

原创 TorchVision 预训练模型进行推断

torchvision.models 里包含了许多模型,用于解决不同的视觉任务:图像分类、语义分割、物体检测、实例分割、人体关键点检测和视频分类。本文将介绍 torchvision 中模型的入门使用,一起来创建 Faster R-CNN 预训练模型,预测图像中有什么物体吧。import torchimport torchvisionfrom PIL import Image创建预训练模型model = torchvision.models.detection.fasterrcnn_resnet

2021-02-26 09:34:44 1133 1

原创 PyTorch 自定义数据集

准备数据准备 COCO128 数据集,其是 COCO train2017 前 128 个数据。按 YOLOv5 组织的目录:$ tree ~/datasets/coco128 -L 2/home/john/datasets/coco128├── images│ └── train2017│ ├── ...│ └── 000000000650.jpg├── labels│ └── train2017│ ├── ...│ └── 00

2021-02-24 10:24:27 265

原创 PyTorch 于 JupyterLab 的环境准备

PyTorch 是目前主流的深度学习框架之一,而 JupyterLab 是基于 Web 的交互式笔记本环境。于 JupyterLab 我们可以边记笔记的同时、边执行 PyTorch 代码,便于自己学习、调试或以后回顾。本文将介绍这样的环境如何进行准备。了解更多:PyTorch 官方文档JupyterLab 交互式笔记本安装 AnacondaAnaconda: https://www.anaconda.com/products/individual#Downloads北外镜像源: https

2021-01-21 14:32:21 546

原创 MMSkeleton 快速开始,使用 WebCam 测试

本文将引导快速使用 MMSkeleton ,介绍用摄像头测试实时姿态估计。MMSkeleton: https://github.com/open-mmlab/mmskeleton安装首先安装 MMDetection ,可见 MMDetection 使用。然后安装 MMSkeleton ,# 启用 Python 虚拟环境conda activate open-mmlab# 下载 MMSkeletongit clone https://github.com/open-mmlab/mmske

2021-01-19 16:30:01 959 2

原创 Docusaurus2 快速建站,发布 GitHub Pages

Docusaurus2 可快速搭建文档、博客、官网等网站,并发布到 GitHub Pages, Serverless 等。我们只需 Markdown 写写内容就行,也可直接编写 React 组件嵌入。而 SEO、搜索、版本等都友好支持了。另外重要的一点是此项目是 Facebook 开源维护的,他们自己也在用,所以质量、长久性能有所保证。代码: https://github.com/ikuokuo/start-docusaurus2演示: https://ikuokuo.github.io/star

2021-01-14 22:10:21 692

原创 Detectron2 快速开始,使用 WebCam 测试

本文将引导快速使用 Detectron2 ,介绍用摄像头测试实时目标检测。Detectron2: https://github.com/facebookresearch/detectron2环境准备基础环境Ubuntu 18.04系统安装,可见 制作 USB 启动盘,及系统安装Nvidia Driver驱动安装,可见 Ubuntu 初始配置 - Nvidia 驱动Anaconda Python从这里下载 Linux 版本,并安装Detectron2安装,#

2021-01-12 23:08:14 921

原创 Scaled-YOLOv4 快速开始,训练自定义数据集

代码: https://github.com/ikuokuo/start-scaled-yolov4Scaled-YOLOv4代码: https://github.com/WongKinYiu/ScaledYOLOv4论文: https://arxiv.org/abs/2011.08036文章: https://alexeyab84.medium.com/scaled-yolo-v4-is-the-best-neural-network-for-object-detection-on-ms-c.

2021-01-09 19:32:00 1179

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除