自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(98)
  • 收藏
  • 关注

原创 Stable Diffusion从原理到应用-数学原理

Stable Diffusion数学原理

2023-04-22 11:28:30 465 1

原创 Mask2Former源码解析

Mask2Former 源码解析

2022-11-05 17:48:07 2521 5

原创 MaskFormer源码解析

MaskFormer源码解析

2022-07-07 16:51:28 3661 2

原创 编程入门-解惑

最近x音的算法不知道从哪里得知我可能会关注编程,就开始疯狂给我推送python入门课程这类的视频和直播,秉着看热闹的心态它给我推我就看,顺带看看老师的水平如何,既然开始写这篇文章了就知道肯定是被那些python“老师们”刺激的不行,如鲠在喉不吐不快!!!e.g. 有个python课程的老师说“python里所有的数字都是从0开始的,所以你不论写什么,遇到数字直接减1就可以了”(她原话,我就不说哪位小可爱帮她引流了),敢不敢专业一丁点啊?这和前段时间有个财经培训的平台公开说“主动基金就是你主动买的基金,被

2022-05-17 21:35:28 238

原创 Pytorch单机多卡加速

忙了两个月从收到原始数据到最后在工程项目中加载成功完成测试,好像从元旦上班后就再没休息过,昨天项目通过三期评审终于可以喘口气补点作业了。(年前写的文章,今天转过来了)多卡并行一定要使用torch.nn.parallel.DistributedDataParallel() torch.nn.parallel.DistributedDataParallel() torch.nn.parallel.DistributedDataParallel()重要的事情要说三遍!千万不要使用torch.nn.

2022-02-09 15:55:55 1497

原创 强化学习入门-AI玩马里奥

小时候的暑假就是等爸妈上班后迫不及待的找出被爸妈藏起来的小霸王,接通电视、插上999in1(看不懂的请自行百度????)、上上下下AABB一通操作……转眼间小霸王、walkman、CD爸妈不用藏我也找不到了,仅以此篇缅怀我逝去的童年~也写给有一定编程基础想看看AI的结果又不知道该怎么办的童鞋们~先给一张定妆照 我玩游戏VS我的代码玩游戏 假设你听说过AI知道如何运行*.py文件

2021-09-10 14:43:05 1745 9

原创 ITK简单封装-实现重采样

吐槽一下先吐槽一下,网络上能找到的例子基本上都是基于官网的例子,官网链接 。偶尔找到质量高点的,但是不按照他给出的代码原样照搬依然有问题(因为要封装就要解耦,一旦解耦就出问题????)。在实际开发中,特别是在同别的接口对接的时候很少会直接从硬盘加载数据,都是直接接收调用者给出的内存数据,或者直接处理后给出处理结果(你要是让人家先写硬盘,你再从硬盘加载,或者反过来,我敢保证你老大不打死你也得骂死你????)流程利用itk::ImportImageFilter从内存中读取数据流,生成itk::Image

2021-05-14 13:44:34 425 1

原创 使用CenterNet做目标检测

前言之前写过一篇CenterNet源码结构解析,能看到官方的源码结构有点复杂,虽然已经剖析过了但是真到实际应用中查找细节的时候还是比较麻烦的,虽然文章中也列出了另外一个简单实现,但是个人感觉结构依然不是太清晰,所以基于这个简单实现的源码进行了重构,主要修改的地方:将数据增强部分写成了一个类,基于imgaug包实现;去掉了基于coco数据集的依赖,改成解析自己的数据集,数据集的格式变得很简单,格式如下:“文件路径 x1,y1,x2,y2,class_id x1,y1,x2,y2,class_id"

2021-05-10 13:21:26 912 4

原创 医疗影像处理入门篇读入*.mhd数据&解析ElementSpacing参数

关于Dicom数据使用pydicom包即可,网上有很多写的比较详细的,我就不搬运了,不了解的还请自行百度读取*.mhd数据有一些数据集提供的是mhd格式的数据,还有一些是*.nii.gz的数据,这些格式的数据可以使用SimpleITK包来读取,首先安装SimpleITK。mhd文件夹内会有一个同mhd同名的.raw文件,这个就是我们的数据文件,加载的时候只需要提供 *.mhd的文件路径即可,可以使用记事本打开查看:ObjectType = ImageNDims = 3BinaryDat

2021-04-21 22:02:18 4105 3

原创 解决戴尔T640安装显卡后风扇狂飙

吐槽一下戴尔的官方先,还是白金专业支持,回我的就一句话:“不建议安装第三方独立显卡”。呵呵,那就是我必须买你的v100呗!供应商的支持工程师也就一句话,网上的教程需要改底层硬件参数,不建议这么做!(真实想法:我反正不会帮你弄的,你自己能搞就搞,以后出问题了也别找我!)现在做生意的都这么拽吗!!!!问题描述T640服务器,ubuntu20.04的系统,在安装了3090显卡后风扇狂飙,根本没运行任何作业!解决方案在网上找了一圈,都是抄之前的一篇文章的,需要安装racadm,然后敲命令。但可悲的是网上给

2021-04-15 19:21:05 2960 1

原创 计算机基础知识(2)

硬盘上篇内存说完了,其实硬盘也就基本说完了。直观上看硬盘的容量远大于内存,比如现在的常见的机械硬盘“起步价”就已经1T了,固态512G、1T也都是已经飞入寻常百姓家。硬盘和内存除了在容量上的区别,另外一个最大的区别就是内存里的数据都是临时数据,你的电脑一旦断电内存里的数据就木了,但是内存的存取速度很高,CPU只和内存发生数据交换(这句话不能理解也不用纠结啦~);硬盘则刚好相反,硬盘里的数据一旦写入就不会丢失了(否则当年冠希哥也不至于……),但是硬盘的读写速度很慢(与内存比较)。有了这个认识,我们买电脑的.

2021-03-18 20:05:04 121

原创 计算机基础知识(1)

前言最近看了几篇数学的科普文章,感觉写的很好,全篇没有公式符号却也能把概念用大众能理解的方式讲清楚,收益匪浅!以前也一直有写点科普文章的想法,只是一直碍于工作太忙(借口,你懂的~),今天算是下决心了,先把基础知识的写了。后续可能还会写计算机体系结构(你的电脑里那些硬件都是神马,是如何工作的)、计算机网络(你在刷抖音、看优酷、聊天的时候都发生了神马)、密码学介绍(你咋知道和你聊天的那个人的确是那个人?网上说的密码破解真的那么容易?)、编程知识基础(额~ 貌似你已经在被“你要偷偷学python,然后惊艳所有

2021-03-18 09:16:06 166

原创 解锁新姿势-使用TensorRT部署pytorch模型

一、整体流程概览使用pytorch训练模型,生成*.pth文件将*.pth转换成onnx模型在tensorrt中加载onnx模型,并转换成trt的object在trt中使用第三步转换的object进行推理二、pth转换成onnx转换的具体步骤请参考我之前的文章<使用NCNN在移动端部署深度学习模型>需要特别说明的地方在于关于onnx支持的操作算子问题,目前onnx的最新版本已经基本支持绝大部分的pytorch操作符,但是由于最终是要在tensorrt下运行的,所以需要了

2021-02-19 13:22:00 1781 10

原创 win10下编译GANet

环境:vs2017 pytorch1.5 cuda10.1github地址:https://github.com/feihuzhang/GANet源码中给出的是在linux下的编译步骤,没提win10的事情,自己搞了下编译通过,记录一下。首先,源码根目录下的compile.sh文件是给linux准备的,在windows上直接运行的话…,手动搞吧。编译GANet首先配置好你的cuda目录,在你的环境变量中设置好CUDA_PATH,然后打开你的cmdcd GANet\libs\GANetpytho

2021-01-05 16:57:41 1080 11

原创 CenterNet源码结构解析

CenterNet :Objects as Points网上已经有很多关于CenterNet理论方面的解读,我就不再搬运了,我只是发现几乎大神们都忽略了一个事实从公式到代码实现其实并不总是一件很简单的事情,所以我试着从源码的整体实现框架进行解析。第一次写这类型的文章,如有解释不妥或不清晰的地方还请指出,我来修改。由于官方源码其实是实现了几个不同的任务,本篇以目标检测为例进行解析,其余的代码结构几乎都一致,相当于官方源码给出了一个通用框架,我们平时做项目的时候也可以借鉴。CenterNet的源码中使用到

2020-12-30 20:15:24 1895

原创 日常填坑-DCNv2+pytorch1.7+vs2017编译

由于换工作已经很久没写文章了,今天写换工作后的第一篇文章 在win10+pytorch1.7下编译DCNv2这个东东。去github上下载最新的DCNv2源码(如果你的初心是为了运行CenterNet,辣么用新下载的替换掉CenterNet里自带的DCNv2文件夹)开始折腾:定位到你的 ‘torch/utils/cpp_extension.py’文件(一般在你的python安装目录site-packages文件夹下)定位到1374行,将源码command = [‘ninja’, ‘-v’] 修改

2020-11-26 17:56:22 6950 20

原创 解决安装cython_bbox“无效的数值参数“/Wno-cpp”“的错误

从git上下载源码打开setpup.py修改第32行原始代码:ext_modules = [ Extension( name='cython_bbox', sources=['src/cython_bbox.pyx'], extra_compile_args=['-Wno-cpp'], include_dirs=[numpy_include] )]修改成:ext_modules = [ .

2020-09-10 10:43:53 857 3

原创 条件随机场CRF之从公式到代码

前言基础的理论推导我就不再搬运了,网上有很多大大们写的都很好,但是我发现文章基本分成了两类,一类讲理论讲的特别好,但是缺少了与实际代码的结合;一类讲实践,主要是如何使用顺带提一下公式,主要是默认读者已经对公式烂熟于心了。所以我想做个桥梁,结合公式和代码实现把CRF捋一遍。对于理论还不是很熟的童鞋请参考文章最后的引用链接,讲的非常详细。文章中使用的代码来自于pytorch官方文档:https://pytorch.org/tutorials/beginner/nlp/advanced_tutorial.htm

2020-08-09 22:06:06 509

原创 基于生成函数的外呼模块数量模型

背景:近日朋友公司接到一个外呼任务,利用他们自研的机器人在规定时间内要把一定数量的外呼电话全部打完,一个机器人一次只能拨打一个电话。以下是我对问题的抽象和给出的模型,可能存在错误的地方,如有发现还请指出,多谢!问题描述总共有N通电话要打;配置m个号百模块,由于电信的限制,每个模块100秒内最多只能打12通电话,假设每通电话通话时长小于100s,每天打10个小时,一个模块满负荷下每天可以拨打 10 * 3600 * 12 / 100 = 4320通电话;假设每通电话的平均接听率为p,未接听电话需要

2020-08-03 22:58:24 253

转载 通俗易懂的讲解梯度,散度,旋度

通俗易懂的讲解梯度,散度,旋度(有图很好理解)!!! 并且会不断连载原创或转载有价值的参数化软件教程返回搜狐,查看更多声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。 ...

2020-07-03 17:28:20 1109

原创 使用NCNN在移动端部署深度学习模型

整体流程概览使用pytoch训练模型,

2020-06-24 18:38:24 5257

原创 日常填坑之win10 + vs2017 MNN编译

在参考了N多文档,走了N多弯路后终于看见“MNNConvert.exe”文件了,时间都耽误在编译这个转换工具上了,感谢https://uzshare.com/view/810473这篇文章的作者,但是这篇博客并没有把编译转换工具的流程加进去,所以只好根据官方文档自力更生。不说废话了 3, 2, 1 走……准备工作cmake-3.17.1-win64,解压后将cmake-3.17.1-...

2020-04-30 11:54:45 1612

原创 c++人脸识别-vs2017 + dlib19.19

dlib下载从官网下载最新版的压缩包解压后得到

2020-04-22 20:01:10 1681 2

原创 记一次算法面试题

前几天收到了某所AI算法岗的面试邀请,被要求24小时内做完4道编程题,可以上网搜、找人帮忙,提交可执行代码和解题思路。除了参加比赛和当年研究生复试,就再也没被要求过写算法代码了,好吧反正解题也好玩,就写呗。晚上九点才拿到题,大致扫了一眼,前三题都不难,第一题考察位运算、第二题贪心算法、第三题类似动态规划也不难,不到12点就搞定了外加解题文档,第四题是按规则生成给定的序列,看着也还行,需要用回溯算法...

2020-02-26 10:27:56 270

转载 AIZOO开源人脸口罩检测

帮一个创业的小伙伴转的他们自己开源的一个人脸戴口罩检测模型,效果还不错,支持一下,嘿嘿!原文链接在此近一个月来,新冠肺炎疫情牵动着全国人民的心,一线医护工作者在最前线抗击疫情的同时,我们也可以看到很多科技行业和人工智能领域的从业者,也在贡献着他们的力量。近些天来,旷视、商汤、海康、百度都多家科技公司研发出了带有AI人脸检测算法的红外测温、口罩佩戴检测等设备,依图、阿里也研发出了通过深度学习来...

2020-02-19 13:54:11 2771

原创 python装饰器应用之keras数据生成器

这里仅仅是装饰器的一个简单应用,与平常唯一不同的地方就是我把装饰器写在了类的外部,而且装饰器内部还调用了类中的方法。只要在wrapper参数里加上self即可。还是直接看代码吧,这是我用于ocr训练的数据生成器。def generate(func): def wrapper(self, *args, **kwargs): index_all, batch_size = f...

2020-02-12 22:34:49 228

原创 日常填坑之keras.backend.ctc_batch_cost参数问题

InvalidArgumentError sequence_length(0) <=30错误下面的代码是在网上绝大多数文章给出的关于k.ctc_batch_cost()函数的使用代码def ctc_lambda_func(args): y_pred, labels, input_length, label_length = args # the 2 is critical...

2020-02-11 23:30:40 3953 9

原创 基于MSCNN的人群密度估计之MSCNN

密度等级分类网络基于MSCNN的人群密度估计:概述和生成人群密度图数据集制作和数据生成器密度等级分类网络MSCNN的训练和预测

2020-02-04 22:41:05 2500 13

原创 基于MSCNN的人群密度估计之密度等级分类网络

密度等级分类网络基于MSCNN的人群密度估计:概述和生成人群密度图数据集制作和数据生成器密度等级分类网络MSCNN的训练和预测分类目标密度分类网络的目的是根据数据集的情况先将图片进行粗略分类,过滤出不同等级的人员密度,减轻人数估计网络训练的难度和提高准确度。密度等级被分成3类,分别为无(图片中不包含人)、低密度(图片中包含1到99个人)、高密度(人数大于100),使用0,1,2作...

2020-02-03 21:35:54 1517 3

原创 基于MSCNN的人群密度估计之数据集制作

数据集制作基于MSCNN的人群密度估计:概述和生成人群密度图数据集制作和数据生成器密度等级分类网络MSCNN的训练和预测生成数据集人群密度数据标记在labelme中选择“points”对图片中的人头进行标记,标签随便填, 我记的是"crow";解析第一步生成的json文件,生成所需的数据集;json文件格式如下:{ "version": "3.21.1", ...

2020-02-03 12:27:22 2699 13

原创 基于MSCNN的人群密度估计之生成人群密度图

终于到了在家躺着都是给国家做贡献的时候(手动捂脸),对人员密集场所的监控和自动报警也算是对疫情的一份贡献吧,哈哈!项目地址:https://github.com/zzubqh/CrowdCount,如果你感觉有点用就帮不点个start吧 ????人群密度估计算法传统的人群计数方法基于检测和回归的方法基于密度图的方法深度学习的方法深度学习的方法在目标检测、识别、分割相比传统的方法都取得...

2020-02-03 00:28:02 6340 16

原创 CTPN训练集准备

去down vgg_16.ckpt预训练模型准备一堆你需要训练的图片,使用labelme进行标注,得到一堆json文件json文件大致如下:{ "flags": {}, "shapes": [ { "label": "str", "line_color": null, "fill_color": null, "points"...

2019-12-03 18:54:16 1528 24

原创 利用泊松分布评估并发量

之前一直有人说学数学干嘛,买菜又不需要求导!现在我有答案了,买菜的确不需要学数学,但是怼人需要啊!直接用数据让对方闭嘴,而且是哑口无言彻彻底底的闭嘴!运营的那些人可能是压根分不清并发和在线人数,验收标准有一项并发达到500,那么我只想告诉他并发500是个什么概念!“对方不想和你说话,并向你扔了一个泊松分布”================= 好好说话===============假设在晚6点到...

2019-11-27 14:33:09 885

原创 求解带约束的最优化问题

首先感谢《利用Python求解带约束的最优化问题》让我不用自己重0开始敲代码了!不过就是效率有点慢了,还在解决中,至少问题有解了~=================== 问题描述 =======================昨天项目例会上产品提了一个看似很正常但是细想却很棘手的要求,在前端页面上展示出来的内容如果仅仅只有分割网络的结果会很奇怪,对用户的体验不好,他需要在包含目标的bbox基础...

2019-11-22 17:22:21 1669

原创 写给需要同程序员打交道的计算机小白们之妹纸&汉纸

引子1:A:“您好,请问您们那边的sb系统的环境好了吗?我们这边调用失败呢,还请帮忙看看,谢谢!”B:“好滴,我马上去查”B:“cc, 在吗?刚甲方说他们的什么调用失败,让我看看环境,什么环境啊?调用是什么啊?为什么要我看,我看什么啊?”CC:“就是咱们公司的sb系统,咱们给甲方提供的有功能调用,他们要调咱们的API”B:“API是什么啊,怎么调?”CC:“……”引子2:A:“您好...

2019-10-25 09:17:43 3205

原创 基于K-means的HSV颜色空间聚类

主题色提取,轮廓分割(粗略的)都是这玩意儿。打标签打的我开始怀疑人生了,人生第一次对自己是不是色盲产生了怀疑,由于人眼的视觉暂留现象,当对样本的颜色标记稍微一多,就分不清红,淡红,紫,青,连黑都会怀疑。这些样本是要用来训练神经网络的,自然在打标签阶段是没法使用有监督的算法的,辣么只好请聚类算法帮帮忙啦,给我个大体颜色,辅助我判别颜色即可。当然,用这个来做粗略的图片分割也还行,精确的语义分割还是使用...

2019-10-22 17:48:31 3083

原创 python多进程实践

由于训练集样本数量实在太少了,同事在网上爬了550W+的图片URL,仅仅存url的txt文件就500M了,辣么问题来了,如果下载一个url保存一次,不知道到何年月能把这550W的图片全部down下来了。解决思想就是,多进程同时去down,让cpu、网卡、硬盘并行工作,但是考虑到磁盘I/O的效率超级慢,所以就攒一批后集中写入。硬件配置I7-7700 4核8线程,32G内存,总共用时大概4小时30分钟...

2019-10-12 10:01:28 243

原创 python实现树结构并显示

因为需要查表,但是关键字有各种组合非常烦,为了不写一堆的if else决定弄个搜索树,叶子节点就是我要的结果,路径就是表中的关键字组合。之前都是用指针实现的各种链表 图 树,换成python后忽然不知道怎么办了。在网上搜了下,用python的list来实现,不过网上几乎都是二叉树的实现,木法只好自己写啦。这是按我的需求写的,如果要直接还得按实际情况略作修改。树的显示使用graphviz这个包,不...

2019-09-18 11:28:36 4013 14

原创 再论颜色校正-白平衡之动态阈值 Python和c#实现

理论我就不写了,可以参考<一种动态阈值白平衡算法实现>,公式部分写的还比较详细,我就不赘述了。只是网上我搜到的这个算法的实现只有java和c++版本的,所以就自己写了python版本的,只是对于理论上说的把图像分块计算我还没实现,可能是我理解有问题,分块后的效果很差,所以就没实现。如果有人知道的话还请给我说一声,谢谢!顺带说一声,直接用cv2的颜色转换函数将bgr转成YCrCb空间的...

2019-05-29 16:54:09 2304 6

转载 CTC算法详解之训练篇

转载本文请注明出处:https://xiaodu.io/ctc-explained 作者:yudonglee ...

2019-05-14 17:05:34 4672 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除