- 博客(71)
- 资源 (12)
- 收藏
- 关注
原创 caffe转onnx
input_shape = [int(x) for x in args.input_shape] #模型输入尺寸。源码需要依赖caffe的python接口。
2023-08-01 11:49:48 423
原创 CUDA卷积算子手写详细实现
卷积操作主要针对图像进行运算,我们常见的RGB即为三通道的二维图像,那么就可以通过一个一维数组存储所有的数据,再按照不同的布局去索引对应的数据,现在主要使用nchw和nhwc两种数据布局,其中n - batch size 也可以理解为"图像"数量c - channel num 即我们说的通道数量h - height 图像高度,每个通道的高度宽度是一致的w - width 图像宽度那么显然nchw就是逐个通道的读取图像,nhwc即对所有通道的同样位置读取数据后,再切换到下一个为止。
2023-08-01 11:40:34 260
原创 visual studio 2022 编译时出现MSB3721问题
排查问题发现,系统在编译时,会向临时文件存放在C:\Users\中文名\AppData\Local\Temp 这个路径下。先下载了nvidia的示例,cmake编译发现在cmake时也出现了错误,后面发现出现了中文路径。后面直接在用户环境变量中更改 TEMP和TMP的路径,路径自己创建文件放置,中间不要出现中文。这个路径中出现了中文,当时公司给我创建账号时直接用了我的中文名字。本来没更新时11.1cuda没有出现任何问题,现在出现了。但三种方法都试过了,没有用。今天在公司大佬的帮助下。
2023-08-01 11:27:12 761
原创 caffe源码简单解析——Layer层
老实说,caffe中的layer层代码比较多,各种抽象看起来比较绕。官方关于Layer的教程写的很清楚,我根据这个文档,简单画了个图,再理解起来就方便了一些。layer.hpp和layer相关的头文件有:common_layers.hppdata_layers.hpplayer.hpploss_layers.hppneuron_layers.hppvision_
2016-03-23 16:45:54 684
原创 caffe源码简单解析——Blob(1)
使用caffe也有一段时间了,但更多是使用Python的接口,使用现有的ImageNet训练好的模型进行图片分类。为了更好的了解caffe这个框架,也为了提高自己的水平,在对卷积神经网络有了一些研究之后,终于开始研读caffe的源码了,今天看了Blob类的一些内容,做个总结。看过caffe官方文档的话,应该会知道,它可以分为三层:Blob、Layer、Net。Blob是一个四维的数组,用于存储
2016-03-23 16:42:40 604
原创 Caffe安装记录
最近一段时间在深度学习框架caffe,看了它官方的文档和一部分代码,结合以前一些基本的神经网络知识,算是有了个大概的认识。在自己本机上ubuntu14.04上很容易配置好caffe的依赖环境,下载了一个训练好的ImageNet分类模型,写了几个python小脚本跑起来做图像分类。目前跑了10W多张,从所分类别的结果看,还不错,但要进一步验证准确性,就需要投入一些人力去辨别了,而辨别前,需要搭建一定
2016-03-23 16:40:36 2446
原创 机器人书籍大全
OHM 机器人竞技系列介绍:本书是引进日本OHM社版权,翻译出版的“机器人竞技系列”之一。 本书介绍了日本举办的全国性机器人大赛的有关信息,参赛机器人的基本结构、制作方法,以及制作所有材料。书后给出了书中所用到的零部件的生产厂家及商品名称。 本书可作为大、中、小学生参加竞技机器人大赛或制作竞技机器人的参考手册,也可供广大青少年竞技机器人爱好者阅读参考。 机器人C语言机电一体化接口
2015-07-24 16:21:51 1967
原创 基于面部特征识别的疲劳检测系统设计实现
1.研究背景与意义 疲劳检测在现实生活中具有很大的意义和实用价值,也是一个值得进一步完善研究的课题。2.研究目标 本设计目标在于利用Matlab强大的图像处理能力和实用便捷的编程方法,通过处理包含人脸的视频图像,识别分析面部特征,从而得到比较准确的疲劳状况。3.系统软件设计框架 基于肤色的人脸检测与提取算法流程;
2015-06-07 11:04:55 4732 10
原创 人脸特征点定位与检测
前两周研究了一点关于人脸表情识别的文章,很多方法都是基于在提取人脸特征点的基础上完成的,然后利用网格模型或者形变模型对特征点进行分析和检测以及分类的方法实现对人脸表情的识别,可以看出人脸关键点(特征点)的提取与定位在人脸表情识别占有很重要的地位,决定画1-2周时间研读一些人脸关键点提取的文章,本周主要调研了人脸特征点检测、定位和人脸校准的算法:人脸特征点检测的方法主要看了ASM(Active
2015-06-07 10:55:34 11768 1
原创 机器学习实战
机器学习实战ByMatlab(1):KNN算法KNN 算法其实简单的说就是“物以类聚”,也就是将新的没有被分类的点分类为周围的点中大多数属于的类。它采用测量不同特征值之间的距离方法进行分类,思想很简单:如果一个样本的特征空间中最为临近(欧式距离进行判断)的K个点大都属于某一个类,那么该样本就属于这个类。这就是物以类聚的思想。当然,实际中,不同的K取值会影响到分类效果,并且在K个临近点的
2015-06-01 09:02:05 1603
原创 人脸表情识别文献阅读
本周主要继续研读了两篇外文人脸表情识别的文章,都是IEEE上的文章,都比较长,一共40几页,所以就读了两篇。以及利用opencv中Philipp Wagner写的人脸识别的源代码。以及利用flandmark检测人脸上的关键点点。主要还是利用opencv中HaarClassifierCascade分类器完成的。还有就是利用opencv自带的分类器做了人脸识别的小实验。 第一篇文章是2007年
2015-06-01 09:01:30 2985
原创 人脸表情识别经典论文
主要是重点研究了四篇人脸表情识别的paper。分别是一篇中文中文文献:2006年清华大学朱健翔发表在《光电子·激光》上面的文章《结合Gabor特征与Adaboost的人脸表情识别》。三两篇外文文献:2014CVPR上面的文章《Facial Expression Recognitionvia a Boosted Deep Belief Network》和06年CVPR上的文章《3D Facial E
2015-05-22 16:57:30 6688
原创 人脸表情识别相关研究
1. 国内外研究人脸表情识别的公司与产品介绍现在,国内外都有人脸识别的相关产品,尤其在美国,已经能够通过机器人识别人脸表情,还能推断人的年龄等。而在国内,以杭州热知科技为代表的主要是生产人脸识别和表情识别的嵌入式设备。国外: 1.美国汉森机器人公司爱因斯坦机器人Einstein图1 美国汉森机器人公司的爱因斯坦机器人Einstein是美国汉森机器人公司的机器人专家大卫·
2015-05-22 16:55:30 19606
原创 Matlab图像序列中的运动目标检测与跟踪
对图像定位,边缘检测、图像增强对视频中的某个物体进行跟踪:比如说是飞机,导弹等~附件中的Matlab代码clc;clear;% close all;%%%%%%%%%%%%%%% 读序列图像 %%%%%%%%%%%location = 'D:\ex7\';%文件夹位置count=2; %图像帧数% aviFileN
2015-05-13 18:53:05 17243 2
原创 人脸表情识别综述
一、人脸表情识别技术目前主要的应用领域包括人机交互、安全、机器人制造、医疗、通信和汽车领域等 二、1971年,心理学家Ekman与Friesen的研究最早提出人类有六种主要情感,每种情感以唯一的表情来反映人的一种独特的心理活动。这六种情感被称为基本情感,由愤怒(anger)、高兴(happiness)、悲伤 (sadness)、惊讶(surprise)、厌恶(disgust)和恐惧(fear)
2015-05-10 16:59:15 5673
原创 移动机器人视觉定位方法的研究
本文针对移动机器人的局部视觉定位问题进行了研究。首先通过移动机器人视觉定位与目标跟踪系统求出目标质心特征点的位置时间序列, 然后在分析二次成像法获取目标深度信息的缺陷的基础上, 提出了一种获取目标的空间位置和运动信息的方法。该方法利用序列图像和推广卡尔曼滤波, 目标获取采用了H IS 模型。在移动机器人满足一定机动的条件下, 较精确地得到了目标的空间位置和运动信息。仿真结果验证了该方法的有效性和可
2015-05-08 09:32:22 9123
原创 基于机器视觉的工业机器人定位系统
摘要:建立了一个主动机器视觉定位系统,用于工业机器人对零件工位的精确定位。采用基于区域的匹配和形状特征识别相结合的图像处理方法,该方法经过阈值和形状判据,识别出物体特征。经实验验证,该方法能够快速准确地得到物体的边界和质心,进行数据识别和计算,再结合机器人运动学原理控制机器人实时运动以消除此误差,满足工业机器人自定位的要求。1. 引言 目前工业机器人仅能在严格定义的结构化环境
2015-05-06 16:48:12 8491
原创 机器人视觉跟踪与控制研究(一)
研究背景:机器人视觉,通过图像获得外界信息,用于机器人对环境的感知。提高机器人智能性、环境适应性、自主行为的重要途径。近年来机器人领域的研究热点之一。研究内容:视觉系统标定目标分割与图像处理视觉测量与视觉控制视觉系统标定1基于环境信息的自标定•利用环境中的正交平行线获得消失点,标定摄像机的内
2015-04-21 15:56:11 3452
原创 机器人视觉测量与控制
机器人视觉的基本概念1.摄像机标定(Camera Calibration):对摄像机的内部参数、外部参数进行求取的过程。2.视觉系统标定(Vision System Calibration):对摄像机和机器人之间关系的确定。3.手眼系统(Hand-Eye System):又摄像机和机械手构成的机器人视觉系统。4.Eye-in-Hand:摄像机安装在机械手末端并随机械
2015-04-20 19:01:01 5450
原创 HalconMFC(一)之多版本配置
我的方法:我的电脑是win7,64位的系统,我用Halcon10.0。我试过很多次用VC配置Halcon但是一直没成功,后来百度里面找相关错误,终于知道了原来Halcon没64位库,我得出的结论是64位环境下不能配置。可能很多人都在想我可以在64位的电脑上安装Halcon,为什么不可以配置呢?但事实就是这样,我在win7上先后用VC6.0绿色版,VC6.0企业版,VS2008和VS2010最后的出
2015-04-18 17:08:34 2891 3
原创 C++多线程编程入门之经典实例
多线程在编程中有相当重要的地位,我们在实际开发时或者找工作面试时总能遇到多线程的问题,对多线程的理解程度从一个侧面反映了程序员的编程水平。 其实C++语言本身并没有提供多线程机制,但Windows系统为我们提供了相关API,我们可以使用它们来进行多线程编程。本文就以实例的形式讲解多线程编程的知识。 创建线程的API函数C++代码HAN
2015-04-17 15:03:13 862
转载 c++多线程编程
一直对多线程编程这一块很陌生,决定花一点时间整理一下。os:ubuntu 10.04 c++1.最基础,进程同时创建5个线程,各自调用同一个函数[html] view plaincopy#include iostream> #include pthread.h> //多线程相关操作头文件,可移植众多平台
2015-04-17 14:59:32 521
原创 机器人视觉识别技术简介
基于颜色特征的物体识别系统对于不同颜色的分别提取和识别(以上两幅图片由某大学机器人实验室负责人暨机器人天空主编Liu Weichao友情提供)随着计算机科学和自动控制技术的发展,越来越多的不同种类的智能机器人出现在生产生活中,视觉系统作为智能机器人系统中一个重要的子系统,也越来越受到人们的重视。视觉系统是一个非常复杂的系统,它既要做到图像的准确采集还要做到对外界变化反应的实
2015-04-11 17:05:40 15220 1
原创 【图像算法】彩色图像分割专题八:基于MeanShift的彩色分割
》原理以前的博客中已经有对meanshift原理的解释,这里就不啰嗦了,国外的资料看这:http://people.csail.mit.edu/sparis/#cvpr07》源码核心代码(参考网络)123456789101112
2015-03-18 14:51:06 2958
原创 【算法研究与实现】最小二乘法直线拟合
1.原理 在现实中经常遇到这样的问题,一个函数并不是以某个数学表达式的形式给出,而是以一些自变量与因变量的对应表给出,老师讲课的时候举的个例子是犯罪人的身高和留下的脚印长,可以测出一些人的数据然后得到一张表,它反应的是一个函数,回归的意思就是将它还原成数学表达式,这个式子也称为经验表达式,之所以叫经验就是说它不完全是实际中的那样准确,是有一定偏差的,只是偏差很小罢了。最小二乘法
2015-03-18 14:36:31 1169
原创 C++ 输出彩色的控制台
1234567891011121314151617181920212223242526272829303132333435
2015-03-12 15:35:48 1421
原创 仿微信小视频录制控件
本文为用 MediaRecorder 录制小视频的控件,可以设置视频录制的时间、空间大小、初始时是否打开摄像头等。 此控件为组合控件,继承自 LinearLayout ,为防止出错,需实现 android.media.MediaRecorder.OnErrorListener 接口。1. [文件] MovieRecorderView.java ~ 9KB
2015-03-12 15:29:37 1779
原创 混合高斯模型GMM
MOG_BGS.h[cpp] view plaincopy#pragma once #include #include "opencv2/opencv.hpp" using namespace cv; using namespace std; //定义gmm模型用到的变量 #define GMM
2015-03-11 20:42:39 1024
原创 运动检测(前景检测)
ViBe是一种像素级视频背景建模或前景检测的算法,效果优于所熟知的几种算法,对硬件内存占用也少,很简单。我之前根据stellar0的代码(在这里,非常感谢stellar0)改写成一个Mat格式的代码了,现在摆上来和大家交流,具体如下:(在VS2010+OpenCV2.4.2中测试通过)ViBe.h[cpp] view plaincopy#
2015-03-11 20:40:01 1022
转载 CString转char * ,string
CString头文件#include string头文件#include 1、CString转char *CString cstr;char *p =(LPSTR)(LPCTSTR)cstr;2、string转 CStringCString.format(”%s”, string.c_str());用c_str()
2015-01-19 16:05:32 459
原创 目标跟踪学习笔记_1(opencv中meanshift和camshift例子的应用)
在这一节中,主要讲目标跟踪的一个重要的算法Camshift,因为它是连续自使用的meanShift,所以这2个函数opencv中都有,且都很重要。为了让大家先达到一个感性认识。这节主要是看懂和运行opencv中给的sample并稍加修改。 Camshift函数的原型为:RotatedRect CamShift(InputArray probImage, Rect& window,
2015-01-19 14:58:31 1336
原创 字符分割源代码(效果还可以)
void FFTGabor::GaborTransform(int * lpDIBBits, LONG lWidth, LONG lHeight, int Orientation, int Frequency, FFTGaborResult * result){ LONG i; LONG j;
2015-01-18 09:18:52 1469
原创 高斯背景建模之icvMatchTest函数篇
//对每个象素点进行匹配static int icvMatchTest( double* src_pixel, int nChannels, int* match, const CvGaussBGPoint* g_point, const CvGaussBGStatModelPara
2015-01-17 08:51:40 898
《模式识别与智能计算的MATLAB实现》
2015-01-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人