AI大杂烩-CSDN博客

原创 pytorch版本利用vggish预训练网络提取音频特征

视频多模态分类中的音频特征提取，涉及VGGish，预训练网路。

2022-10-20 16:03:45 2325 1

原创 linux 非root 安装ImageMagick 以及python调用ImageMagick将图片生成gif案例

标题有点长，知识量拉满~首先进入链接 http://www.imagemagick.org/script/install-source.php 下载下载ImageMagick.tar.gz ，下载好后上传到linux相应位置上，解压命令tar -xvf ImageMagick.tar.gz然后cd ImageMagick-7.1.0-15/接下来开始编译安装./configure --prefix=/home/服务器上用户名/software/ImageMagick-7.1.0-15

2021-11-23 11:34:32 2819

原创 python PIL生成gif帧率问题

前提：今天在用PIL生成gif时被帧率困扰了一会，看了一下PIL的文档终于彻底理解了。frames[0].save(outPath, format='GIF',save_all=True, append_images=frames[1:],loop=1,duration=41.6,transparency=0,disposal=2)其中duration表示每一帧的持续时间，毫秒为单位，那么当帧率是24时，duration=1/241000，也就是duration与帧率的计算关系为 duration=

2021-11-17 17:34:05 2856

原创 violence-recognition-pytorch的测试代码

最近在弄视频分类的项目其中包括了暴恐识别，我用了https://github.com/swathikirans/violence-recognition-pytorch这个项目代码，将其中的代码修改为符合Pytorch1.4版本的风格，就愉快的训练了，但是发现训练完成后并没有测试代码，于是自己就写了一个，当然借鉴了作者的训练代码，很简单，在此分享出来，如果能帮助大家就更happy了。import torchimport globimport osfrom createModel import *

2021-03-23 15:21:27 421

原创 CMake Error: The source directory “opencv安装目录“ does not appear to con

CMake Error: The source directory "opencv安装目录 "does not appear to contain CMakeLists.txt.我居然被这个错误困扰了一下午，emmm,脑壳大。解决办法：源码安装opencv的时候，到cmake那一句的时候，将这一句命令：cmake -DCMAKE_BUILD_TYPE=Release -DWITH_FFMPEG=ON -DCMAKE_INSTALL_PREFIX=/home/你的用户名/software/open

2021-03-11 18:09:29 9594 6

原创继前一篇文章-图像多标签分类优化

1 数据集分析结果一个好的数据集往往事半功倍，所以训练网络的前提都应该是好好分析数据集。上一篇文章说到利用pascal voc2012作为图像多标签分类的数据集，我统计出了训练集：07-08的类别总和，统计结果如下：({‘person’: 2530, ‘car’: 549, ‘chair’: 498, ‘dog’: 433, ‘cat’: 372, ‘bird’: 348, ‘bottle’: 320, ‘aeroplane’: 281, ‘tvmonitor’: 272, ‘sofa’: 264,

2021-03-02 17:45:06 422 2

原创基于parcal voc2012数据集的图像多标签分类实战

上一篇文章中讲到如何将pascal voc2012数据集xml文件中的标签属性提取出来，本篇文章啊将会利用resnet相关网络实现多标签分类。首先利用的相关代码为 https://github.com/AI-Chen/MultiLabelClassification，其中修改了src\Utils.py中的MyDataLoader的代码：class MyDataLoader(data.Dataset): def __init__(self, transform, trainval='train',

2021-02-27 21:56:24 2018 10

原创图像多标签分类：提取xml文件中name属性到文本中

最近两天在做图像多标签分类，首先选用的数据集为pascal voc2012, 网上关于这个数据集的介绍有很多，此处不做过多介绍。pascal voc2012的标注格式是xml，对于图像多标签分类任务，首先需将xml文件中name标签提取出来并整理成txt格式。07-08的数据集作为测试集，09-12的数据集作为训练集，文件夹格式为：datasettrainJPEGImagesannotations.txttestJPEGImagesannotations.txt其中JPEGImages里装

2021-02-25 15:51:14 1045 5

原创 python 批量将json格式的数据提取成单个json格式

你是不是对成堆的json数据无法下手？想将其拆分成单个json，ok，

2020-12-11 18:02:16 1061

原创 linux系统离线安装Anaconda与cpu版的pytorch

一 linux离线安装Anaconda3.41 将下载好的anaconda3-2018.12上传到所需目录下anaconda3-2018.12下载网址：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/2 执行命令 bash Anaconda3-2018.12-Linux-x86_64.sh进行安装一路enter，yes，直到最后是否安装vscode时，选择no。3 查看conda是否可用，返回普通用户。conda --version

2020-12-08 23:09:20 1071 3

原创简单版，python将文件夹内特定类型的图片保存在另一个文件夹里

如上图所示：想把00001.png 与00001_matte.png 分存于两个不同的文件夹里，对于大量的数据集单张操作太耗时，简单的文件排序也不能做到，所以我就了几句python代码替代了机械式的操作，话不多说，上代码：import os from PIL import Image path='D:/dataset/training'dirs=os.listdir(path) #列表得到图片名for i in dirs: if '_' not in .

2020-10-29 17:34:00 1471

原创用matlab批量修改图片名称

前言：在网上看了一些修改图片名称的代码，发现很多都没有达到预期的结果，所以在这里把我的代码贴出来，仅供大家参考，也希望帮到大家少走一些弯路。file_path1='G:\VOC2012dataset\imageDataset\tvmonitor\';file_path2='G:\VOC2012dataset\train\tvmonitor\';img_path_list = dir(str...

2019-07-01 11:06:40 2823 4

原创皮肤病图像分割

前言：最近看了几篇关于皮肤病图像分割的论文，遂来总结一下所涉及到的重要方法。1：Automated Melanoma Recognition in Dermoscopy Images via Very Deep Residual Networks（通过深度残差网络自动识别皮肤镜图像中的黑色素瘤）论文下载链接：https://ieeexplore.ieee.org/document/7792699...

2019-03-27 22:00:38 4689 2

原创剑指0ffer面试题31：栈的压入，弹出序列

题目见书《剑指offer》168页；刚开始看到这题的时候一头雾水，因为很久没有接触序列了。思路：构建一个辅助栈。最重要的是判断栈顶元素与序列元素是否相同，不相同则向辅助栈压入元素。由于程序摘抄的是书上的内容，本博客只是作为一个笔记，加入了自己的理解部分。bool IsPopOrder(const int* pPush, const int* pPop, int nLength){ ...

2019-03-24 17:45:51 159

原创剑指offer面试题11：旋转数组的最小数字

题目见书《剑指offer》82页，emmm，中间的几道题略过。该题主要是考察另外一个思路，遍历整个数组找到最小数字固然简单，但是时间复杂度并不是所期待的。编程思路：二分查找，抓住旋转数组的特点。//面试题11：旋转数组的最小数字#include<iostream>using namespace std;int Min(int* numbers, int length)...

2019-03-04 21:07:33 114

原创 gabor与gabor小波

先总结一句：瞎搞不如看文献。前沿：最近在做图像分割，需要用到gabor来增强图像，然而这个gabor我看了很久，在网上看了很多关于gabor的知识，也在不断的调试参数，可总达不到我想要的结果，也具体搞不懂gabor与gabor小波的关系，后来看了关于gabor的文献，故来总结之。写这篇博客纯粹是以慰我在gabor上花的时间。贴上这篇文献的连接，可以免费下载。http://www.cse.ms...

2019-02-22 16:57:06 5988 2

原创剑指offer面试题6：从尾到头打印链表

题目见书《剑指offer》58页；编程思路，链表数据用栈保存，利用栈先进后出的性质打印链表。//面试题6：从尾到头打印链表#include<iostream>#include<stack>#include<vector>using namespace std;//单项链表的结点定义struct ListNode{ int m_nValue...

2019-02-21 20:05:36 143

原创剑指offer面试题5：替换空格（加入理解的部分）

题目见书《剑指offer》51页。编程思路，与书一致；原本打算用一个指针的，但是随之而来的是时间复杂度变大。//面试题5：替换空格#include <iostream>#include<string.h>using namespace std;//length为字符串的总容量void ReplaceBlank(char string[], int leng...

2019-02-20 09:39:11 134

原创剑指offer面试题4：二维数组中的查找（比较直白简单）

题目见书《剑指offer》44页；编程思路：将所输入数字与二维数组中的数字进行比较，如果相等则返回1，不相等则返回0，运用了遍历的思想，未用到指针。// 二维数组中的查找#include &amp;lt;iostream&amp;gt;using namespace std;bool find(int a[4][4], int number){ int i, j; bool found = fal...

2019-02-19 21:32:59 226

原创剑指offer面试题3第二题：不修改数组找出重复的数字（加入理解的部分）

题目见书《剑指offer第二版》41页，纯属自己笔记，以待日后回看。该题编程思想：基于二分查找的思想，统计不同范围内数组数字的数目是否超出范围。完整代码见下：#include <iostream>//#include<string.h>using namespace std;int countRange(const int* numbers, int lengt...

2019-02-19 10:00:28 180

原创找实习那些事儿

来更新怎样找实习~ 基本上所有的学生在进入职场之前都要进行实习，那么怎样找到一个适合自己且靠谱的实习呢。这里直接建议如下： 1、招聘网站~前程无忧、智联招聘这两个综合性的招聘网站根据本人的经验智联招聘相较于前程无忧要好很多，不过别指望能在这两个网站上找到实习的机会。58同城就更别指望了，里面好大一部分都是虚假信息。推荐实习僧、boss直聘以及小木虫，先来说下实习僧，能快速根据你...

2018-06-14 22:57:57 309

转载 CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来，用它写博客，将会带来全新的体验哦：Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I...

2018-06-14 22:19:58 107

原创基于tensorflow和lenet-5模型实现mnist手写数字识别

前言-很久没有写博客了，之前答应的将图像识别一些小项目实现也没有实现诺言，由于四月到五月初都在找实习，所以才会将写博客的事情落下了，其实中间一直在努力学习，虽说缺少了一丢丢动力，但该学的都没有放弃。这不还是来乖乖更新了嘛。另改天给大家建议一些怎么找一个适合自己的实习的方法。 ----------------------------------...

2018-06-03 21:32:09 7940 9

原创 python错误连载

1：ValueError: too many values to unpack (expected 3) 这种就是变量值与输入值不匹配，括号里的是变量值为3个2：TypeError: object() takes no parameters _ _init_ _注意程序需要这里是两条下划线，中间没有间隔，这句话表示参数不够的意思。网不好，不能添加标签？？？...

2018-04-06 14:36:57 135

原创图像识别一些小项目介绍

1：车牌号码识别系统识别步骤：车牌定位，字符分割，字符识别车牌定位方法，基于直线边缘检测的方法，基于阈值迭代的方法，基于彩色信息的方法，基于灰度检测的方法，基于神经网络的方法。字符识别：特征提取与模板匹配。整个识别过程包括了图像预处理和车牌号码识别。而图像预处理包括了二值化，去噪，车牌定位，字符分割和字符细化。二值化其实就是将灰色图像转换为0-1（255）像素图像。去噪就是去除一些噪声，易于识别，...

2018-03-28 15:58:05 6985

转载图像分割中阈值的自动选取的研究及其算法实现

图像分割是图像处理这门学科中的基础难题，基于阈值的分割则又是图像分割的最基本的难题之一，其难点在于阈值的选取。事实证明，阈值的选择的恰当与否对分割的效果起着决定性的作用。由于阈值选取对图像分割的基础性，本文主要在【1】、【2】、【3】、【4】等的基础上，对一些当前流行的阈值选取算法做了探讨、实现和比较。多阈值分割虽然能进一步提高图像分割的质量，但由于它只是分割技巧的处理问题，而与单阈值分割并无本质

2017-12-25 12:37:00 859 1

yanchujian88的博客