自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 资源 (2)
  • 收藏
  • 关注

原创 MLLT(最大似然线性变换)

主要目的是:在最大似然(ML)准则下使用一个线性变换矩阵对参数特征矢量进行解相关。在ML准则下,评价一个模型‘好坏’的标准是训练数据与模型匹配的似然度,如果似然度越高的话,我们说这个模型越好。MLLT的作者给出了在最大似然准则下(ML)使用对角协方差矩阵的缺点,及其对训练数据集描述似然度的损失。

2017-08-10 14:26:29 4965 2

原创 kaldi特征和模型空间转换

kaldi特征和模型空间转换博主话:这篇博客是对kaldi官网中Feature and model-space transforms in Kaldi 的翻译,因为不是专业翻译人士,接触kaldi时间也不长,所以难免有纰漏之处,希望读者如果有更好的建议和意见,可以在下面留言,有助于更好的交流,谢谢大家介绍Kaldi代码目前支持许多功能和模型空间的转换和预

2017-08-07 18:55:33 4143 2

原创 声学模型概述

这篇博客是关于声学模型的简单介绍。输出概率声学模型的输入是由特征提取模块提取的特征(比如mfcc特征)。一般来说,这些特征是多维的向量,并且其取值可以是离散或连续的。

2017-08-07 09:54:00 7390

原创 kaldi timit实例运行全过程

第一步:准备timit的数据包 1.下载timit数据包,我已经上传到百度云盘—链接http://pan.baidu.com/s/1qYkDora 2.将timit数据包TIMIT.zip从Windows加载到linux服务器上(我用的服务器,当然你们可以用虚拟机)打开SecureCRT,点击链接SFTP会话,(你需要提前将TIMIT.zip放在

2017-07-17 17:43:41 9376 5

原创 kaldi安装及yesno实例

Kaldi是一个非常强大的语音识别工具库,主要由Daniel Povey开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。其中DNN-HMM中的神经网络还可以由配置文件自定义,DNN、CNN、TDNN、LSTM以及Bidirectional-LSTM等神经网络结构均可支持。目前在Github上这个项目依旧非常活跃,可以在 https://githu

2017-07-03 16:05:44 1394

原创 当yuv player30天过期了之后,怎样注册

我的yuv player 过了30天试用期,想再注册一下,于是我在官网找到的网页是这样的。 How to register YUV Player Deluxe is now freeware

2017-06-14 15:12:08 958

原创 c++基础备忘(2)

静态函数成员(static) 如果把函数成员声明为静态的,就可以把函数与类的任何特定对象独立开来。静态成员函数即使在类对象不存在的情况下也能被调用,静态函数只要使用类名加范围解析运算符 :: 就可以访问。 静态成员函数只能访问静态数据成员,不能访问其他静态成员函数和类外部的其他函数。 静态成员函数有一个类范围,他们不能访问类的 this 指针。您可以使用静态成员函数来判断类的某些对象是否已被创

2017-05-17 11:54:33 215

原创 c++匿名函数与日期时间

讲一下c++不常见的一些知识点,以后遇到了可以查看。匿名函数 C++11 提供了对匿名函数的支持,称为 Lambda 函数(也叫 Lambda 表达式)。[](int x, int y) -> int { int z = x + y; return z + x; }本例中,一个临时的参数 z 被创建用来存储中间结果。如同一般的函数,z 的值不会保留到下一次该不具名函数再次被调用时。 如果 lam

2017-05-16 12:45:01 553

原创 两小时回顾c++基础

标识符 C++ 标识符内不允许出现标点字符,比如 @、$ 和 %。C++ 是区分大小写的编程语言。 标识符以字母 A-Z 或 a-z 或下划线 _ 开始,后跟零个或多个字母、下划线和数字(0-9)。下面代码会输出您电脑上各种数据类型的大小。#include <iostream>using namespace std;int main(){ cout << "Size of char :

2017-05-16 12:35:32 481 1

原创 GNU的g++编译器备忘

之前编c++都只是用vs2012,现在要开始学习用GNU的g++编译器,下面是写着备忘的笔记。 Windows 上的安装 为了在 Windows 上安装 GCC,您需要安装 MinGW。为了安装 MinGW,请访问 MinGW 的主页 http://www.mingw.org/,进入 MinGW 下载页面,下载最新版本的 MinGW 安装程序,命名格式为 MinGW-< version>.exe

2017-05-15 21:35:21 323

原创 音视频编码从小白开始(1)

视频序列中的每一幅图像,都是有NxM个像素组成的,每个像素都有具体的数值,视频序列可以表示为三维矩阵,其中NxM这两个维度表示每幅图的像素值,形成视频的空间域,另一个维度代表视频的时间域。彩色视频需要三个矩阵,分别代表三个基本都色彩分量(rgb)或亮度色度分量(yuv)。每秒播放的帧数叫帧率,单位fps,要是人眼看着平滑连续,视频帧率需要在25-30fps以上。以标清720P(以16:9,则为

2017-05-12 11:37:40 902 1

原创 GPU CPU NPU

随着人工智能和深度学习逐渐进入人们视野,中科院、谷歌、IBM、英伟达等中美科研机构和商业公司也纷纷推出了用于深度学习的处理器。在上述产品中,既有CPU、GPU、DSP这样的传统芯片,也有专门为深度学习而生的NPU。那么,CPU、GPU、DSP、NPU等深度学习处理器各有什么特点,这些深度学习处理器谁更出彩呢? CPU、GPU、DSP:以现有的技术进行微调   在英伟达开发出针对人工智能的定制GPU,

2017-05-11 10:47:48 6429

原创 中星微 星光智能一号

在人机大战中,AlphaGo依靠模仿人脑生物机理的深度学习算法而击败李世石。深度学习,是源于对生物人脑机理的仿生学研究而形成的一种人工智能算法。作为深度学习神经网络的一种,卷积神经网络CNN (Convolutional Neural Network)算法,已成为当前人工智能机器视觉领域的研究热点。

2017-05-11 10:00:16 2469

转载 浅谈视频监控行业编解码技术的发展与应用

视频监控技术经过多年的发展,监控画面正经历着从最初的D1标清图像,向4K高清、8K超清时代前进。由于CCD与CMOS技术的发展,前端摄像机的像素越来越高,成本也在逐渐的降低,高清监控得到了快速的普及和应用,随之而来的问题是,前端像素的提高给视频传输和后端录像存储带来了巨大的压力,在相同的编码压缩比例下,用户需要投入更多的设备和资金,因此编解

2017-05-11 01:43:56 2985

原创 SVAC

2010年1月8日,国际领先的数字多媒体芯片和解决方案提供商中星微电子有限公司在美国拉斯维加斯举行的2010年国际消费电子产品展(CES)上发布了场景高保真图像处理技术,场景高保真是国家标准《安全防范监控数字视音频编解码技术标准》(简称SVAC)

2017-05-11 01:37:15 3398

原创 关于人就是不断学习,才能称之为人

上篇博文是转载的CSDN排名第三的大牛的文章,虽然在他的博客已经删掉了,我还是通过朋友的博客看到了。文章很长,我是怀着越看越激动,越看越觉得自己需要反思的心情看到了最后。

2017-05-10 17:33:23 573

转载 yuv转成matlab可读的rgb格式

YUV(亦称YCrCb)是被欧洲电视系统所采用的一种颜色编码方法(属于PAL,PAL是指色彩系统,经常被配以625线、每秒25格画面、隔行扫描的电视广播格式)。 YUV主要用于优化彩色视频信号的传输,使其向后兼容老式黑白电视。与RGB视频信号传输相比,它最大的优点在于只需占用极少的带宽(RGB要求三个独立的视频信号同时传输)。其次YUV表示法的重要性是它的亮度信号(Y)和色度信号(U、V)是相互独

2017-05-05 00:00:03 4388 2

原创 2017阿里巴巴算法工程师在线测试

2017/3/22 今天做了阿里巴巴算法工程师的在线笔试题,时间好紧,只有40分钟,还没来得及调出来,时间就到了,这是后来编译通过的代码,在此贴出来方便大家参考学习。 有n个正整数(每个数小于10亿),将它们表示成字符串形式。对每一个字符串s,可以翻转为新字符串s’,如“1234”可以翻转成“4321”。 现在,将这n个字符串以任意顺序连成一个字符环,每个字符串可以选择是否翻转。在字符环中,

2017-04-28 12:49:55 6695 4

原创 mencoder.exe在win10下将y4m转换成yuv文件

最近在做有关视频编解码的工作,虽然还是小白,但是有一些进展可以和大家分享一下。 分享一个下载HEVC test sequence 的网址https://media.xiph.org/video/derf/ 但是下载下来的序列都是y4m后缀名的文件,想转到yuv文件。 第一步:装个mencoder.exe 下载地址:http://download.csdn.net/download/chenb

2017-04-28 12:45:44 3210 1

原创 关于xilinx调试过程中的问题

在调试关于物体检测的程序,用ISE14.7编译时出现以下问题发现14.7不能支持xc7v2000tGeneral InformationThe ISE 14.7 design tool release contains the v1.11 core.For 7 series Integrated Block for PCI Express v2.2 core relea

2017-03-08 17:32:26 1239

yuv player(亲测好用)

非常好用的yuv player

2017-06-14

QuickText.v0.2.1

ISE的开发环境不如VS友好,不提供自动缩进,每次自己敲空格会特别繁琐,而且代码不够工整。解决这个问题的方法之一是使用notepad++编辑代码,安装notepad++后,下载插件quicktext,这里用的版本是v0.2.1。

2017-04-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除