自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

左左左左想

本博客已不再更新,请移步新博客:https://zuoxiang95.github.io/

  • 博客(15)
  • 资源 (1)
  • 收藏
  • 关注

原创 深度学习--防止过拟合的几种方法

本博客仅为作者记录笔记之用,不免有很多细节不对之处。还望各位看官能够见谅,欢迎批评指正。  在机器学习和深度学习中,过拟合是一个十分常见的问题,一旦模型过拟合了,可能这个模型就无法适用于业务场景中了。所以为了降低产生过拟合的风险,机器学习中的大牛们提出了以下几种方法供大家使用:引入正则化Dropout提前终止训练增加样本量  本文将对这5种方法进行简单的讲解分析。1. 正则化  正则化的思

2017-08-29 18:05:37 24562 1

原创 语音识别:深入理解CTC Loss原理

最近看了百度的Deep Speech,看到语音识别使用的损失函数是CTC loss。便整理了一下有关于CTC loss的一些定义和推导。由于个人水平有限,如果文章有错误,还恳请各位指出,万分感谢~附上我的github,欢迎各位的follow~~~献出小星星~1. 背景介绍  在传统的语音识别的模型中,我们对语音模型进行训练之前,往往都要将文本与语音进行严格的对齐操作。这样就有两点不太好:严格对齐要

2017-07-30 09:58:47 55868 19

原创 TACOTRON:端到端的语音合成

由于最近在学习语音识别和语音合成方面的内容,整理了一些东西,本文为论文tacotron的笔记。tacotron主要是将文本转化为语音,采用的结构为基于encoder-decoder的Seq2Seq的结构。其中还引入了注意机制(attention mechanism)。在对模型的结构进行介绍之前,先对encoder-decoder架构和attention mechanism进行简单的介绍。其中纯属个人

2017-07-09 20:50:53 18356 4

原创 numpy入门100题

本博客仅为作者记录笔记之用,不免有很多细节不对之处。还望各位看官能够见谅,欢迎批评指正。此文中的题目均来自GitHub,完整代码请参考我的GitHub。期待各位的小心心~~~1.初级导入numpy包,并重命名为np (★☆☆)打印numpy库的版本 (★☆☆)输出numpy矩阵的大小 (★☆☆)如何获取numpy库中某一个函数(如add)的帮助文档 (★☆☆)创建一个0向量,向量长度为10

2017-09-28 15:23:40 1750

原创 Tensorflow学习(一)--使用TensorFlow实现线性回归

本博客仅为作者记录笔记之用,不免有很多细节不对之处。还望各位看官能够见谅,欢迎批评指正。  最近发现自己都没有真正好好学习过TensorFlow,只是看看别人project的代码,然后能跑起来就行,实际自己想要去搭建一些网络还是很困难,因此准备写一个使用TensorFlow实现一些网络的系列。这是第一篇,因此就从最简单的线性回归开始。  首先简单介绍一下线性回归。线性回归的表达式为: y=wx+b

2017-09-22 12:36:34 3199

原创 深度学习--激活函数的对比分析

本博客仅为作者记录笔记之用,不免有很多细节不对之处。还望各位看官能够见谅,欢迎批评指正。  在学习神经网络的时候,你会经常听到一个词:激活函数。在最开始学习的时候,对激活函数总是有很多的疑惑。在日常搭建网络的时候选择激活函数也是很随意,看到大家都说ReLU效果好,就一股脑使用ReLU。通常没去深究一些问题:激活函数到底是什么?为什么要使用激活函数?常用的激活函数有哪些?这些常用的激活函数有什

2017-08-29 09:29:06 2448 1

原创 深入理解支持向量机-SVM

秋招在即,发现最近一直在做的都是深度学习里的一些项目。机器学习里的一些经典算法快忘光了。想重新再对一些经典的算法整理下,更好的面对即将到来的秋招。今天要总结的是机器学习里比较火的一种算法:支持向量机(Support Vector Machine)。1. 结构风险最小原理  在对支持向量机算法介绍之前,我们需要了解一下在传统的统计学里的一个概念“结构风险最小原理”。  首先我们回想一下,在机器学习中,

2017-08-05 17:02:04 2038

原创 Logistic回归

众所周知,线性回归主要是用于预测,而当我们所研究的问题是一个分类问题,这里简化为一个二分类(假定两类为0和1)问题的话,由于线性回归目标函数y的输出域为负无穷到正无穷,因此线性回归就无法满足我们的需求。因此,我们就想到要将一般线性回归模型的输出从负无穷到正无穷映射至0到1之间(这里假定为输出的是将样本划分为1的概率),这样当目标函数的输出大于0.5时,我们将该样本划分为1;当目标函数小于0.5时,我

2017-07-24 09:06:31 850

原创 Deep Speech:端到端的语音识别

本文为百度的Deep Speech的论文笔记,本人为深度学习小白,文章内如有错误,欢迎请各位指出~   附上我的github主页,欢迎各位的follow~~~献出小星星~什么是端到端?  对于传统的语音识别,通常会分为3个部分:语音模型,词典,语言模型。语音模型和语言模型都是分开进行训练的,因此这两个模型优化的损失函数不是相同的。而整个语音识别训练的目标(WER:word error rate)与

2017-07-20 20:37:30 12499

原创 spark中查询PG数据库老是报无法找到该列

最近学习spark的过程中,发现在使用spark中的sql语句查询数据的时候老是报错: 16/11/30 19:38:42 ERROR Executor: Exception in task 0.0 in stage 2.0 (TID 2) org.postgresql.util.PSQLException: ERROR: column “studentid” does not exist

2016-11-30 19:46:50 1602

原创 scala学习-trait学习

trait是scala中代码复用的基础单元。特质中封装了一些方法和字段,可以通过混入到类中来重用他们。定义trait的方法:trait ConsoleLogger{ def logger(msg: String) = {println(msg)} }与类的继承不同,一个子类只能继承自唯一的超类,而一个类中可以混入多个特质。特质的定义与类定义除关键字不同以外,基本无大的差异。特质同样

2016-09-14 18:07:02 441

原创 scala学习

关于构造器在scala中,构造器存在于类中,是整个类体。而构造器所需的所有参数都在类名称之后。看scala编程一书中的一个例子: class Ration(a:Int, b:Int){ require(b != 0) override def toString: String = {a + " / " + b} def add(p: Ration): R

2016-09-10 17:23:36 425

原创 R语言__数据处理2列表

列表    R语言中的列表与向量不同,在单个向量中所存放的数据类型必须一致,而列表却不同,它可以组合多种不同类型的对象,且列表的每一个组件可以是不同的长度。    1.创建列表:      通过list函数进行创建列表    2.列表的索引:      在列表a中索引age这一列:      a.通过列表+组件名进行索引      b.通过列表+

2015-01-05 13:46:14 2134

原创 R语言___数据处理1向量

一.向量1.构造向量   在R语言里,通过函数c来建立一个向量。(注意:向量内的数据类型必须一致。)    example:a    (1)查看向量的类型,用mode(向量名)    (2)在向量中实现索引    在向量a中得到大于等于3的数     a.用subset函数.       subset函数的第一个参数是要索引的向量,第二个参数是索引条件。

2014-12-23 18:09:06 2560

原创 关联规则(一)

关联规则

2014-11-17 18:50:02 1606 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除