左左左左想-CSDN博客

原创深度学习--防止过拟合的几种方法

本博客仅为作者记录笔记之用，不免有很多细节不对之处。还望各位看官能够见谅，欢迎批评指正。在机器学习和深度学习中，过拟合是一个十分常见的问题，一旦模型过拟合了，可能这个模型就无法适用于业务场景中了。所以为了降低产生过拟合的风险，机器学习中的大牛们提出了以下几种方法供大家使用：引入正则化Dropout提前终止训练增加样本量本文将对这5种方法进行简单的讲解分析。1. 正则化正则化的思

2017-08-29 18:05:37 24562 1

原创语音识别：深入理解CTC Loss原理

最近看了百度的Deep Speech，看到语音识别使用的损失函数是CTC loss。便整理了一下有关于CTC loss的一些定义和推导。由于个人水平有限，如果文章有错误，还恳请各位指出，万分感谢~附上我的github，欢迎各位的follow~~~献出小星星~1. 背景介绍在传统的语音识别的模型中，我们对语音模型进行训练之前，往往都要将文本与语音进行严格的对齐操作。这样就有两点不太好：严格对齐要

2017-07-30 09:58:47 55868 19

由于最近在学习语音识别和语音合成方面的内容，整理了一些东西，本文为论文tacotron的笔记。tacotron主要是将文本转化为语音，采用的结构为基于encoder-decoder的Seq2Seq的结构。其中还引入了注意机制（attention mechanism）。在对模型的结构进行介绍之前，先对encoder-decoder架构和attention mechanism进行简单的介绍。其中纯属个人

2017-07-09 20:50:53 18356 4

原创 numpy入门100题

本博客仅为作者记录笔记之用，不免有很多细节不对之处。还望各位看官能够见谅，欢迎批评指正。此文中的题目均来自GitHub，完整代码请参考我的GitHub。期待各位的小心心~~~1.初级导入numpy包，并重命名为np (★☆☆)打印numpy库的版本 (★☆☆)输出numpy矩阵的大小 (★☆☆)如何获取numpy库中某一个函数（如add）的帮助文档 (★☆☆)创建一个0向量，向量长度为10

2017-09-28 15:23:40 1750

原创 Tensorflow学习（一）--使用TensorFlow实现线性回归

本博客仅为作者记录笔记之用，不免有很多细节不对之处。还望各位看官能够见谅，欢迎批评指正。最近发现自己都没有真正好好学习过TensorFlow，只是看看别人project的代码，然后能跑起来就行，实际自己想要去搭建一些网络还是很困难，因此准备写一个使用TensorFlow实现一些网络的系列。这是第一篇，因此就从最简单的线性回归开始。首先简单介绍一下线性回归。线性回归的表达式为： y=wx+b

2017-09-22 12:36:34 3199

原创深度学习--激活函数的对比分析

本博客仅为作者记录笔记之用，不免有很多细节不对之处。还望各位看官能够见谅，欢迎批评指正。在学习神经网络的时候，你会经常听到一个词：激活函数。在最开始学习的时候，对激活函数总是有很多的疑惑。在日常搭建网络的时候选择激活函数也是很随意，看到大家都说ReLU效果好，就一股脑使用ReLU。通常没去深究一些问题：激活函数到底是什么？为什么要使用激活函数？常用的激活函数有哪些？这些常用的激活函数有什

2017-08-29 09:29:06 2448 1

原创深入理解支持向量机-SVM

秋招在即，发现最近一直在做的都是深度学习里的一些项目。机器学习里的一些经典算法快忘光了。想重新再对一些经典的算法整理下，更好的面对即将到来的秋招。今天要总结的是机器学习里比较火的一种算法：支持向量机(Support Vector Machine)。1. 结构风险最小原理在对支持向量机算法介绍之前，我们需要了解一下在传统的统计学里的一个概念“结构风险最小原理”。首先我们回想一下，在机器学习中，

2017-08-05 17:02:04 2038

原创 Logistic回归

众所周知，线性回归主要是用于预测，而当我们所研究的问题是一个分类问题，这里简化为一个二分类（假定两类为0和1）问题的话，由于线性回归目标函数y的输出域为负无穷到正无穷，因此线性回归就无法满足我们的需求。因此，我们就想到要将一般线性回归模型的输出从负无穷到正无穷映射至0到1之间（这里假定为输出的是将样本划分为1的概率），这样当目标函数的输出大于0.5时，我们将该样本划分为1；当目标函数小于0.5时，我

2017-07-24 09:06:31 850

原创 Deep Speech：端到端的语音识别

本文为百度的Deep Speech的论文笔记，本人为深度学习小白，文章内如有错误，欢迎请各位指出~ 附上我的github主页，欢迎各位的follow~~~献出小星星~什么是端到端？对于传统的语音识别，通常会分为3个部分：语音模型，词典，语言模型。语音模型和语言模型都是分开进行训练的，因此这两个模型优化的损失函数不是相同的。而整个语音识别训练的目标（WER：word error rate）与

2017-07-20 20:37:30 12499

原创 spark中查询PG数据库老是报无法找到该列

最近学习spark的过程中，发现在使用spark中的sql语句查询数据的时候老是报错： 16/11/30 19:38:42 ERROR Executor: Exception in task 0.0 in stage 2.0 (TID 2) org.postgresql.util.PSQLException: ERROR: column “studentid” does not exist

2016-11-30 19:46:50 1602

原创 scala学习-trait学习

trait是scala中代码复用的基础单元。特质中封装了一些方法和字段，可以通过混入到类中来重用他们。定义trait的方法：trait ConsoleLogger{ def logger(msg: String) = {println(msg)} }与类的继承不同，一个子类只能继承自唯一的超类，而一个类中可以混入多个特质。特质的定义与类定义除关键字不同以外，基本无大的差异。特质同样

2016-09-14 18:07:02 441

原创 scala学习

关于构造器在scala中，构造器存在于类中，是整个类体。而构造器所需的所有参数都在类名称之后。看scala编程一书中的一个例子： class Ration(a:Int, b:Int){ require(b != 0) override def toString: String = {a + " / " + b} def add(p: Ration): R

2016-09-10 17:23:36 425

原创 R语言__数据处理2列表

列表 R语言中的列表与向量不同，在单个向量中所存放的数据类型必须一致，而列表却不同，它可以组合多种不同类型的对象，且列表的每一个组件可以是不同的长度。 1.创建列表：通过list函数进行创建列表 2.列表的索引：在列表a中索引age这一列： a.通过列表+组件名进行索引 b.通过列表+

2015-01-05 13:46:14 2134

原创 R语言___数据处理1向量

一.向量1.构造向量在R语言里，通过函数c来建立一个向量。（注意：向量内的数据类型必须一致。） example：a （1）查看向量的类型，用mode（向量名）（2）在向量中实现索引在向量a中得到大于等于3的数 a.用subset函数. subset函数的第一个参数是要索引的向量，第二个参数是索引条件。

2014-12-23 18:09:06 2560

原创关联规则（一）

关联规则

2014-11-17 18:50:02 1606 2

左左左左想