自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 资源 (2)
  • 收藏
  • 关注

原创 机器学习之支持向量机

一、基本概念和数学公式1.点到直线的距离公式点P(x0,y0)P(x0,y0)P(x_0,y_0)到直线Ax+By+C=0Ax+By+C=0Ax+By+C=0的距离: d=|Ax0+By0+C|A2+B2−−−−−−−√d=|Ax0+By0+C|A2+B2d=\frac{|Ax_0+By_0+C|}{\sqrt{A^2+B^2}}2.函数间隔与几何间隔函数间隔 点(xi,...

2018-08-28 21:12:13 165

原创 python常见错误

编码or解码问题写文件 UnicodeEncodeError: 'gbk' codec can't encode character '\u2764' in position 10: illegal multibyte sequence 这种错误经常发生在windows操作系统下,原因是当你使用如下代码写文件时,会创建一个新文件,而新文件的编码与你操作系统有关,所以更改默认编码方式即可...

2018-08-08 14:38:03 1003 1

原创 tensorflow踩坑记

不收敛问题损失函数不下降 原因:多次初始化图变量 对于计算图和符号编程仍然理解不到位。with tf.session() as sess: init_op = tf.global_variables_initializer() sess.run(init_op)...

2018-07-24 17:14:01 285

原创 logistic regression精简版笔记(重在体系和推导)

基础知识关于sigmoid函数(参考之前的博文)softmax函数 δ(Zj)=eZj∑Kk=1eZk j=1,2,...,K\delta(Z_{j}) = \frac{{e}^{Z_j}}{\sum_{k=1}^{K}e^{Z_k}} \space j = 1,2,...,K极大似然估计 原理 样本作为总体的一个采样,使用样本进行分布参数$\theta$的估计,可以得到多个估计,极大似

2018-03-15 22:28:20 268

翻译 2017优化方法改进-译Optimization for DL in 2017

写在前面这篇文章严格来说并不是译文,并不是逐字进行了翻译。想看英文原文戳这里,是Ruder的一篇博客,这里阅读以后做个搬运工。具体方法有解耦权重衰减、修改指数移动平均、使用退火方案微调学习率、热重启方案,以及后续提出的学习优化以及对于优化的理解。总的来说,针对当前优化方法的两大分支都有了不同的改进。 可以发现,基于当前大多非凸优化的背景,新提出的方法具有通用性。解耦权重衰减、退火方案、热重

2017-12-31 17:00:02 567

原创 深度学习实践向之优化方法

概览先说干货吧,如果面向应用,只关注哪一个方法更好用,下面这些总结希望能帮到你~ 最流行并且使用率很高的算法包括SGD、具动量(Momentum)的SGD、RMSProp、具动量的RMSProp、AdaDelta和Adam。具有自适应学习率的算法(以AdaDelta和RMSProp为代表)收敛速度更快一些,表现得更加鲁棒。基于SGD的算法相对而言收敛速度更慢一些,但是精调以后准确率可能会提高

2017-12-05 19:08:11 563

原创 自然语言处理工具包jieba的使用

介绍jieba“结巴”中文分词:做最好的 Python 中文分词组件。官网如是说,其实实际使用的过程中体验还不错啦,清华thulac做了一个测评,jieba和thulac脱颖而出。 这里简单介绍一下分词,词性标注及关键词提取的使用,目的是为nlp自然语言处理入门学习者的使用。Show your code环境:python3、linux、mac、win10皆可用(win10可能面临万恶的gbk编码问

2017-11-14 10:39:12 721

原创 Ubuntu16.04网络连接正常但是无法使用浏览器上网-浏览器代理设置

chromeubuntu16.04之前使用win10 chrome的时候经常会出现这样的问题,但也轻车熟路的解决问题。看下面的图 右上角——设置——高级设置——打开代理设置——选连接——局域网设置关闭代理 就ok了! ubuntu呢。。。 是的,正如你看到的,请你使用command line。那就是用呗,打开terminate敲如下命令。man google-chrom...

2017-10-31 20:54:16 46584 11

翻译 Attention和增强RNNs—翻译Attention and Augmented Recurrent Neural Networks

关于翻译因为之前看了Colah的博客Understanding LSTM Networks觉得受益匪浅,便关注了他的网站,最近又看了他和同事写的关于注意力机制(原文地址)的文章,便翻译一下,有些地方不到位,各位谅解。作为深度学习重要基石之一的RNN允许神经网络可以处理诸如文本、音频、视频这些序列化的数据。他们可以从一个序列提炼出更高层次的理解,来注释序列甚至可以从头开始来生成新序列。 基本的R

2017-10-26 11:53:03 324

翻译 理解LSTM网络—翻译Understanding LSTM Networks

写在前面对colah的博客Understanding LSTM Networks进行了翻译,觉得这篇博客写得特别好,深入浅出,有些地方翻译不到位,希望大家谅解。循环神经网络—Recurrent Neural networks时时刻刻人类的思考都不会从头开始。当你读这篇文章的时候,你根据你之前对于单词的理解理解每个单词。你不是扔掉所有而每次都从头开始思考。你的思考具有持久性。[这段话的核心就是时间的延

2017-10-21 22:41:44 601

原创 TensorFlow入门

关于入门入门总要采坑,像我,开始看了tensorflow架构,跑了一些代码,随后就没有继续,而是投入到导师的项目中去了。该来的躲不掉,项目深入无论是nlp还是ocr都要用到深度学习,开始选择了很容易上手的keras,并花了一个多礼拜的时间用来研究了正则化和优化方法的理论知识。其实cnn、rnn等说实话从入门到现在也是循环往复,每一次看的时候都是发现又有些忘了,哦原来这个点是这样的,balabal

2017-10-20 11:30:34 409

原创 Failed to import pydot. You must install pydot and graphviz...-keras使用pydot出错(ubuntu16.04)

问题概览。。。 使用keras自带的可视化查看神经网络的结构时,需要借助pydot,碰到很多问题,踩了半小时的坑,终于解决了,希望能对大家有所帮助。 系统:ubuntu16.04 python:3.5包导入错误首先直接使用from keras.utils.vis_utils import plot_model进行可视化时,提示cannot import pydot and graphviz。。

2017-10-19 10:59:35 3553

原创 【深度学习】优化方法

写在前面仍然是读完Deep Learning之后的笔记和知识梳理,这些内容其实是偏理论层面的,后续的话可以结合代码进行讲解。DL关注的优化问题:寻找神经网络上的一组参数θ,显著降低代价函数J(θ),J(θ)通常包括整个训练集上性能评估(ER-经验风险)和额外的正则化项(SR-结构风险)。对于偏应用层面的可以直接看基本算法、参数初始化策略及自适应学习率算法。思维导图梳理知识体系自己在看书的时候有

2017-10-17 20:38:29 694

原创 【深度学习】正则化入门

一、前言最近在看DeepLearning这本书,看到了正则化这一章做一个知识梳理。首先用一张思维导图做个总结。二、传统机器学习中的正则化及相关概念泛化 学习方法对未知数据的预测能力。 决定机器学习算法效果(泛化能力)的因素: 1.降低训练误差——解决欠拟合问题 2.缩小训练误差和测试误差的差距——解决过拟合问题 3.一个好的机器学习算法是避免了过拟合同时也避免了...

2017-10-12 16:42:36 1010

原创 思维导图浅析入门知识图谱(Knowledge Graph)

用思维导图画了个知识图谱的入门知识梳理

2017-10-09 18:49:24 4697 1

原创 机器学习之朴素贝叶斯(Naive Bayes)

概述1.数学建模2.参数估计方法3.最大化后验概率假设-MAP的理解4.reference概述朴素贝叶斯,朴素的含义在与对输入数据的特征做了独立性假设,简化了模型。贝叶斯顾名思义,采用了贝叶斯定理。一句话总结,基于贝叶斯定理和独立假设的分类方法。参数估计中极大似然估计与贝叶斯估计的区别,以及参数的理解。最大后验(MAP)假设的理论依据。1.数...

2017-09-26 19:28:54 777

原创 机器学习之逻辑回归(logistic regression)

概述逻辑斯蒂回归实质是对数几率回归(广义的线性回归),是用来解决分类问题的。其中sigmoid用来解决二分类问题,softmax解决多分类问题,sigmoid是softmax的特殊情况。数学建模直接针对分类可能性建模。参数学习可用极大似然估计或贝叶斯估计,利用极大似然估计求得的目标函数与交叉熵损失一致。梯度下降之sigmoid和softmax函数的求导。一、基本...

2017-09-17 23:01:05 3450 2

原创 tesseract-ocr 4.0 安装及使用

Tesseract-ocr 4.0安装及使用主要介绍linux,windows操作系统下的安装,后续补充macos。简单介绍一下引擎的安装及使用,因为最近做的项目用到图片文本识别,于是从win10切换到ubuntu,都进行了安装。下一篇和大家分享在python使用tesseract。目录Tesseract-ocr 40安装及使用目录Tesseract-ocr 40介绍ubuntu1604

2017-09-15 14:14:56 3797

一天搞懂深度学习

台湾李宏毅教授的100页ppt深入浅出讲解深度学习,也被称作一天搞懂深度学习

2017-10-18

A C-LSTM Neural Network for Text Classification.pdf

一篇论文,结合了cnn和lstm的深度网络用来做文本分类。

2017-10-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除