代码与诗-CSDN博客

原创机器学习之支持向量机

一、基本概念和数学公式1.点到直线的距离公式点P(x0,y0)P(x0,y0)P(x_0,y_0)到直线Ax+By+C=0Ax+By+C=0Ax+By+C=0的距离： d=|Ax0+By0+C|A2+B2−−−−−−−√d=|Ax0+By0+C|A2+B2d=\frac{|Ax_0+By_0+C|}{\sqrt{A^2+B^2}}2.函数间隔与几何间隔函数间隔点(xi,...

2018-08-28 21:12:13 165

原创 python常见错误

编码or解码问题写文件 UnicodeEncodeError: 'gbk' codec can't encode character '\u2764' in position 10: illegal multibyte sequence 这种错误经常发生在windows操作系统下，原因是当你使用如下代码写文件时，会创建一个新文件，而新文件的编码与你操作系统有关，所以更改默认编码方式即可...

2018-08-08 14:38:03 1003 1

原创 tensorflow踩坑记

不收敛问题损失函数不下降原因：多次初始化图变量对于计算图和符号编程仍然理解不到位。with tf.session() as sess: init_op = tf.global_variables_initializer() sess.run(init_op)...

2018-07-24 17:14:01 285

原创 logistic regression精简版笔记（重在体系和推导）

基础知识关于sigmoid函数（参考之前的博文）softmax函数 δ(Zj)=eZj∑Kk=1eZk j=1,2,...,K\delta(Z_{j}) = \frac{{e}^{Z_j}}{\sum_{k=1}^{K}e^{Z_k}} \space j = 1,2,...,K极大似然估计原理样本作为总体的一个采样，使用样本进行分布参数$\theta$的估计，可以得到多个估计，极大似

2018-03-15 22:28:20 268

翻译 2017优化方法改进-译Optimization for DL in 2017

写在前面这篇文章严格来说并不是译文，并不是逐字进行了翻译。想看英文原文戳这里，是Ruder的一篇博客，这里阅读以后做个搬运工。具体方法有解耦权重衰减、修改指数移动平均、使用退火方案微调学习率、热重启方案，以及后续提出的学习优化以及对于优化的理解。总的来说，针对当前优化方法的两大分支都有了不同的改进。可以发现，基于当前大多非凸优化的背景，新提出的方法具有通用性。解耦权重衰减、退火方案、热重

2017-12-31 17:00:02 567

原创深度学习实践向之优化方法

概览先说干货吧，如果面向应用，只关注哪一个方法更好用，下面这些总结希望能帮到你~ 最流行并且使用率很高的算法包括SGD、具动量（Momentum）的SGD、RMSProp、具动量的RMSProp、AdaDelta和Adam。具有自适应学习率的算法（以AdaDelta和RMSProp为代表）收敛速度更快一些，表现得更加鲁棒。基于SGD的算法相对而言收敛速度更慢一些，但是精调以后准确率可能会提高

2017-12-05 19:08:11 563

原创自然语言处理工具包jieba的使用

介绍jieba“结巴”中文分词：做最好的 Python 中文分词组件。官网如是说，其实实际使用的过程中体验还不错啦，清华thulac做了一个测评，jieba和thulac脱颖而出。这里简单介绍一下分词，词性标注及关键词提取的使用，目的是为nlp自然语言处理入门学习者的使用。Show your code环境：python3、linux、mac、win10皆可用（win10可能面临万恶的gbk编码问

2017-11-14 10:39:12 721

原创 Ubuntu16.04网络连接正常但是无法使用浏览器上网-浏览器代理设置

chromeubuntu16.04之前使用win10 chrome的时候经常会出现这样的问题，但也轻车熟路的解决问题。看下面的图右上角——设置——高级设置——打开代理设置——选连接——局域网设置关闭代理就ok了！ ubuntu呢。。。是的，正如你看到的，请你使用command line。那就是用呗，打开terminate敲如下命令。man google-chrom...

2017-10-31 20:54:16 46584 11

翻译 Attention和增强RNNs—翻译Attention and Augmented Recurrent Neural Networks

关于翻译因为之前看了Colah的博客Understanding LSTM Networks觉得受益匪浅，便关注了他的网站，最近又看了他和同事写的关于注意力机制（原文地址）的文章，便翻译一下，有些地方不到位，各位谅解。作为深度学习重要基石之一的RNN允许神经网络可以处理诸如文本、音频、视频这些序列化的数据。他们可以从一个序列提炼出更高层次的理解，来注释序列甚至可以从头开始来生成新序列。基本的R

2017-10-26 11:53:03 324

翻译理解LSTM网络—翻译Understanding LSTM Networks

写在前面对colah的博客Understanding LSTM Networks进行了翻译，觉得这篇博客写得特别好，深入浅出，有些地方翻译不到位，希望大家谅解。循环神经网络—Recurrent Neural networks时时刻刻人类的思考都不会从头开始。当你读这篇文章的时候，你根据你之前对于单词的理解理解每个单词。你不是扔掉所有而每次都从头开始思考。你的思考具有持久性。[这段话的核心就是时间的延

2017-10-21 22:41:44 601

原创 TensorFlow入门

关于入门入门总要采坑，像我，开始看了tensorflow架构，跑了一些代码，随后就没有继续，而是投入到导师的项目中去了。该来的躲不掉，项目深入无论是nlp还是ocr都要用到深度学习，开始选择了很容易上手的keras，并花了一个多礼拜的时间用来研究了正则化和优化方法的理论知识。其实cnn、rnn等说实话从入门到现在也是循环往复，每一次看的时候都是发现又有些忘了，哦原来这个点是这样的，balabal

2017-10-20 11:30:34 409

原创 Failed to import pydot. You must install pydot and graphviz...-keras使用pydot出错（ubuntu16.04）

问题概览。。。使用keras自带的可视化查看神经网络的结构时，需要借助pydot，碰到很多问题，踩了半小时的坑，终于解决了，希望能对大家有所帮助。系统：ubuntu16.04 python：3.5包导入错误首先直接使用from keras.utils.vis_utils import plot_model进行可视化时，提示cannot import pydot and graphviz。。

2017-10-19 10:59:35 3553

原创【深度学习】优化方法

写在前面仍然是读完Deep Learning之后的笔记和知识梳理，这些内容其实是偏理论层面的，后续的话可以结合代码进行讲解。DL关注的优化问题：寻找神经网络上的一组参数θ，显著降低代价函数J(θ)，J(θ)通常包括整个训练集上性能评估（ER-经验风险）和额外的正则化项（SR-结构风险）。对于偏应用层面的可以直接看基本算法、参数初始化策略及自适应学习率算法。思维导图梳理知识体系自己在看书的时候有

2017-10-17 20:38:29 694

原创【深度学习】正则化入门

一、前言最近在看DeepLearning这本书，看到了正则化这一章做一个知识梳理。首先用一张思维导图做个总结。二、传统机器学习中的正则化及相关概念泛化学习方法对未知数据的预测能力。决定机器学习算法效果(泛化能力)的因素： 1.降低训练误差——解决欠拟合问题 2.缩小训练误差和测试误差的差距——解决过拟合问题 3.一个好的机器学习算法是避免了过拟合同时也避免了...

2017-10-12 16:42:36 1010

原创思维导图浅析入门知识图谱（Knowledge Graph）

用思维导图画了个知识图谱的入门知识梳理

2017-10-09 18:49:24 4697 1

原创机器学习之朴素贝叶斯(Naive Bayes)

概述1.数学建模2.参数估计方法3.最大化后验概率假设-MAP的理解4.reference概述朴素贝叶斯，朴素的含义在与对输入数据的特征做了独立性假设，简化了模型。贝叶斯顾名思义，采用了贝叶斯定理。一句话总结，基于贝叶斯定理和独立假设的分类方法。参数估计中极大似然估计与贝叶斯估计的区别，以及参数的理解。最大后验（MAP）假设的理论依据。1.数...

2017-09-26 19:28:54 777

原创机器学习之逻辑回归（logistic regression）

概述逻辑斯蒂回归实质是对数几率回归（广义的线性回归），是用来解决分类问题的。其中sigmoid用来解决二分类问题，softmax解决多分类问题，sigmoid是softmax的特殊情况。数学建模直接针对分类可能性建模。参数学习可用极大似然估计或贝叶斯估计，利用极大似然估计求得的目标函数与交叉熵损失一致。梯度下降之sigmoid和softmax函数的求导。一、基本...

2017-09-17 23:01:05 3450 2

原创 tesseract-ocr 4.0 安装及使用

Tesseract-ocr 4.0安装及使用主要介绍linux，windows操作系统下的安装，后续补充macos。简单介绍一下引擎的安装及使用，因为最近做的项目用到图片文本识别，于是从win10切换到ubuntu，都进行了安装。下一篇和大家分享在python使用tesseract。目录Tesseract-ocr 40安装及使用目录Tesseract-ocr 40介绍ubuntu1604

2017-09-15 14:14:56 3797

weixin_38516136的博客