king的江鸟-CSDN博客

原创已经编译好的opencv QT creator直接使用

使用QT安装opencv，已经编译好的opencv ，对应好版本和编译器即可不必大费周折sign~~~~~~~~~~https://github.com/huihut/OpenCV-MinGW-Build

2020-12-06 01:04:19 592

原创 pymysql的解码bug修复，解决decode error

使用pymysql 出现utf-8 codec can't decode bytes找到pymysql安装包的源码修改pymysql下的connections脚本,pymysql从数据库拿记录进行转码没有进行异常处理。 def _read_row_from_packet(self, packet): row = [] for encoding, converter in self.converters: try: .

2020-06-28 11:16:00 592

原创 pytorch BILSTM-CRF bacth版本实现

import torchimport torch.nn as nnimport torch.optim as optimimport torch.utils.data as Datatorch.manual_seed(1)IF_CUDA = Falseif torch.cuda.is_available(): try: IF_CUDA = True ...

2020-03-23 14:16:14 2622 12

原创 pytorch bilstm-crf的crf score代码实现详解

本文适合已经基本了解crf原理的读者，深入探究代码层面的实现原理1. _forward_alg代码 def _forward_alg(self, feats): # Do the forward algorithm to compute the partition function init_alphas = torch.full((1, self....

2020-03-04 16:49:54 1154

原创 pytorch使用batch训练lstm网络实现

pytorch使用batch的时候一定要注意训练和预测的区别，通常需要编写predict代替forward，另外loss_function也需要针对batch进行重构。接下来我会展示出两段代码，展示使用batch的细节。1. 未使用batch的lstm#导入相应的包import torchimport torch.nn as nnimport torch.nn.functional...

2020-02-23 16:32:28 5192 1

原创 windows10，docker部署tensorflowserving

1.使用docker获取tensorflowserving的镜像tensorflow官方已经非常方便的提供了tensorflowserving镜像，因此使用docker来完成tensorflowserving部署。这里主要讲一下windows使用docker的方法。window10已经可以使用hyper-V虚拟管理工具，直接下载docker for windows。下载安装完成后，doc...

2020-01-23 17:34:16 1561

原创 ubuntu编译tensorflow 支持AVX,AVX2等指令集

1.下载安装bazel$ sudo apt-get update && sudo apt-get install bazelhttps://docs.bazel.build/versions/master/install-ubuntu.html2.克隆代码$ git clone https://github.com/tensorflow/tensorflo...

2020-01-07 18:15:49 2009

原创 L1正则和L2正则对网络参数的影响

一、正则化的来源在深度网络的训练中，参数如果没有一个”正则化”的限制，很可能会导致过拟合（容易过大或过小），因此在制定损失函数时，往往加入对参数的约束，这就是正则化，通常的正则化有L1正则，L2正则或者两者的搭配权重使用。无论是L1还是L2正则，都有着把参数量变小的效果，但是L1正则由于函数图像的特殊性，导致了一种稀疏化的特性，便于选择特征。二、L1正则的稀疏化选择特...

2020-01-06 22:30:07 503

原创 Simhash亿万级别查重算法在实际使用中的问题及改进

1. Simhash不同于正常的hash值生成，它不仅能区别样本，也能通过海明距离得到两个样本的相似度，通常的simhash通过以下几个步骤生成。文本分词词向量加权所有词向量加权之后求和降维生成hash值我们可以使用官方的simhash包来生成from simhash import Simhashcontent_list = [content_word_list]#分词...

2019-09-29 13:42:17 964

原创编译cython pyx使用的setup.py文件

from distutils.core import setupfrom distutils.extension import Extensionfrom Cython.Distutils import build_extimport numpyfilename = 'bbox' # 源文件名full_filename = 'bbox.pyx' # 包含后缀的源文件名setup...

2019-08-30 14:37:32 1535

原创解决Keras多线程机制和flask多线程冲突的方法

在使用flask部署Keras，tensorflow等框架时候，经常出现FailedPreconditionError: Attempting to use uninitialized value batchnormalization_或者Tensor Tensor("crf_1/cond/Merge:0", shape=(?, ?, 260), dtype=float32) is no...

2019-08-30 11:47:40 2242 1

转载 windows python安装cython和C++编译器

windows安装cython和C++编译器：so here is the method:1: install cython by runningconda install -c anaconda cythonin Anaconda prompt2: go inC:\Users\Utilisateur\Anaconda3\Lib\distutilsor wherever you...

2019-08-30 11:39:27 2341

原创 conda管理python包出现的安装问题（pip install setuptools）

RemoveError: 'setuptools' is a dependency of conda and cannot be removed from conda's operating environment.在使用pip install setuptools之后再也无法安装其他的python包，（亲测除了whl可以其余的都不可以）百度谷歌都无果，最后通过升级默认的conda版本来...

2019-07-26 16:18:50 4361

原创 FCN中反卷积的维度变换

1.反卷积的填充原则我们知道，正向卷积的缩放系数和步长stride有关系，因此当我们想要反卷积回原来的大小时，stride也是我们必须的参数，如下图所示：如果我们想让特征图缩放为原来的32倍，那么此时我们的stride就应该设置为32，padding0的方式为每个featuremap的像素每隔一个填充stride-1个，也就是填充31个0.2.维度变换解释...

2019-06-22 15:31:15 645 7

原创高斯分布的样本方差的无偏估计

（一）高斯分布高斯分布又称正态分布，是大自然中最常见的一种数据分布方式，在机器学习的各类算法中，经常要遇到随机数的生成，我们通常采用高斯分布来进行随机数的初始化。下面是高斯分布的概率密度函数：其中是高斯分布的均值，是高斯分布的方差。（二）无偏估计现实生活中，通常要面...

2018-12-21 17:05:51 12165

原创信息论中的熵

（1）编码长度的推算按照0,1编码方式，信息量假设为N，那么所需要的位数为logN，底数为2,。那么如果在一个样本中的概率分布x~P，那么编码长度可以通过[1]式确定。事实上当一个概率很小的事情发生的时候，这个事件代表着更大的信息量，所以寻求一个函数图像能够在接近0的时候信息量趋向正无穷，而且当函数自变量取值为1（即某个事件一定发生）时，信息量为0，对数函数就刚好满足了需求。打个...

2018-12-07 19:21:15 893

原创卷积神经网络&&Mnist

（一）构造双层卷积层和池化层from tensorflow.examples.tutorials.mnist import input_dataimport tensorflow as tfmnist=input_data.read_data_sets("MNIST_data",one_hot=True)sess=tf.InteractiveSession()def weigh...

2018-09-10 21:48:50 283

原创 TensorFlow&&Mnist

利用TensorFlow实现mnist数据集的分类预测，推荐使用jupyter，这应该是我目前接触到的编程体验最好的一个平台了，很考验代码编程基础，因为不会很明显的告诉你在哪出错，需要仔细去研究每一行代码，形式上和python自带的idle有点类似，但是功能却强大了很多，Markdown很实用，很适合用来做教程。（一）获取TensorFlow自带的mnist数据集import tenso...

2018-09-06 10:22:59 728

原创 FP-growth算法（APriori的改进版本）

事实证明想要优化一个算法要付出巨大的努力，甚至要将原本的算法推倒重来，FP-growth让我深刻的理解了这一点，为了改进Apriori算法（仅仅提高两个数量级）就要放弃原本算法思想很简单的算法，强行去构造一颗让人捉摸不透的树，并采用迭代递归得到频繁集，而且这种算法不能和Apriori算法一样可以发现关联规则。下面是具体的算法实现。（一）创建FP树的数据结构class fpleave: ...

2018-08-17 18:05:25 1568

原创 Apriori算法（频繁集与关联分析）

这个算法用来发现最常一起出现的类，例如超市可以利用这个算法来看什么商品最经常一起出现，从而在摆放位置上进行优化，一个很有名的例子是美国中西部一家超市发现周四男人们经常会买啤酒和尿布，但是即使发现了这个规则，还是没有将其摆在一起,说明超市按照种类摆放的方法已经根深蒂固了。。。不过将这两个摆放在一起还是怪怪的哈哈哈（一）Apriori原理如图所示，5个商品的组合模式就有种，当商品变大的时...

2018-08-14 18:24:18 1279

原创 SVM算法（深入理解拉格朗日乘子法与KKT条件的证明）

SVM应该是一个应用到数学知识很多的AI算法，关于KKT的证明花了很长时间，里面涉及到大量线性代数的知识。对偶关系、方向导数与梯度的关系、梯度方向与构造的可取区域的关系、拉格朗日乘子引入的真实含义等等。（一）间隔与支持向量SVM（support vector machine）支持向量机，最重要的就是在训练样本集中找到支持向量。如图所示为最简单的二维平面上的分类，要想将圆圈一类...

2018-08-10 22:06:17 9974 1

原创 Logistic回归

svm由于篇幅较大，暂时延迟一下，先更新一个logistic回归。 logistic回归是一种最优化算法，基本思想是根据现有数据对分类边界线建立回归公式，以此进行分类。训练分类器的做法是寻找最佳拟合参数，是一种二值型分类算法，当然二值型分类可以推广到n类型分类，对每一种分类需求分别建立模型即可。（1）加载数据我们在二维坐标系上建立模型，以往对应的xy轴分...

2018-08-05 17:32:58 215

原创 AI算法之NaiveBayes（基于贝努利模型）

朴素贝叶斯是一个基于概率论的算法，如下公式为贝叶斯准则: 它经常被用来进行文本分类，之所以被称为“naive”，是因为这个算法有两个假设，第一个假设是特征之间是相互独立的，第二个假设是每个特征是同等重要的，也就是说当利用这种算法进行文本分类的时候，不考虑文本中词汇之间的相互关系，以及重...

2018-08-01 16:26:48 611

原创 AI算法之决策树

信息增益作为决策树的节点决策基础，因为训练集不涉及到连续值，本文采取的是ID3算法在信息增益中，衡量标准是看特征能够为分类系统带来多少信息，带来的信息越多，该特征越重要。对一个特征而言，系统有它和没它时信息量将发生变化，而前后信息量的差值就是这个特征给系统带来的信息量。所谓信息量，就是熵。假如有变量X，其可能的取值有n种，每一种取到的概率为Pi，那么X的熵就定义为： ...

2018-07-26 00:13:52 627

原创 AI入门算法之KNN（手写数字识别）

训练集和测试集来自点击打开链接数字样本的处理方式是将其从32*32的0,1矩阵转换成1*1024的Numpy数组例如其中的一个分类标签为0的32*32矩阵可表示为：0000000000000111100000000000000000000000000011111110000000000000000000000011111111110000000000000000000111111111111110...

2018-07-08 16:22:05 842

欲上青天揽明月