不休的turkeymz-CSDN博客

原创【分数0.864】千言数据集：文本相似度

基于经典神经网络与BERT的文本相似度对比

2022-02-23 10:49:40 2494 1

原创【12月Top 2】MarTech Challenge 点击反欺诈预测

百度点击反欺诈预测赛道baseline最终得分：89.1713

2021-12-31 15:08:12 1868

循环神经网络计算图计算图的引入是为了后面更方便的表示网络，计算图是描述计算结构的一种图，它的元素包括节点(node)和边(edge)，节点表示变量，可以是标量、矢量、张量等，而边表示的是某个操作，即函数。下面这个计算图表示复合函数关于计算图的求导，我们可以用链式法则表示，有下面两种情况。情况1情况2[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SUose3jf-1638344566342)(https://datawhalechina.github

2021-12-01 15:43:42 1222

原创【深度学习笔记】5.卷积神经网络

CNNCNN（Convolutional Neural Networks，CNN）中文名叫卷积神经网络。通常情况下，我们使用全连接神经网络的时候，权重矩阵的参数非常多。其使得整个网络收敛非常缓慢。但在自然图像处理中都具有局部不变性的特征，即尺度缩放、平移、旋转等操作不影响其语义信息，但是全连接前馈网络很难提取这些局部不变特征。所以就引入的CNN。CNN也是前馈神经网络，其最大的区别是受生物学上感受野的启发，引入了卷积核的概念。卷积卷积是一种计算方式，其连续卷积和离散卷积可以表达为如下形式：{(f

2021-11-27 21:07:08 3257

原创【深度学习笔记】4.前馈神经网络

前馈神经网络发展历程神经元（M-P）神经元是1943年由两名科学家首次提出的神经元模型。在M-P模型中，神经元接受其他n个神经元的输入信号(0或1)，这些输入信号经过权重加权并求和，将求和结果与阈值(threshold) θ 比较，然后经过激活函数处理，得到神经元的输出。y=∑i=1nωijxi+θy=\sum^n_{i=1}\omega_{ij}x_i+\thetay=i=1∑nωijxi+θM-P 模型可以表示多种逻辑运算，如取反运算、逻辑或、逻辑与。取反运算可以用单输入单

2021-11-24 16:17:45 1146

原创【深度学习笔记】3.机器学习基础

机器学习基本概念机器学习指利用数学手段，使得计算机拥有相认一样的学习与总结能力。具体来说就是通过寻找数据中的规律，然后预测未知数据的技术。机器学习大致可分为3类：监督学习：学习已知数据特征与数据标签，预测未来数据的标签非监督学习：直接通过数据特征来预测数据标签强化学习：通过不断的训练回馈来优化的模型机器学习任务可分2类：监督学习：分类、回归非监督学习：聚类、降维数据集数据集样本是需要观察的数据的集合。通常用D(x_i)来表示，x_i是一个向量，表述数据集合中的第i个样本。其

2021-11-24 16:17:12 527 2

原创【深度学习笔记】2.数学基础

数学基础矩阵矩阵的基础知识矩阵：矩阵式一个二位数组，每一个元素可以通过行+列索引获得张量：通常高纬度的数据都将张量。0阶：标量1阶：矢量2阶：矩阵3阶或以上：张量矩阵的秩：矩阵列向量中的极大线性无关组的数目，记作rank(A)矩阵的逆若矩阵A为方阵，当range(A)<n，称A为奇异矩阵或不可逆矩阵；若矩阵A为方阵，当range(A)=n，称A为奇异矩阵或不可逆矩阵；矩阵的逆可以记作A−1A^{-1}A−1其中则有AA−1=A−1A=InA

2021-11-24 16:15:59 310

原创【深度学习笔记】1.深度学习发展史

深度学习发展史人工智能分类人工智能分为3类：强人工智能：认为有可能制造出真正能推理和解决问题的智能机器弱人工智能：认为不可能制造出能真正进行推理和解决问题的智能机器超级人工智能：彻底超越人类的机器三次浪潮人工智能的发展大致可分为3个阶段第一阶段是1956 - 1980左右。这时候大部分处于发现的阶段，证明发展发力，相对比较缓慢第二阶段是1980 - 2000左右。这时候人工智能得到大量的发展，期间研究出很多机器学习的算法第三阶段是2000 - 至今。人工智能全面开花，涉及技术被应

2021-11-24 16:14:23 1240

原创 LDA主题模型的原理和建模

目录什么是LDA主题模型背景知识贝叶斯理论gamma函数多个分布博鲁尼分布二项分布多项分布beta分布Dirichlet 分布开始了解LDAPython建模什么是LDA主题模型首先说明一下什么是主题模型。这里的主题模型是把一份份不同的文本内容通过某种方式来找到这些文本对应的主题。打个比方：我有一堆新闻类文档，但我想将这对文档进行主题分类。到底是娱乐？军事？政治？等主题。这时候就使用到主题模型。而这里的LDA和特征工程的LDA不一样。全名Latent Dirichlet Allocation，是一款基于

2021-02-05 18:00:26 4002 1

原创基于Flask的优雅日志记录

目录前言Logging日记级别配置改造初始化配置添加配置打印日志请求日志拦截前言在之前的文章中我们讲过Flask项目的创建和Flask项目的部署。但在实际项目的运行中，少补了会发生一些我们无法预知的错误。而这个时候日志的输出就发挥着重要的左右。本文将基于Flask服务对日志格式就行修改，并按日期作为文件名进行本地化存储。Logging讲到日志，我们总不能每一次都print()这么low的对吧？所以这里先介绍一下logging模块。它提供一套完成的日志API，可以完美与我们的Flask服务契合。日记

2021-02-02 14:24:28 7695

原创基于Flask的python服务部署

目录前言改造前言在上一篇文章中，我们知道了如何利用flask结合python来开发我们的微服务应用。具体文章地址在这里https://blog.csdn.net/turkeym4/article/details/112802300但在实际项目中，少不了的是我们需要把项目部署至linux服务当中。总不能每一个都执行python app.py方法。另外大家都知道python是单线程的，所以仅仅用flask内置的容易可能无法承受一个高并发。所以这里我们讲一下如何搞定flask的部署问题。改造刚刚有

2021-01-21 15:47:17 490

原创基于Flask的python服务创建

目录前言调研服务创建结构的改造项目运行总结前言最近遇到一个java调python的问题。过去我们的架构是java通过ssh进入python服务器然后执行命令来运行。这对后面升级非常不友好，而且开发负责度高。所以现在考虑开发一个python服务，通过http的方式调用python模型。调研初期调研python的web服务框架（有点类似SpringBoot的那种），市面上常用的大概分两种：Django：市面上使用率最高的，功能齐全，三方库丰富Flask：轻便，功能简单网上有一个有趣的例子，可以

2021-01-19 11:53:47 701 1

原创使用Python创建各式数据库连接

标题mysqloraclepostgresql国产达梦整合本文主要描述各种数据库产品的python连接方式。大部分连接以sqlalchemy为核心，调用不同的驱动，创建连接提供pandas或其他使用。所以使用的大前提下要安装sqlalchemy以及对应sql产品的依赖包pip install sqlalchemymysqlpip install mymysql# mysql版获获取连接方式# pip install mymysqldef getMysqlConnection(host, po

2020-12-23 11:48:14 717

原创 Spingboot利用AOP+注解实现优雅的日志记录

利用Spring AOP + 注解的方式。实现Spring Boot自动日志记录功能。完全解放繁所的日志类代码编写。使代码更简洁，更美观

2020-06-23 15:24:57 1296

原创 SpringBoot+Swagger2及访问重定向

目录简介改造简介Swagger是一款RESTful接口的文档在线自动生成、功能测试功能框架。一个规范和完整的框架，用于生成、描述、调用和可视化RESTful风格的Web服务，加上swagger-ui，可以有很好的呈现。当我们在后台的接口修改了后，swagger可以实现自动的更新，而不需要人为的维护这个接口进行测试。所以为了方便API的测试及查看，我们一般会在项目中引入swagger-ui来协助我们完成工作。改造首先再pom文件里面我们需要引入swagger依赖 <!-- sw

2020-06-21 16:02:46 14546

原创 SpringBoot+Logback实现日志输出

目录开言操作结果附录开言在日常项目中，我们有可能会遇到各式各样的异常错误。而排查这些异常的最有效的入口就是分析日志。所以，每一个线上的项目都必须要有一套完成的打印机制。以确保系统出问题之后可以有根可续。本文我们将结合logback在我们的项目中添加日志打印及落地的功能。这里并不需要任何的添加依赖操作，因为Springboot其实已经有帮我们结合了logback的依赖。有兴趣的同学可以点开一下项目的parent就可以找到。操作logback配置文件在resource目录里面添加一个日志配置文件。

2020-06-18 16:27:05 3611

原创 SpringBoot全局异常处理及API规范化

目录开言改造结果附录开言在正常的服务开发中，我们往往会涉及大量的API开发。不管是成功还是失败的响应，不同的API总有着不同的返回。这给我们的客户端带来很大的不同性。所以本文将延续《从零搭建SpringBoot脚手架与SpringCloud生态》的课题项目，为我们的服务添加优雅的API返回及统一的全局异常处理。这里最核心的是两个Spring注解。它们分别是@ControllerAdvice和@ExceptionHandler。大致讲一下这两个注解：@ControllerAdvice：从字面上就可以

2020-06-17 20:05:16 1758

原创 SpringBoot开发API与源码解读

目录创建第一个APIController配置详解返回格式请求方式参数接收附录创建第一个API在我们开发Java服务的时候，少不了的就是暴露API供其他系统http访问。而这当中最基础的涉及访问路径、端口、参数等信息。接下来将基于一开始的项目，创建第一个API。项目地址与课题目录都在附录。首先我们需要定义服务的访问端口，这里以8080为例子。SpringBoot提供了修改服务端口的配置，我们只需要修改配置文件中的server.port即可。这里我稍微把application.proties文件改名成ap

2020-06-16 19:26:19 859

原创 SpringBoot启动过程与项目创建

从零创建一个SpringBoot服务，并通过源码分析它的启动过程

2020-06-16 14:49:17 587

原创从零搭建SpringBoot脚手架与SpringCloud生态

从零开始搭建SpringBoot脚手架，以及构建简单的SpringCloud生态集群

2020-06-15 14:32:20 1190

原创 Dataframe GroupBy的顺序错误

最近在实际项目使用Dataframe的时候遇到一个坑。那就是假如我先对Dataframe进行GroupBy 分组，然后再对各组进行遍历。它的顺序是并不是我们之前的排序顺序。具体如下：在import pandas as pdtest_df = pd.DataFrame([[1,88,888],[1,99,999],[3,33,333],[3,44,444],[3,55,555],[6,66...

2020-03-26 15:42:35 4253 6

原创 Python 元组转字符串或列表

1.单一字符串型元祖转字符串t1 = ('a','b','c','d','e')s1 = "_".join(t1)print('t1:',t1)print('s1:',s1)t1: (‘a’, ‘b’, ‘c’, ‘d’, ‘e’)s1: a_b_c_d_e2.混合数据类型元组转字符串t1 = ('a','b',1,2,'e')s1 = '_'.join(map(str, t1...

2020-03-17 19:16:08 5571

原创【分类算法】K-NN

目录K-NN的定义K-NN的定义今天，我们来分享一个“街知巷闻”级别的分类算法 —— K-NN。相信提到这个词的时候小伙伴们都有：噢~是它。那么到底什么是K-NN呢？看过过去文章的都知道，我比较喜欢拆解算法名字来初步理解算法是做什么的。K-NN，全称叫做：K-Nearest Neighboors，中文翻译：K-最近的邻居们。假设我们的数据如下图，有很多个点。首先解释最近的，看到远近就应该想...

2020-01-20 17:33:47 878

原创【分类算法】决策树（三）

回顾上文这篇文章应该是机器学习算法决策树系列的最后一篇了。前两篇文章我们分别讲了决策树的基本概念、构造过程、算法推导以及手动构建决策树。有需要回顾的效果版可以点击链接【分类算法】决策树（一）【分类算法】决策树（二）决策树的剪枝...

2020-01-19 16:08:59 519

原创【分类算法】决策树（二）

目录上集回顾决策树的过程上集回顾今天我们继续学习决策树的相关知识。这里首先回顾一下上期的知识。在上一期里面我们主要讲到了：什么是决策树决策树的训练过程熵和Gini系数的计算这里如果忘记或者忘记这些知识的可以去回顾一下。特别是熵和Gini系数的计算！！！因为接下来我将围绕他们去手动构建一棵完整的决策树。决策树的过程这里首先提一下决策树的构造思路。随着树深度的增加，节点的熵值要迅速...

2020-01-18 14:53:00 630

原创【分类算法】决策树（一）

定义决策树是一机器学习当中经典的算法。通过名字理解，可以分为决策、树。所谓的决策，就类似于一小部分分类，把数据样本分成哪一类。而树，就是这么一堆小的分类器最终组成一个树形结构。最后得到我们今天学习的决策树算法。所以决策树是由多个支点组成的分类算法，而每一个支点都是一个小型的分类器。它属于机器学习中的监督学习，所以这个算法需要带标签的数据才能完成。稍微举一个例子，假设一个班级学生数据，我们可以通...

2020-01-14 22:12:47 832

原创【分类算法】逻辑回归

逻辑回归是一个监督学习中的分类算法。他的核心思想就是通过Sigmoid函数的引入，使一条线性回归的线变成一个二分类问题。所以对于Sigmoid函数的理解和整个推导式逻辑回归的核心。

2019-12-22 15:07:28 989

原创【分类算法】什么是分类算法

目录定义分类与聚类分类过程方法定义分类算法的本意就是对我们的数据分进行分类。把它们分到已知的每一个类别。就像一个篮子里面有很多橙子和苹果，机器会通过我们训练出来的模型，对篮子里的水果进行分类。比如：红色 = 苹果，橙色 = 橙子。若要让机器直到这种规则，我们就需要一定量的带标签的“红/橙”标签的数据。然后让模型学习，噢，原来是这种分类规则。所以分类算法往往需要“带标签”的数据。它是一个监督学...

2019-12-14 11:47:10 11865

原创【回归预测】线性回归

线性回归就是给定一个确定的函数公式，当我们有新的样本进来的时候我们可以通过这个公式预测出该样本的结果。线性回归最常见的例子就是房价的预测。就如我第一篇文章说的，当我们得到一个面积与房价的关系方程的时候。我们可以预测任意面积房子的价格。

2019-12-07 12:28:36 2721

原创机器学习知识分享目录

算法聚类算法什么是聚类层次聚类K-MeansK-MediodsDBSCAN

2019-12-07 10:07:18 1242

原创【聚类算法】DBSCAN详解

今天，我们一起学习聚类算法分享章节中中的最后一类 —— 密度聚类算法。而在密度聚类里面最具代表性的是DBSCAN。（Density-Based Spatial Clustering of Applications with Noise）对应的中文翻译就是基于密度的噪点空间聚类法。名字是不是有点拗口？其实没关系。你只要记住它是基于点密度的聚类方法就可以了。

2019-12-07 10:00:15 2028

原创【聚类算法】K-Mediods算法详解

PAM算法其实就是簇围绕中心点。所以也可以称为中心点围绕划分法。初步认识算法意思之后，接下来我们将加深学习这个算法。

2019-11-25 22:30:24 13257 4

原创【聚类算法】K-Means算法详解

上期讲聚类算法的时候我们有提到过，聚类算法有很多种。其中一种层次聚类我已经分享过了。需要的请看我另外一篇文章。而几天，我们将聚类算法中的另外一个算法，也是用得最多的算法。它属于众机器学习算法中的必学知识。就如同线性回归、逻辑回归一样。那么BB了这么久，它到底是谁了？没错，就是K-Means算法。没错，K-Means是非常常见的聚类算法，所以它数以非监督学习的算法。这个算法最大的特点是简单，好理解，运算速度快，但是只能应用于连续型的数据。要理解K-Means算法，你可以把它拆分成2部分。什么是K？什么是Me

2019-11-23 16:32:11 2051

省市区json字典映射关系

千言数据集：文本相似度

MarTech Challenge 点击反欺诈预测数据集

cudnn-11.3-windows-x64-v8.2.0.53.zip

基于VMbox的CentOS 8 的虚拟机

空空如也