自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

tian_panda的博客

NLP & ML & 。。。。。。

  • 博客(25)
  • 资源 (1)
  • 收藏
  • 关注

原创 排序算法复杂度

0 前言 在这篇里,来记述下排序算法复杂度,空间&时间1 概念时间复杂度:对排序数据的总的操作次数。反映当n变化时,操作次数呈现什么规律。空间复杂度:是指算法在计算机内执行时所需存储空间的度量,它也是数据规模n的函数。 稳定:如果a原本在b前面,而a=b,排序之后a仍然在b的前面。不稳定:如果a原本在b的前面,而a=b,排序之后 a 可能会出现在 b 的后面。2...

2018-08-30 09:14:03 728

原创 经典排序算法详解

0 前言昨天做题发现对排序算法说懂又很模糊,说不懂又知道。所以今天强化下记忆。1 类别从上图可以看出主要分两大类:非线性时间比较类排序:通过比较来决定元素间的相对次序,由于其时间复杂度不能突破O(nlogn),因此称为非线性时间比较类排序。线性时间非比较类排序:不通过比较来决定元素间的相对次序,它可以突破基于比较排序的时间下界,以线性时间运行,因此称为线性时间非比较类排序。...

2018-08-29 17:21:15 343

原创 激活函数之ReLU函数

0 前言激活函数的引入是为了增加神经网络模型的非线性,没有激活函数每层就相当于矩阵相乘。每一层输出都是上层的输入的线性函数,无论神经网络多少层,输出都是输入的线性组合,就是最原始的感知机加入激活函数,给神经元引入非线性因素,神经网络可以任意逼近任何非线性函数,这样神经网络就可以应用到众多的非线性模型中。1 激活函数之ReLU函数ReLU函数是目前比较火的一个激活函数,函数公式:,函...

2018-08-27 15:38:40 88130

原创 最优化算法之梯度下降法

0 前言    优化问题最常见的求解方式是迭代优化,常见的优化算法有梯度下降。因此来记录下梯度下降算法。1  原理    优化的目标是损失函数最小化,函数的梯度方向代表了函数值增长最快的方向,那么和它相反的方向就是函数减少速度最快的方向。梯度下降的优化思想是用当前位置负梯度(相反方向)方向作为搜索方向,也称“最速下降法”。梯度下降法是迭代算法,每一步需要求解目标函数与梯度向量。  ...

2018-08-27 14:20:29 4134

原创 @***装饰器(python)

0 前言:在阅读代码中,发现@***的什么的,原来这个就是大名鼎鼎的装饰器,然后就学习了下装饰器,记录下学习心得。1 装饰器介绍:python装饰器就是用于拓展原来函数功能的一种特殊的函数,特殊之处在于它返回的是一个函数。优点:不用更改原代码前提下可以新增函数的功能。应用场景:插入日志,性能测试,事务处理,提取大量函数中与本身功能无关的类似代码,达到代码重复使用的目的。2 ...

2018-08-21 14:14:25 184

转载 从理论到实践开发自己的聊天机器人

原文作者http://www.shareditor.com/blogshow?blogId=136跑通这篇文章的代码,因此转载过来,作为以后的自查。什么是神经网络这本小书一定要看:《Make Your Own Neural Network》,老外写的,200多页,没找到中文译本,原版百度一下可以下载到,他用非常通俗易懂的描述讲解了人工神经网络的原理并用代码实现,而且试验效果非常好,作为...

2018-08-08 11:59:23 4846

转载 算法工程师面试题

转载仅供学习:门https://blog.csdn.net/gzj_1101/article/details/79514902 八九月份就要开始找工作了,一直期待能够成为一名算法工程师,所以在这里总结一下算法工程师常见问题。期待9月秋招时能有一个好的结果。本篇博客会一直更新下去。  编程语言 基本算法 传统机器学习 常见机器学习问题 面试常见问题 深度...

2018-07-30 10:09:15 1011

转载 如何打造聊天机器人?

资料来源网站www.shareditor.com聊天机器人是可行的我:chatbot,你好!chatbot:你也好!我:聊天机器人可行吗?chatbot:你不要怀疑这是天方夜谭,我不就在这里吗?世界上还有很多跟我一样聪明的机器人呢,你听过IBM公司在2010年就研发出来了的Watson问答系统吗?它可比我要聪明100倍呢我:噢,想起来了,据说Watson在智力竞赛中竟然战胜...

2018-07-25 17:06:56 1095

原创 读取txt文件出现出现多余空行问题

0 前言昨天写一个简单的爬虫,批量读取txt文本的每行url,然后传到requests.get去解析,可是一个神奇的bug出现了,不管我怎么修改总是出现bug,原理上,应该没什么问题,所以一步步的查错,最终终于发现读取txt时出现错误,哎,学艺不精,花了不少时间。因此要纪念下这个小知识点。1 正文1.1 原理文件中每行末尾会有一个隐藏的换行符“\n”,读取的时候“\n” 就会被解析...

2018-07-24 14:07:26 6292 1

原创 共现关系

 0 前言在研究Text Rank算法时,有提到这个共现关系,从字面上很好理解,共同出现的关系,但是深究下,却发现有点绕。1 共现关系在文献计量学中,关键词的共词方法常用来确定该文献集所代表学科中各主题之间的关系。例如,需要通过分析一篇小说或剧本,来分析剧中各个角色之间的人物关系,可以用共现关系。一般我们认为,在一篇文章中的同一段出现的两个人物之间,一定具有某种关联,因此我们的程序...

2018-07-20 10:21:43 12799 2

转载 LDA模型理解

转载声明:这篇博客转自七月在线创始人v_JULY_v的博客0 前言    印象中,最开始听说“LDA”这个名词,是缘于rickjin在2013年3月写的一个LDA科普系列,叫LDA数学八卦,我当时一直想看来着,记得还打印过一次,但不知是因为这篇文档的前序铺垫太长(现在才意识到这些“铺垫”都是深刻理解LDA 的基础,但如果没有人帮助初学者提纲挈领、把握主次、理清思路,则很容易陷入LDA的细枝末节之中...

2018-07-16 16:08:21 11613 1

原创 阿里云服务器配置(django)

0 前沿最近在用django搭建一个web网站,然后使用到阿里云服务器,摸索摸索,磕磕碰碰的算是搭起来了,对于零基础的我,在这次学习中获得不少知识。1 服务器与域名的购买这个网上太多教程了,我用的是阿里云,不要问为什么,因为学生便宜。        对于服务器以前从没接触过(就在aws上注册个账号玩了玩),所以刚开始是两眼一抹黑啊,不过熟悉了阿里云的界面就好了,这就需要认真的看了,真是应了那句:世...

2018-07-16 10:01:17 1286

原创 对信息熵,信息增益的研究

对信息熵,信息增益的研究0 引言1948年香农提出“信息熵”的概念,解决了对信息的量化度量问题。信息熵这个词是C.E.香农从热力学中借用过来的。热力学中的热熵是表示分子状态混乱程度的物理量。香农用信息熵的概念来描述信源的不确定度。在信息增益中,衡量标准是看特征能够为分类系统带来多少信息,带来的信息越多,该特征越重要。对一个特征而言,系统有它和没它时信息量将发生变化,而前后信息量的差值就是这个特征给...

2018-07-13 09:51:46 7420

原创 Django 基本命令大全

0 最近在学习django方面的知识,看到自强学堂讲的很不错。力荐!!!1 新建一个django-project(项目)django-admin.py startproject 项目名2 新建app (一个项目有多个app,通用的app也可以在多个项目中使用)python manage.py startapp app-name或者 django-admin.py startapp app-na...

2018-07-09 14:20:50 597

原创 Linux基础操作----sudo: unable to resolve host错误

Ubuntu 在每次执行命令的时候,会报如下错误:tianmai@iZebgilejo9idbZ:/root$ sudo service nginx startsudo: unable to resolve host iZebgilejo9idbZiZebgilejo9idbZ 是阿里云创建服务器默认的hostname,这个错误其实对于实际操作没有影响 ,但是强迫症患者很不舒服错误原因:因为/e...

2018-07-05 09:26:50 4630

原创 Linux操作基础(一)

0 前言作为程序猿,离不开Linux操作。作为Linux小白,就记录下每次操作的Linux命令,方便记忆与回顾。1 切换用户        切换用户的命令是su,su是(switch user)切换用户的缩写。通过su命令,可以从普通用户切换到root用户,也可以从root用户切换到普通用户。从普通用户切换到root用户需要密码(该密码是普通用户的密码),从root用户切换到普通用户不需要密码  ...

2018-06-29 14:24:09 330

原创 从pagerank到textrank关键词提取

0 前言        最近在学习textrank关键词提取算法,因此研究了下它的由来。提到textrank那肯定忘不了大名鼎鼎的PageRank,那么首先简单的介绍下PageRank。1 PageRank        PageRank设计之初是用于Google的网页排名的,以该公司创办人拉里·佩奇(Larry Page)之姓来命名。Google用它来体现网页的相关性和重要性,在搜索引擎优化操作...

2018-06-28 17:16:35 2356 1

原创 经验分布函数理解

0 废话前言在阅读统计学习方法时,遇到经验分布,对于数学渣渣来说,有必要去深究一下,然后发现是如此的简单。1 正文简介(数学语言)        经验分布函数是与样本经验测度相关的分布函数。 该分布函数是在n个数据点中的每一个上都跳跃1 / n的阶梯函数。 其在测量变量的任何指定值处的值是小于或等于指定值的测量变量的观测值的数。        经验分布函数是对样本中生成点的累积分布函数的估计。 根...

2018-06-20 10:51:56 70117 8

原创 使用git上传代码到GitHub(步骤详解)

最近在准备搭一个服务器,要将代码上传到github上,因此,摸索了下如何用git上传代码。0 准备拥有GitHub账号安装git软件1 在Github的操作1.1进入GitHub主界面,然后点击NEW respostory,创建一个仓库1.2 填写相应的信息然后点击create respostoryRepository name: 仓库名称Description(可选): 仓库描述介绍Public...

2018-06-15 15:52:20 582 1

原创 chatbot聊天机器人技术路线

聊天机器人实现的技术途径大约可分为以下4种:(其中第一种是属于“调用第三方API”,也就是说核心代码和数据库不掌握在自己手里)(第二、三、四种属于开源框架,也就是说我们可以下载其源码,采用,相对快速的自己搭建一个聊天机器人,核心代码和数据库都掌握在自己手里)http://homepage.fudan.edu.cn/zhengxq/deeplearning/一、调用第三方API实现的聊天机器人 (仅...

2018-06-12 14:12:27 5845

原创 RPA与AI区别

RPA(机器人流程自动化)是一类自动化软件工具,它可以通过用户界面使用和理解企业已有的应用,将基于规则的常规操作自动化,例如读取邮件和系统,计算,生成文件和报告,检查文件等。因此,RPA的应用范围非常广泛。在未来,那些你不想做的枯燥的工作,也许真的可以不做了,重复化、标准化的工作都可以让机器人帮你完成。RPA适用的领域是企业具有明确业务规则、结构化输入和输出的操作流程领域,如财务、人力资源、供应链...

2018-06-04 16:34:35 49661 6

原创 联合概率

在机器学习经常出现联合概率,总是困扰者我。 联合概率分布简称联合分布,是两个及以上随机变量组成的随机向量的概率分布。根据随机变量的不同,联合概率分布的表示形式也不同。对于离散型随机变量,联合概率分布可以以列表的形式表示,也可以以函数的形式表示;对于连续型随机变量,联合概率分布通过一非负函数的积分表示。例子(离散型):联合概率是指在多元的概率分布中多个随机变量分别满足各自条件的概率。假设X和Y都服从...

2018-05-30 14:44:20 15772

转载 spark学习(二)之简单应用程序——词频统计

原博客地址: http://dblab.xmu.edu.cn/blog/1311-2/前面已经学习了Spark安装,完成了实验环境的搭建,并且学习了Spark运行架构和RDD设计原理,同时,我们还学习了Scala编程的基本语法,有了这些基础知识作为铺垫,现在我们可以没有障碍地开始编写一个简单的Spark应用程序了——词频统计。任务要求任务:编写一个Spark应用

2017-12-12 15:05:18 10962 1

转载 spark学习(一)

Spark的介绍Hadoop与StromHadoop:MapReduce:为海量数据提供了计算,但只有Map和Reduce操作,操作不灵活。HDFS(分布式文件系统):为海量的数据提供了存储。(把全部计算机的存储能力合在一起,数据通过网络在节点之间传输)。  Strom:一个分布式的、容错的实时计算系统。 大数据处理复杂的批量数据处理(bat

2017-12-12 09:58:03 347

转载 抓取网易云评论,生成词云图

非原创作品,转载自:http://blog.csdn.net/marksinoberg/article/details/70809830前言网易云音乐一直是我向往的“神坛“,听音乐看到走心的评论的那一刻,高山流水。于是今天来抓取一下歌曲的热门评论。并做成词云来展示,看看相对于这首歌最让人有感受的评论内容是什么。做成词云的好处就是直观以及美观, 其他的我也

2017-12-11 09:52:19 6360 2

屏幕操作转换为GIF动画图片软件

屏幕操作转换为GIF动画图片软件,操作简单,win7/8/10支持。

2018-07-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除