自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(128)
  • 资源 (6)
  • 收藏
  • 关注

原创 完美解决m1/m1 pro/m1 max版mac安装pyaudio大坑

近期需要做一个语音识别的项目,然而pyaudio一个包耽误了我俩小时。。。各种找啊,真服了!配置:macbook pro(m1 pro)python 3.8首先安装speech_recognitionpip install SpeechRecognition结果一上来,直接遇到问题了,AttributeError: Could not find PyAudio; check installation输入pip install pyaudio,各种报错ERROR: Command err

2021-11-23 16:11:48 5430 3

原创 Zookeeper学习系列

1、Zookeeper学习(1)2、Zookeeper学习(2)——集群搭建和操作3、Zookeeper学习(3)——客户端命令行、API相关操作接下来一段时间,会学习hadoop、spark、hive等,会持续更新

2021-10-25 21:49:25 521

原创 腾讯微云下载慢解决办法

100kb/s——>10mb/s。腾讯微云下载只有100kb/s,怎么解决。。。

2021-10-24 10:24:31 4343

原创 Zookeeper学习

Zookeeper学习系列:1、了解Zookeeper,本地安装2、Zookeeper集群搭建和简单操作

2021-10-23 19:37:14 131

原创 windows下安装rasa和rasa-x

1.anaconda创建虚拟环境2.执行以下两条命令pip install rasa --ignore-installed ruamel.yamlpip install rasa-x --extra-index-url https://pypi.rasa.com/simple3.可能遇到的问题1)Microsoft Visual C++ 14.0 is required 的解决方案【环境配置】出现:Microsoft Visual C++ 14.0 is required 的解决方案2)网络问

2021-01-07 20:22:33 1005

原创 零基础C++学习(3)——项目:通讯录管理系统

利用前两节的知识,写一个通讯录管理系统。这是一个简单版本,后期还有很多优化。零基础C++学习(1)——数据类型、运算符和流程图零基础C++学习(2)——数组、函数、指针和结构体本教程主要利用C++来实现一个通讯录管理系统系统中需要实现的功能如下:添加联系人:向通讯录中添加新人,信息包括(姓名、性别、年龄、联系电话、家庭住址)最多记录1000人显示联系人:显示通讯录中所有联系人信息删除联系人:按照姓名进行删除指定联系人查找联系人:按照姓名查看指定联系人信息修改联系人:按照姓名重新修改指定

2020-11-24 16:32:01 251

原创 零基础C++学习(2)——数组、函数、指针和结构体

5 数组5.1 概述所谓数组,就是一个集合,里面存放了相同类型的数据元素**特点1:**数组中的每个数据元素都是相同的数据类型**特点2:**数组是由连续的内存位置组成的5.2 一维数组5.2.1 一维数组定义方式一维数组定义的三种方式:数据类型 数组名[ 数组长度 ];数据类型 数组名[ 数组长度 ] = { 值1,值2 ...};数据类型 数组名[ ] = { 值1,值2 ...};示例int main() { //定义方式1 //数据类型 数组名[元素个数]; in

2020-11-23 20:14:39 277

原创 机器学习——逻辑回归常见面试题整理

逻辑回归1.介绍逻辑回归假设数据服从伯努利分布,通过极大化似然函数的方法,运用梯队下降来求解参数,来达到将数据二分类的目的。2.逻辑回归的损失函数和梯度下降参数迭代方法逻辑回归的损失函数是它的极大似然函数参数迭代方法3.逻辑回归为什么使用对数损失而不用平方损失损失函数一般有四种,平方损失函数,对数损失函数,HingeLoss0-1损失函数,绝对值损失函数。将极大似然函数取对数以后等同于对数损失函数。在逻辑回归这个模型下,对数损失函数的训练求解参数的速度是比较快的。至于原因大家可

2020-11-22 21:32:54 1786

原创 零基础C++学习(1)——数据类型、运算符和流程图

最近在学习C++,对于初学者来说,我觉得这份教程应该是最好的,很详细​。以后会持续更新。。。1 C++初识1.1 第一个C++程序编写一个C++程序总共分为4个步骤创建项目创建文件编写代码运行程序1.1.1 创建项目​ Visual Studio是我们用来编写C++程序的主要工具,我们先将它打开1.1.2 创建文件右键源文件,选择添加->新建项给C++文件起个名称,然后点击添加即可。1.1.3 编写代码#include<iostream>usin

2020-11-22 16:27:37 807 3

原创 树模型(1)——决策树常见面试题整理

决策树1.决策树的原理决策树是一种树结构,从根节点出发,每个分支都将训练数据划分成了互不相交的子集。分支的划分可以以单个特征为依据,也可以以特征的线性组合为依据。决策树可以解决回归和分类问题,在预测过程中,一个测试数据会依据已经训练好的决策树到达某一叶子节点,该叶子节点即为回归或分类问题的预测结果。从概率论的角度理解,决策树是定义在特征空间和类空间上的条件概率分布。每个父节点可以看作子树的先验分布,子树则为父节点在当前特征划分下的后验分布。2.信息增益和信息增益率的理解1)信息熵:信息熵用来度

2020-11-20 19:35:57 1104

原创 Linux学习,一篇就够!

1.Linux目录结构/:根目录,一般根目录下只存放目录,在Linux下有且只有一个根目录。所有的东西都是从这里开始。当你在终端里输入“/home”,你其实是在告诉电脑,先从/(根目录)开始,再进入到home目录。/bin: /usr/bin: 可执行二进制文件的目录,如常用的命令ls、tar、mv、cat等。/boot:放置linux系统启动时用到的一些文件,如Linux的内核文件:/boot/vmlinuz,系统引导管理器:/boot/grub。/dev:存放linux系统下的设备文件,访问该

2020-11-19 15:44:19 133

原创 小米自然语言处理平台(MiNLP)

https://github.com/XiaoMi/MiNLP小米自然语言处理平台(MiNLP)具备词法、句法、语义分析等数十个功能模块,已经在公司业务中得到了广泛应用。MiNLP-Tokenizer中文分词工具经过不断优化和实战打磨,已于2020年11月正式对外开源。我们计划在2021年Q2完成所有词法工具(词性标注和命名实体识别)的开源,从2021年Q3开始,我们将逐步开源句法分析和部分语义分析工具,和开发者一起打造功能强大、效果领先的NLP平台。...

2020-11-18 10:55:08 696 1

原创 《网络搜素原理》推荐

该课程来自北邮大佬:微博:爱可可-爱生活。https://www.bilibili.com/video/BV1zp4y1e7iN?t=72简介:北邮陈光老师的《网络搜索原理》公开课(2020),延续《Python编程与实践》的讲课风格,主打编程驱动、问题驱动的学习体验,用进化视角看技术更迭,培养搜索思维,开阔解决问题的思路。GitHub:https://github.com/fly51fly/Principle_of_Web_Search_2020...

2020-10-07 17:26:59 136

原创 半正矢公式:根据经度纬度计算两点间距离

今天七夕节,祝大家七夕节快乐!对于那些异地恋,要上班的人来说,并不能见面,不如一起来计算一下你和他(她)之间的距离吧。半正矢公式是一种根据两点的经度和纬度来确定大圆上两点之间距离的计算方法。Python语言:import mathdef geo_distance(origin, destination): ''' >>> origin = (48.1372, 11.5756) # Munich >>> destination = (52.

2020-08-25 09:00:15 5753 1

原创 中文医疗NLP领域 数据集,论文 ,知识图谱,语料,工具包

https://github.com/lrs1353281004/Chinese_medical_NLP

2020-08-08 18:26:53 553

原创 ACL2019——命名实体识别论文

1.Distantly Supervised Named Entity Recognition using Positive-Unlabeled Learning2.Dual Adversarial Neural Transfer for Low-Resource Named Entity Recognition3.Multi-grained Named Entity Recognition4.A Joint Named-Entity Recognizer for Heterogeneous Tag-

2020-06-17 16:33:12 1114

原创 融入词汇信息的基于字的命名实体识别

论文1:Chinese NER Using Lattice LSTM论文2:An Encoding Strategy Based Word-Character LSTM for Chinese NER

2020-06-16 16:59:24 458

转载 论文《Fast and Accurate Entity Recognition with Iterated Dilated Convolutions》

论文地址:Fast and Accurate Entity Recognition with Iterated Dilated Convolutions对于序列标注问题,普通的CNN有一个劣势:卷积之后,末层神经元可能只是得到了原始输入数据中一小块的信息。而对于命名实体识别,整个句子的每个字对当前需要标注的字产生影响。为了覆盖更多的信息,加入更多的卷积层,这样会导致层数越来越深,参数越来越多,为防止过拟合要加入更多的Dropout之类的正则化,带来更多的超参数,整个模型变得庞大和难以训练。BiLSTM之

2020-06-16 10:22:52 1779 2

原创 A Survey on Deep Learning for Named Entity Recognition(2020)

本文介绍Deep Learning 在命名实体识别上的应用,主要介绍三部分:输入的分布式表示、上下文编码器(用于捕获标签解码器的上下文)和标签解码器(用于预测给定顺序中词的标签)。命名实体识别(NER)的任务是识别文本中的组织、人和地理位置的名称以及货币、时间和百分比表达式。论文地址:A Survey on Deep Learning for Named Entity RecognitionNER资源:数据集和工具NER评估指标:NER系统通常通过将其输出与人工注释进行比较来进行评估。可以通过精

2020-06-15 14:06:12 1583

转载 BiLSTM-CRF模型中CRF层的解读

转自:https://createmomo.github.io/BiLSTM-CRF模型中CRF层的解读:文章链接:标题:CRF Layer on the Top of BiLSTM - 1 链接:https://createmomo.github.io/2017/09/12/CRF_Layer_on_the_Top_of_BiLSTM_1/标题:CRF Layer on the Top of BiLSTM - 2 链接:https://createmomo.github.io/2017/09

2020-06-07 11:09:22 243

原创 NLP数据增强综述

1.词汇替换1.基于词典的替换;从句子中随即取出一个单词,并使用同义词词典将其替换为同义词。2.基于词向量的替换采用预先训练好的单词嵌入,使用嵌入空间中最近的单词替换句子中的某些单词。3.基于TF-IDF的词替换TF-IDF分数较低的单词不能提供信息,因此可以在不影响句子的ground-truth的情况下替换它们。2.反向翻译反向翻译过程如下:把一些句子(如英语)翻译成另一种语言,如法语将法语句子翻译回英语句子。检查新句子是否与原来的句子不同。如果是,那么我们使用这个新句子作为原

2020-05-20 09:08:25 697

原创 hands-on-ml-with-sklearn-and-tf-第10章课后题

Draw an ANN using the original artificial neurons (like the ones in Figure 10-3)that computes A ⊕ B (where ⊕ represents the XOR operation). Hint: A ⊕ B = (A∧ ¬ B) ∨ (¬ A ∧ B).Why is it generall...

2020-05-14 12:55:24 324

原创 hands-on-ml-with-sklearn-and-tf-第12章课后题

1.How would you describe TensorFlow in a short sentence? What are its main features? Can you name other popular Deep Learning libraries?TensorFlow是一个强大的数值计算库,特别适合做和微调大规模机器学习(但也可以用来做其它的重型计算)。特点:1.Te...

2020-05-14 12:54:57 225

原创 hands-on-ml-with-sklearn-and-tf-第11章课后题

1.Is it OK to initialize all the weights to the same value as long as that value is selected randomly using He initialization?不,所有权重都应独立采样;它们不应该都具有相同的初始值。随机抽样权重的一个重要目的是打破对称性:如果所有权重具有相同的初始值,即使该值不为零,那...

2020-05-14 12:54:15 191

原创 卷积神经网络在自然语言处理中的应用学习

1.论文《Convolutional Neural Networks for Sentence Classification》2.从CNN视角看在自然语言处理上的应用;3.卷积神经网络(CNN)应用于自然语言处理(NLP);4.卷积神经网络在自然语言处理的应用;5.自然语言处理中CNN模型几种常见的Max Pooling操作。...

2020-05-14 12:53:08 327

原创 论文学习《A Neural Probabilistic Language Model》

论文地址:A Neural Probabilistic Language Model本文为了解决one-hot表示可能带来的维数灾难问题,提出了分布式表示,这种方法允许每一个训练语句给模型提供关于语义相邻句子的指数级别数量的信息。作者基于n-gram模型,通过使用语料对神经网络进行训练,最大化上文的n个词语对当前词语的预测。该模型同时学到了(1)每个单词的分布式表示和(2)单词序列的概率分布函数。该模型学习到的词汇表示,与传统的one-hot表示不同,它可通过词嵌入之间的距离(欧几里得距离、余弦距离等

2020-05-10 10:57:56 424

原创 论文学习《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》

一、前言最近谷歌搞了个大新闻,公司AI团队新发布的BERT模型,在机器阅读理解顶级水平测试SQuAD1.1中表现出惊人的成绩:全部两个衡量指标上全面超越人类,并且还在11种不同NLP测试中创出最佳成绩,包括将GLUE基准推至80.4%(绝对改进7.6%),MultiNLI准确度达到86.7% (绝对改进率5.6%)等。可以预见的是,BERT将为NLP带来里程碑式的改变,也是NLP领域近期最重要的...

2020-04-28 10:51:48 582

原创 决策树案例学习(Python实现)

一、介绍决策树(Decision Tree)是有监督学习中的一种算法,并且是一种基本的分类与回归的方法。有分类树和回归树两种。决策树的算法本质是树形结构,我们可以把决策树看成是一个if-then规则的集合。将决策树转换成if-then规则的过程是这样的:由决策树的根节点到叶节点的每一条路径构建一条规则路径上中间节点的特征对应着规则的条件,叶节点的类标签对应着规则的结论决策树的路径或者...

2020-04-08 15:01:19 2183

原创 k-近邻算法案例学习(Python实现)

一、介绍k-近邻算法(K-Nearest Neighbour algorithm),又称KNN算法,是数据挖掘技术中原理最简单的算法。工作原理:给定一个已知标签类别的训练数据集,输入没有标签的新数据后,在训练数据集中找到与新数据最邻近的k个实例,如果这k个实例的多数属于某个类别,那么新数据就属于这个类别。简单理解为:由那些离X最近的k个点来投票决定X归为哪一类。二、k-近邻算法的步骤(1)...

2020-04-06 16:33:57 991 3

原创 hands-on-ml-with-sklearn-and-tf(第二版)第14章课后题

1.What are the advantages of a CNN over a fully connected DNN for image classification?1.因为连续层只是部分连接而且因为它大量重用其权重,所以CNN比完全连接的DNN具有更少的参数,这使得训练更快,降低过度拟合的风险,并且需要更少的训练数据。2.当CNN学习了可以检测特定特征的内核时,它可以在图像上的任...

2020-04-03 16:41:05 546 5

原创 hands-on-ml-with-sklearn-and-tf(第二版)第13章课后题

1.Why would you want to use the Data API?1.深度学习系统经常需要在大数据集上训练,而内存放不下大数据集;TensorFlow通过Data API,只需要创建一个数据集对象,告诉它去哪里拿数据,以及如何做转换就行。2.Data API还可以从现成的文件(比如CSV文件)、固定大小的二进制文件、使用TensorFlow的TFRecord格式的文件(支持...

2020-04-03 16:08:49 286 1

原创 剑指Offer:重建二叉树(Python)

题目输入某二叉树的前序遍历和中序遍历的结果,请重建出该二叉树。假设输入的前序遍历和中序遍历的结果中都不含重复的数字。例如输入前序遍历序列{1,2,4,7,3,5,6,8}和中序遍历序列{4,7,2,1,5,3,8,6},则重建二叉树并返回。思路首先前序遍历的第一个元素为二叉树的根结点,那么便能够在中序遍历之中找到根节点。在根结点左侧则是左子树,假设长度为M;在根结点右侧,便是右子树,假设长度...

2020-03-24 15:56:08 160

原创 剑指Offer:丑数(Python)

题目把只包含质因子2、3和5的数称作丑数(Ugly Number)。例如6、8都是丑数,但14不是,因为它包含质因子7。习惯上我们把1当做是第一个丑数。求按从小到大的顺序的第N个丑数。思路每一个丑数必然是由之前的某个丑数与2,3或5的乘积得到的,这样下一个丑数就用之前的丑数分别乘以2,3,5,找出这三这种最小的并且大于当前最大丑数的值,即为下一个要求的丑数。解答方法一class Sol...

2020-03-24 14:21:55 160

原创 剑指Offer:不用加减乘除做加法(Python)

题目写一个函数,求两个整数之和,要求在函数体内不得使用+、-、*、/四则运算符号。思路二进制异或进位解答方法一class Solution: def Add(self, num1, num2): xorNum = num1 ^ num2 andNum = (num1 & num2) << 1 while and...

2020-03-24 14:08:10 170

原创 剑指Offer:二进制中1的个数(Python)

题目输入一个32位整数,输出该数二进制表示中1的个数。其中负数用其绝对值的补码表示。解答方法一class Solution: def Number0f1(self, n): count = 0 for i in range(32): count += (n >> i) & 1 return ...

2020-03-24 14:00:17 227

原创 剑指Offer:链表中环的入口点(Python)

题目给一个链表,若其中包含环,请找出该链表的环的入口结点,否则,输出null。思路把链表中节点值放到dict数组中,并记录出现的次数,如果出现次数超过一次,则为环的入口节点。解答方法一class ListNode: def __init__(self, x): self.val = x self.next = Noneclass Solutio...

2020-03-20 18:56:04 662

原创 剑指Offer:孩子们的游戏(Python)

题目每年六一儿童节,牛客都会准备一些小礼物去看望孤儿院的小朋友,今年亦是如此。HF作为牛客的资深元老,自然也准备了一些小游戏。其中,有个游戏是这样的:首先,让小朋友们围成一个大圈。然后,他随机指定一个数m,让编号为0的小朋友开始报数。每次喊到m-1的那个小朋友要出列唱首歌,然后可以在礼品箱中任意的挑选礼物,并且不再回到圈中,从他的下一个小朋友开始,继续0…m-1报数…直到剩下最后一个小朋友,可以...

2020-03-20 18:01:37 328

原创 剑指Offer:两个链表的第一个公共节点(Python)

题目输入两个链表,找出它们的第一个公共结点。思路其中一个链表转列表,遍历另一个,判断节点值是否在列表中解答方法一class ListNode: def __init__(self, x): self.val = x self.next = Noneclass Solution: def FindFirstCommonNode(self...

2020-03-20 15:58:15 170

原创 剑指Offer:复杂链表的复制(Python)

题目输入一个复杂链表(每个节点中有节点值,以及两个指针,一个指向下一个节点,另一个特殊指针指向任意一个节点),返回结果为复制后复杂链表的head。(注意,输出结果中请不要返回参数中的节点引用,否则判题程序会直接返回空)思路将大问题转变为小问题,每次都进行复制头部节点,然后进行递归,每次同样处理头部节点。解答方法一class RandomListNode: def __init_...

2020-03-20 15:18:08 200

原创 剑指Offer:合并两个排序的链表(Python)

题目输入两个单调递增的链表,输出两个链表合成后的链表,当然我们需要合成后的链表满足单调不减规则。思路将两个链表之中的数值转换到列表之中,并进行排序,将排序后的列表构造成链表。解答方法一class ListNode: def __init__(self, x): self.val = x self.next = Noneclass Soluti...

2020-03-20 13:30:03 196

哈工大pyltp0.2.1下载

pip install 文件

2022-04-25

2019最新斯坦福CS224n课件(下).zip

「CS224n:深度自然语言处理课程」( Natural Language Processing with Deep Learning),由斯坦福大学出品。资源太大,分两部分上传

2019-07-02

2019最新斯坦福CS224n课件(上).zip

「CS224n:深度自然语言处理课程」( Natural Language Processing with Deep Learning),由斯坦福大学出品。资源太大,分两部分上传

2019-07-02

随机过程.pdf

全书分为四部分:预备知识和基础概念(1,2),泊松过程(3),马尔可夫过程(4,5),平稳随机过程(6,7,8)

2019-06-07

Python神经网络编程高清版.pdf

全书分为3章和两个附录。第1章介绍了神经网络中所用到的数学思想。第2章介绍使用Python实现神经网络,识别手写数字,并测试神经网络的性能。第3章带领读者进一步了解简单的神经网络,观察已受训练的神经网络内部,尝试进一步改善神经网络的性能,并加深对相关知识的理解。附录分别介绍了所需的微积分知识和树莓派知识。

2019-06-04

自然语言处理综论#(美)Daniel Jurafsky著 冯志伟译.pdf

自然语言学习必备书籍,清华大学刘知远老师推荐,冯老师的经典作品

2019-06-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除