AIbanana-CSDN博客

原创 CS224N连载系列_word2vec作业的解析（2）

所有的语言模型的发展都离不开最基础的模型，统计语言模型是最重要的一环，word2vec也是如此，统计语言模型是用来计算一个句子的概率的概率模型，通常是基于一个语料库来构建，那什么叫一个句子的概率呢？1、softmaxsoftmax 函数通常处理机器学习分类问题的输出层的激活函数，它的输入是一个实数向量，输出向量的长度是与输入向量相同，但所有的取值范围是（0，1），且所有元素的和为1，输出向...

2018-12-17 10:18:28 360

原创斯坦福CS224N连载 _词向量总结（1）

word2vec分布式向量表示的出现成功解决了one-hot表示的稀疏性，分布式表示的定义是，通过用密集型向量表示词汇的含义，用分布式相似性表示。word2vec算法流程：（1）将one-hot形式词向量输入到单层神经网络中，其中输入层的神经元节点个数与one-hot形式词向量的维数是对应的。（2）通过神经网络中的映射层中的激活函数，计算目标单词和其他词汇关联概率，计算时，使用负样本提...

2018-12-16 21:57:05 187

转载西瓜书——决策树

决策树（DT）是用于分类和回归的非参数监督学习方法。目标是创建一个模型，通过学习从数据特征推断出的简单决策规则来预测目标变量的值。例如，在下面的示例中，决策树从数据中学习以使用一组if-then-else决策规则来近似正弦曲线。树越深，决策规则越复杂，模型越适合。决策树的一些优点是：易于理解和解释。树木可以看到。需要很少的数据准备。其他技术通常需要数据规范化，需要创建虚...

2018-12-11 09:35:45 544

转载斯坦福大学NLP课程CS224N课作业合集

斯坦福CS224N第一部分公式推导斯坦福大学NLP课程CS224N课第一次作业第二部分斯坦福大学My solution to cs224n assignment1(1-2)

2018-12-05 09:26:41 3800

转载斯坦福-CS224N-自然语言处理初介绍

什么是自然语言处理？自然语言处理是一门交叉学科包含，计算机科学、人工智能以及语言学的交叉学科。虽然语言只是人工智能的一部分，但是它非常独特的一部分。自然语言处理的目标是让计算机处理或者说“理解”自然语言，以完成有意义的任务，比如订机票购物或者QA等。完全理解和表达语言是极其困难的，完美的语言理解等效于人工智能。自然语言处理设计几个层次 ...

2018-11-30 11:17:26 1066

转载深度学习之tensorflow的探索

Tensorflow的使用方法和代码演示第一部分tensorflow的运行流程，主要分2步，分别是构造模型和训练Tensorflow中的几个概念是tensor,variable,placeholder,训练阶段需要session1,tensor的意思是张量，其实就是矩阵，tensorflow中的矩阵表示形式，a=tf.zeros(shape=[1,2])不过要注意，

2017-06-06 09:19:42 787

原创网络爬虫之简单例子

网络爬虫的简单例子###京东页面的简单爬取import requestsurl="http://item.jd.com/2967929.html"try: r=requests.get(url) r.raise_for_staus() r.encoding=r.apparent_encoding print(r.text[:1000])except: p

2017-03-09 08:40:41 467

原创网络爬虫之盗之有盗

网络爬虫的尺寸：一般来讲，这个尺寸可以分为三类，第一类是比较小规模的，数据量小爬取的速度不敏感，一般用的是requests库，适用于我们自己爬取网页，玩转网页，第二类是中规模的，数据规模较大的，爬去速度敏感的scrapy库，适用于我们进行爬取网站。第三类是大规模的，搜索引擎爬取的速度关键，这样的，一般需要定制开发网络爬虫的限制： 1，来源

2017-03-08 21:14:31 834

原创网络爬虫之requests库中两个重要的对象

当我们使用resquests.get（）时，返回的时response的对象，他包含服务器返回的所有信息，也包含请求的request的信息。首先： response对象的属性有以下几个， r.status_code是http请求的返回状态，200表示连接成功，404表示连接失败，这时候应该抛出异常，进行处理。 r.text是url对应的页面内容 r.encoding是从http的heade

2017-03-08 20:53:41 1440

原创网络爬虫之request的使用

requests库的应用 1.requests库中有几个常用的方法，（1）requests.request()是构造一个请求，支撑以下各个方法的基础方法。（2）requests.get()是获取html网页的主要方法，对应与http的get方法。是爬取网页的最基本的方法，也是最常用的。（3）requests.head()是获取头信息的方法，对应与http的head，也是经常使用的方法

2017-03-08 20:41:32 2929

原创欢迎使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来，用它写博客，将会带来全新的体验哦：Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2017-03-08 20:27:08 199

u012896627的博客