自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 CS224N连载系列_word2vec作业的解析(2)

所有的语言模型的发展都离不开最基础的模型,统计语言模型是最重要的一环,word2vec也是如此,统计语言模型是用来计算一个句子的概率的概率模型,通常是基于一个语料库来构建,那什么叫一个句子的概率呢?1、softmaxsoftmax 函数通常处理机器学习分类问题的输出层的激活函数,它的输入是一个实数向量,输出向量的长度是与输入向量相同,但所有的取值范围是(0,1),且所有元素的和为1,输出向...

2018-12-17 10:18:28 360

原创 斯坦福CS224N连载 _词向量总结(1)

word2vec分布式向量表示的出现成功解决了one-hot表示的稀疏性,分布式表示的定义是,通过用密集型向量表示词汇的含义,用分布式相似性表示。word2vec算法流程:(1)将one-hot形式词向量输入到单层神经网络中,其中输入层的神经元节点个数与one-hot形式词向量的维数是对应的。(2)通过神经网络中的映射层中的激活函数,计算目标单词和其他词汇关联概率,计算时,使用负样本提...

2018-12-16 21:57:05 187

转载 西瓜书——决策树

 决策树(DT)是用于分类和回归的非参数监督学习方法。目标是创建一个模型,通过学习从数据特征推断出的简单决策规则来预测目标变量的值。例如,在下面的示例中,决策树从数据中学习以使用一组if-then-else决策规则来近似正弦曲线。树越深,决策规则越复杂,模型越适合。决策树的一些优点是:易于理解和解释。树木可以看到。 需要很少的数据准备。其他技术通常需要数据规范化,需要创建虚...

2018-12-11 09:35:45 544

转载 斯坦福大学NLP课程CS224N课作业合集

斯坦福CS224N第一部分公式推导斯坦福大学NLP课程CS224N课第一次作业第二部分斯坦福大学My solution to cs224n assignment1(1-2)

2018-12-05 09:26:41 3800

转载 斯坦福-CS224N-自然语言处理初介绍

什么是自然语言处理?        自然语言处理是一门交叉学科包含,计算机科学、人工智能以及语言学的交叉学科。虽然语言只是人工智能的一部分,但是它非常独特的一部分。自然语言处理的目标是让计算机处理或者说“理解”自然语言,以完成有意义的任务,比如订机票购物或者QA等。完全理解和表达语言是极其困难的,完美的语言理解等效于人工智能。自然语言处理设计几个层次                  ...

2018-11-30 11:17:26 1066

转载 深度学习之tensorflow的探索

Tensorflow的使用方法和代码演示第一部分tensorflow的运行流程,主要分2步,分别是构造模型和训练Tensorflow中的几个概念是tensor,variable,placeholder,训练阶段需要session1,tensor的意思是张量,其实就是矩阵,tensorflow中的矩阵表示形式,a=tf.zeros(shape=[1,2])不过要注意,

2017-06-06 09:19:42 787

原创 网络爬虫之简单例子

网络爬虫的简单例子###京东页面的简单爬取import requestsurl="http://item.jd.com/2967929.html"try: r=requests.get(url) r.raise_for_staus() r.encoding=r.apparent_encoding print(r.text[:1000])except: p

2017-03-09 08:40:41 467

原创 网络爬虫之盗之有盗

网络爬虫的尺寸: 一般来讲,这个尺寸可以分为三类,     第一类是比较小规模的,数据量小爬取的速度不敏感,一般用的是requests库,适用于我们自己爬取网页,玩转网页,     第二类是中规模的,数据规模较大的,爬去速度敏感的scrapy库,适用于我们进行爬取网站。     第三类是大规模的,搜索引擎爬取的速度关键,这样的,一般需要定制开发     网络爬虫的限制:     1,来源

2017-03-08 21:14:31 834

原创 网络爬虫之requests库中两个重要的对象

当我们使用resquests.get()时,返回的时response的对象,他包含服务器返回的所有信息,也包含请求的request的信息。 首先: response对象的属性有以下几个, r.status_code是http请求的返回状态,200表示连接成功,404表示连接失败,这时候应该抛出异常,进行处理。 r.text是url对应的页面内容 r.encoding是从http的heade

2017-03-08 20:53:41 1440

原创 网络爬虫之request的使用

requests库的应用 1.requests库中有几个常用的方法, (1)requests.request()是构造一个请求,支撑以下各个方法的基础方法。 (2)requests.get()是获取html网页 的主要方法,对应与http的get方法。是爬取网页的最基本的方法,也是最常用的。 (3)requests.head()是获取头信息的方法,对应与http的head,也是经常使用的方法

2017-03-08 20:41:32 2929

原创 欢迎使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2017-03-08 20:27:08 199

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除