自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 大家在谈租房时都在谈些什么?--豆瓣租房小组词云图

上次已经从豆瓣小组上爬取到了很多租房信息,但是标题大家都没有统一的规范,所以想通过统计词频来看看有什么关键字,看能不能利用统计出来的关键字对标题信息进行筛选提取。在找词频统计的时候看到了,居然有一个词云图的东西。这么好玩的东西当然不能错过啦。赶紧试试看先。这次生成词云图真的是拢共分三步。第一步:读取文本信息第二步:用分词工具进行分词第三步:用词云图库输出词云图from...

2018-09-30 16:17:48 811 1

原创 豆瓣租房爬虫

初试爬虫,学习python也有一段时间了,想自己做个小项目实战锻炼一下,并在实战中总结。之前在豆瓣小组找房子,由于标题信息很乱,而且要经常翻页,十分不方便,所以想做个豆瓣小组关键信息提取的程序方便以后找房子。所以第一步自然是先爬取信息啦。爬取一个网页需要几步,拢共分三步:第一步,import 一些需要的库第二步,复制爬取的连接第三步,稍微补充一下细节,完成!fro...

2018-09-30 15:36:14 1924

原创 Google TensorFlow课程 编程笔记(11)———稀疏数据和嵌套简介

稀疏数据和嵌入简介学习目标:将影评字符串数据转换为稀疏特征矢量 使用稀疏特征矢量实现情感分析线性模型 通过将数据投射到二维空间的嵌入来实现情感分析 DNN 模型 将嵌入可视化,以便查看模型学到的词语之间的关系在此练习中,我们将探讨稀疏数据,并使用影评文本数据(来自 ACL 2011 IMDB 数据集)进行嵌入。这些数据已被处理成 tf.Example 格式。设置我们导入依赖...

2018-09-03 17:14:39 799

原创 Google TensorFlow课程 编程笔记(10)———使用神经网络对手写数字进行分类

 使用神经网络对手写数字进行分类学习目标:训练线性模型和神经网络,以对传统 MNIST 数据集中的手写数字进行分类 比较线性分类模型和神经网络分类模型的效果 可视化神经网络隐藏层的权重我们的目标是将每个输入图片与正确的数字相对应。我们会创建一个包含几个隐藏层的神经网络,并在顶部放置一个归一化指数层,以选出最合适的类别。第1步:设置:加载必要的库+加载数据+数据预处理...

2018-08-28 15:22:32 714

原创 Google TensorFlow课程 编程笔记(9)———提高神经网络性能

    提高神经网络性能学习目标:通过将特征标准化并应用各种优化算法来提高神经网络的性能注意:本练习中介绍的优化方法并非专门针对神经网络;这些方法可有效改进大多数类型的模型。第1步:设置:加载必要的库+加载数据+数据预处理from __future__ import print_functionimport mathfrom IPython import ...

2018-07-28 12:29:12 454

原创 Google TensorFlow课程 编程笔记(8)———神经网络简介

 神经网络简介学习目标:使用 TensorFlow DNNRegressor 类定义神经网络 (NN) 及其隐藏层 训练神经网络学习数据集中的非线性规律,并实现比线性回归模型更好的效果在之前的练习中,我们使用合成特征来帮助模型学习非线性规律。一组重要的非线性关系是纬度和经度的关系,但也可能存在其他非线性关系。现在我们从之前练习中的逻辑回归任务回到标准的(线性)回归任务。也就...

2018-07-24 16:11:11 533

原创 Google TensorFlow课程 编程笔记(7)———稀疏性和 L1 正则化

学习目标:计算模型大小 通过应用 L1 正则化来增加稀疏性,以减小模型大小降低复杂性的一种方法是使用正则化函数,它会使权重正好为零。对于线性模型(例如线性回归),权重为零就相当于完全没有使用相应特征。除了可避免过拟合之外,生成的模型还会更加有效。L1 正则化是一种增加稀疏性的好方法。第1步:设置:加载必要的库+加载数据+数据预处理from __future__ impor...

2018-07-20 10:57:55 516

原创 Google TensorFlow课程 编程笔记(6)———逻辑回归

逻辑上,前一段时间比较忙,这一段时间比较有空,刚好回归学习TensorFlow,哈哈。开始开始:第1步:设置:加载必要的库+加载数据+数据预处理"""和之前一样添加必要的库和工具"""from __future__ import print_functionimport mathfrom IPython import displayfrom matplotlib impo...

2018-07-12 19:45:02 394

原创 Google TensorFlow课程 编程笔记(5)———特征组合

特征组合学习目标:学习FTRL优化算法的使用,理解独热编码,风箱和特征组合,并用之创建新的特征组合。   第1步:设置:加载必要的库+加载数据+数据预处理 from __future__ import print_functionimport mathfrom IPython import displayfrom matplotlib import cmfr...

2018-06-12 17:46:54 879

原创 Google TensorFlow课程 编程笔记(4)———特征集

特征集学习目标:创建一个包含极少特征但效果与更复杂的特征集一样出色的集合。 到目前为止,我们已经将所有特征添加到了模型中。具有较少特征的模型会使用较少的资源,并且更易于维护。我们来看看能否构建这样一种模型:包含极少的住房特征,但效果与使用数据集中所有特征的模型一样出色。 第1步:设置:加载必要的库+加载数据+数据预处理import mathfrom IPython i...

2018-05-07 16:59:39 627

原创 Google TensorFlow课程 编程笔记(3)———验证

验证学习目标: 使用多个特征而非单个特征来进一步提高模型的有效性 调试模型输入数据中的问题 使用测试数据集检查模型是否过拟合验证数据  与在之前的练习中一样,我们将使用加利福尼亚州住房数据集,尝试根据 1990 年的人口普查数据在城市街区级别预测 median_house_value。 第1步:设置+数据预处理import mathfrom I...

2018-05-05 17:48:57 486

原创 Google TensorFlow课程 编程笔记(2)———使用TensorFlow的基本步骤

使用 TensorFlow 的基本步骤学习目标:在 TensorFlow 中使用 LinearRegressor 类并基于单个输入特征预测各城市街区的房屋价值中位数,使用均方根误差 (RMSE) 评估模型预测的准确率,通过调整模型的超参数提高模型准确率。设置加载必要的库+数据集+进行必要的处理 import mathfrom IPython import display ...

2018-05-05 11:48:27 1219 1

原创 Google TensorFlow课程 编程笔记(1)

疑问点1: b = tf.constant([4, 6, 3])这个矢量的形状表示为什么?         疑问出现背景:疑问拓展:b变形为[1,3]的new_b,既从 [4 6 3]变形为[[4 6 3]]这两个形状有何区别,是否均为一列三行?new_b有没有办法变形回b,实测将形状修改为[0,3]会出现错误? 问题解决:疑问点1:b = tf.constant...

2018-05-02 15:28:48 490

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除