自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(0)
  • 资源 (16)
  • 收藏
  • 关注

空空如也

信息系统项目管理师.txt

软考-高级-信息系统项目管理师-真题、视频、教材不加密

2021-05-20

百度云盘 pdf《大数据架构和算法实现之路:电商系统的技术实战》百度云盘-带标签目录

目录 c~11tcob 推荐序 1.6.4 使用 R 进行 K 最近邻分类…·37 前言 1.6.5 单机环境使用 Mahout 运行 引子 第一篇支持高效的运营 第 1 章方案设计和技术选型:分类 ·5 1.1 分类的基本概念…...... .…………….. 6 1.2 分类任务的处理流程 ……·· ……·7 1.3 算法:朴素贝叶斯和 K最近邻……·8 1.3.1 朴素贝叶斯….......……… …….. 8 1.3.2 K 最近邻……………………... 9 1.4 分类效果评估…………·…….. 10 1.5 相关软件: R 和 Mahout·………….. 12 1.5.1 R 简介………………………… 12 1.5.2 Mahout 简介……………….. 13 1.5.3 Hadoop 简介………………· 14 1.6 案例实践·……...... .… ··· ·· ·········… 17 1.6.l 实验环境设置…………….... 17 1.6.2 中文分词 ……………….. 18 1.6.3 使用 R进行朴素贝叶斯分类… 22 朴素贝 叶斯分类..... . .…......... 39 1.6.6 多机环境使用 Mahout 运行 朴素贝叶斯分类…..........…… 47 1.7 更多的思考……….. .... ................. 58 第 2 章方案设计和技术选型: 聚类… … … ..... 60 2.1 聚类的基本概念…………........….. 60 2.2 算法: K 均值和层次型聚类…… 61 2.2.1 K 均值聚类………… ... ......… 61 2.2.2 层次型聚类……………… ·· 62 2.3 聚类的效果评估…·· ……....... 64 2.4 案例实践……………………··· ···· 66 2.4.1 使用 R 进行 K 均值聚类·· .... 66 2.4.2 使用 Mahout 进行 K均值聚类… 69 第 3 章方案设计和技术选型: 因变量连续的回归分析....... 74 3.1 线性回归的基本概念…………....... 74 3.2 案例实践… 3.2. 1 实验环境设置……………….. 76 3.2.2 R 中数据的标准化……… 78 3.2.3 使用 R 的线性回归分析…… ·81 第二篇 为顾客发现喜欢的商晶: 基础篇 第 4 章方案郎,+和技术选型:搜索 . 94 4.1 搜索引擎的基本概念………………·” 4 1 1 相关性…………………………· 95 4 口及时性…·.............… 97 4.2 搜索引擎的评估.........……········· 100 4.3 为什么不是数据库……........……. 103 4.4 系统框架………………… · 104 4.4.1 离线预处理…………………… 104 4.4.2 在线查询………… ……··· 107 4.5 常见的搜索引擎实现………... 108 4.5.1 Lucene 简介……………… 108 4.5.2 Solr 简介 ......………………… 113 4.5.3 Elasticsearch 简介…………… · 120 4.6 案例实践……………… 123 4.6.1 实验环境设置.. ... ....………… 123 4.6.2 基于 Solr 的实现 …………… 123 4.6.3 基于 Elasticsearch 的实现 … 154 4.6.4 统一的搜索 API ………··……·175 第三篇 为顾客发现喜欢的商局: 高级篇 第 5 章方案设计和技术选型: NoSQL 和搜索的整合· .. 195 5.1 问题分析 …… IX 5.2 HBase 简介……….. ... .. .…...... . …. 196 5.3 结合 HBase 和搜索引擎………….. 203 5.4 案例实践….... . . . .………........…… 204 5.4.1 实验环境设置 ........ ……··204 5.4.2 HBase 的部署………………… 205 5.4.3 HBase 和搜索引擎的集成 …. . 211 第 6 章方案设计和技术选型: 查询分类和搜索的整合 ·219 6.1 问题分析…………………. . 219 6.2 结合分类器和搜索引擎.. ....……. . 219 6.3 案例实践…······ ·············………… 225 6.3.1 实验环境设置……….......… 225 6.3.2 构建查询分类器 …………······226 6.3.3 定制化的搜索排序…… ··· ·229 6.3.4 整合查询分类和定制化 排序…·… …… ………… 236 第 7 章方案设计和技术选型: 个性化搜索 …· · … 245 7.1 问题分析……………………. ....... . . 245 7.2 结合用户画像和搜索引擎…… ··· 245 7.3 案例实践….........……….......…… 249 7.3.1 用户画像的读取……………… 250 7.3.2 个性化搜索引擎………·· 253 7.3.3 结果对比……………… ··260 第 8 章方案设计和技术选型: 搜索分片 ……·· ····· 267 8.1 问题分析……. ........... . . .………… 267 8.2 利用搜索的分片机制……………··269 x 8.3 案例实践 …………· · · ·· ·· · ····· ·….... . .. . . 271 8.3.1 Solr 路由的实现.. ......... . ...... 271 8.3.2 Elasticsearch 路由的实现 ……· 278 第 9 章 方案设计和技术选型: 搜索提示………….. ..... 283 9.1 问题分析 ……..... . ..….............… 283 9.2 案例实践:基础方案 ..............… 284 9.2.1 Solr 搜索建议和拼写纠错的 实现…….. ... ..…………·· · ···· · 284 9.2.2 Elasticsearch 搜索建议和拼写 纠错的实现 …··..........……… 286 9.3 改进方案 .. . .. . ..... .. ... . .. . .... . ..... . … 291 9.4 案例实践:改进方案 ….... . ....…·· 294 第 10 章方案设计和技术选型: 推荐 ……… ……….. 303 10.l 推荐系统的基本概念 ……......…· 305 10.2 推荐的核心要素…………········ 306 10.2.1 系统角色 .. . .. . ...…………·· 306 10.2.2 相似度 …. . ... . .......... . .…·· 307 10.2.3 相似度传播框架 .... . ....…·· 307 10.3 推荐系统的分类 . . . ... . ..….... ... .. . 307 10.4 混合模型. ··r ..………................. 311 10.5 系统架构… . .. ..........…..... . . … . .. 312 10.6 Mahout 中的推荐算法…….. ... .... 313 10.7 电商常见的推荐系统方案……… 314 10.7.1 电商常见的推荐系统 方案……………………….. 314 10.7.2 相似度的计算 …………….. 317 10.7.3 协同过滤………………….. 319 10.7.4 结果的查询………………·· 320 10.8 案例实践 ……………. ... ....… 321 10.8.1 基于内容特征的推荐…... 321 10.8.2 基于行为特征的推荐…….. 341 第四篇获取数据,跟踪效果 第 11 章方案设计和技术选型: 行为跟踪 … ……….... 369 l l.l 基本概念… . .... . ...... .... ....….. . .... 370 11.1.1 网站的核心框架……….. 370 11.1.2 行为数据的类型 … …… . . . . 371 11.1.3 行为数据的模式…………··372 11.1.4 设计理念…………………·· 374 11.2 使用谷歌分析 ..... . ..……… …. . . 375 11.3 自行设计之 Flume、 HDFS 和 Hive 的整合…·········· ···········…· 378 11.3.1 数据的收集一-Flume 简介…………………········ 378 11.3.2 数据的存储一-Hadoop HDFS 回顾………·…… 382 11 .3.3 批量数据分析一-Hive 简介 ……··..................… 383 11.3.4 Flume、 HDFS 和 Hive 的 整合方案 …··.......... .....… 386 11.4 自行设计之 Flume、 Kafka 和 Storm 的整合……………··…… 386 11.4.1 实时性数据分析之 Kafka 简介 ……….......……....... 386 11.4.2 实时性数据分析之 Storm 简介………………·388 11.4.3 Flume 、 Kafka 和 Storm 的 XI 11.5.4 自主设计实战之 Flume、 HDFS 和 Hive 的整合........ 401 11.5.5 自主设计实战之 Flume、 整合方案………………….. 390 Kafka 和 Storm 的整合……410 11.5 案例实践…………………….. 391 11.6 更多的思考………·……………·424 11.5.1 数据模式的设计……....... . 392 11.5.2 实验环境设置………… ... 392 后记……··…. ... .. .......….. .. . . .….............. 425 11.5.3 谷歌分析实战…………….. 394

2018-08-23

老男孩大数据项目-用户画像全套视频不加密

老男孩大数据项目-用户画像全套视频不加密老男孩大数据项目-用户画像全套视频不加密

2018-08-19

老男孩大数据zookeeper全套视频不加密

老男孩大数据zookeeper全套视频不加密老男孩大数据zookeeper全套视频不加密

2018-08-19

大数据老男孩大数据spark全套视频不加密

老男孩大数据spark全套视频不加密老男孩大数据spark全套视频不加密

2018-08-19

老男孩大数据kafka全套视频不加密

老男孩大数据kafka全套视频不加密老男孩大数据kafka全套视频不加密

2018-08-19

老男孩大数据storm全套视频不加密

老男孩大数据storm全套视频不加密老男孩大数据storm全套视频不加密

2018-08-19

老男孩大数据hive全套视频不加密

老男孩大数据hive全套视频不加密老男孩大数据hive全套视频不加密

2018-08-19

老男孩大数据hadoop全套视频不加密

老男孩大数据全套视频不加密老男孩大数据全套视频不加密

2018-08-19

老男孩大数据scala全套视频不加密

老男孩大数据scala全套视频不加密老男孩大数据scala全套视频不加密

2018-08-18

老男孩大数据flume全套视频不加密

老男孩大数据flume全套视频不加密老男孩大数据flume全套视频不加密老男孩大数据flume全套视频不加密

2018-08-18

GIT&GIthub; 全套视频教程 课件 安装包 全套 不加密

GIT&GIthub; 全套视频教程 课件 安装包 全套 不加密GIT&GIthub; 全套视频教程 课件 安装包 全套 不加密GIT&GIthub; 全套视频教程 课件 安装包 全套 不加密

2018-08-15

大数据最新spark-pdf链接

大数据最新spark-pdf链接大数据最新spark-pdf链接大数据最新spark-pdf链接

2018-08-15

厦门大学大数据全套视频课件实验代码

厦门大学大数据全套视频课件实验代码厦门大学大数据全套视频课件实验代码厦门大学大数据全套视频课件实验代码

2018-08-15

人工智能机器学习全套教程视频、课件、源码

人工智能机器学习全套教程视频、课件、源码人工智能机器学习全套教程视频、课件、源码

2018-08-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除