- 博客(2)
- 收藏
- 关注
原创 互联网大数据学习笔记2
2、在爬虫技术原理和实现上分为两个层次: 扩展技术:多线程任务调度、动态页面获取、主题识别、局部控制、增量式扩展 内核技术:WEB服务器连接器向WEB服务器发起连接请求,在建立爬虫和web服务器之间的网络连接后,在该连接上向服务器发送URL页面请求命令,WEB服务器反馈页面内容,即HTML编码的文本信息,由页面解析器对页面进行分析,提取其中包含的URL,过滤URL,根据爬行策略,将URL放入爬...
2019-06-01 13:38:06 92
原创 互联网大数据学习笔记
OLTP与OLAP的区别 基本含义不同:OLTP是传统的关系型数据库的主要应用,主要是基本的,日常的事务处理,记录即时的增删改查,如银行交易;OLAP是数据仓库的核心部分,支持复杂的分析操作,侧重决策支持,并提供直观易懂的查询结果,典型应用:复杂的动态报表系统。 实时性要求不同:OLTP实时性要求高,OLTP数据库旨在使事务应用程序仅写入所需的数据,以便尽快处理单个事务。OLAP的很多应用顶...
2019-06-01 13:30:28 198
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人