• 博客(0)
  • 资源 (8)

空空如也

ETL_面试资料

1. 在数据抽取阶段,我们需要连接到源系统,为了对源系统的影响尽量小,我们需要将抽取的数据保存成文本文件或者放入数据准备区的表中,这样,当ETL过程出现错误而失败时,我们就可以从这些文本文件开始ETL,而不需要再次影响源系统。这种存储数据的方式叫数据准备区。 1) 固定格式的文本文件。Flat File指的是一种保存在系统上的一种文本文件格式,它以类似数据库的表的方式用行和列来保存数据。这种文件格式经常用来进行数据交换。用于保存数据不太合适。 2) XML数据集。多用于数据交换,用户保存数据不太合适。 3) 关系数据库的表。保存数据的较理想选择。 4) 独立的数据库表。独立的数据库表一般指建立的表和其他表没有外键约束关系。这样的表多用于数据处理。 5) 三范式或者关系型模型。 6) 非关系型数据源。非关系型数据源一般包括COBOL copy books、VSAM文件、Flat文件、Spreadsheets等。 7) 维度模型。 8) 原子事实表和聚集事实表。 9) 代理键查找表。

2012-10-31

数据仓库-数据建模过程

1. 自顶向下: 先通过ETL将数据汇集到数据仓库中,然后再通过数据复制的方式推进各个数据集市; 2. 自底向上: 先通过ETL将数据汇集到数据集市中,然后再数据复制的方式提升到数据仓库中;

2012-10-31

数据仓库建模技术介绍

数据仓库的建模方法 _逻辑建模是数据仓库实施中的重要一环,因为它能直接反映出业务部门的需求,同时对系统的物理实施有着重要的指导作用

2012-10-31

Spring MVC 3.0实战指南

支持REST风格的URL 添加更多注解,可完全注解驱动 引入HTTP输入输出转换器(HttpMessageConverter) 和数据转换、格式化、验证框架无缝集成 对静态资源处理提供特殊支持 更加灵活的控制器方法签名,可完全独立于Servlet API

2012-10-23

Nginx+Tomcat在Windows下做负载均衡

Tomcat 服务器作为一个 Web 服务器,其并发数在 300-500 之间,如果有超过 500 的并发数便会出现 Tomcat 不能响应新的请求的情况,严重影响网站的运行。另外,在访问量大的情况下, Tomcat 的线程数会不断增加。由于 Tomcat 自身对内存的占用有控制,当对内存的占用达到最大值时便会出现内存溢出,对网站的访问严重超时等现象,这时便需要重新启动 Tomcat 以释放占用的内存,这样做便会阻断网站运行。

2012-10-23

jQuery插件开发

jQuery插件开发电子书,指导初学如何应用jQuery进行件开发

2012-10-18

microstrategy图样式

microstrategy 各种图样式如何使用

2012-10-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除