- 博客(0)
- 资源 (8)
空空如也
ETL_面试资料
1. 在数据抽取阶段,我们需要连接到源系统,为了对源系统的影响尽量小,我们需要将抽取的数据保存成文本文件或者放入数据准备区的表中,这样,当ETL过程出现错误而失败时,我们就可以从这些文本文件开始ETL,而不需要再次影响源系统。这种存储数据的方式叫数据准备区。
1) 固定格式的文本文件。Flat File指的是一种保存在系统上的一种文本文件格式,它以类似数据库的表的方式用行和列来保存数据。这种文件格式经常用来进行数据交换。用于保存数据不太合适。
2) XML数据集。多用于数据交换,用户保存数据不太合适。
3) 关系数据库的表。保存数据的较理想选择。
4) 独立的数据库表。独立的数据库表一般指建立的表和其他表没有外键约束关系。这样的表多用于数据处理。
5) 三范式或者关系型模型。
6) 非关系型数据源。非关系型数据源一般包括COBOL copy books、VSAM文件、Flat文件、Spreadsheets等。
7) 维度模型。
8) 原子事实表和聚集事实表。
9) 代理键查找表。
2012-10-31
数据仓库-数据建模过程
1. 自顶向下:
先通过ETL将数据汇集到数据仓库中,然后再通过数据复制的方式推进各个数据集市;
2. 自底向上:
先通过ETL将数据汇集到数据集市中,然后再数据复制的方式提升到数据仓库中;
2012-10-31
Spring MVC 3.0实战指南
支持REST风格的URL
添加更多注解,可完全注解驱动
引入HTTP输入输出转换器(HttpMessageConverter)
和数据转换、格式化、验证框架无缝集成
对静态资源处理提供特殊支持
更加灵活的控制器方法签名,可完全独立于Servlet API
2012-10-23
Nginx+Tomcat在Windows下做负载均衡
Tomcat 服务器作为一个 Web 服务器,其并发数在 300-500 之间,如果有超过 500 的并发数便会出现 Tomcat 不能响应新的请求的情况,严重影响网站的运行。另外,在访问量大的情况下, Tomcat 的线程数会不断增加。由于 Tomcat 自身对内存的占用有控制,当对内存的占用达到最大值时便会出现内存溢出,对网站的访问严重超时等现象,这时便需要重新启动 Tomcat 以释放占用的内存,这样做便会阻断网站运行。
2012-10-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人