五千年(敝帚自珍)

主题:【原创】数据仓库软件的评测心得 -- 河蚌

共:💬58 🌺197
全看分页树展 · 主题 跟帖
家园 才看到,这几天看三体啥都没顾上。

国内在ETL方面很少采用现成的工具,比如informatic,datastage,大多数都是直接写SQL脚本或用存储过程。原因主要有两个:

1.目前的ETL其实是ELT为主,先loading进来再转换,最大限度利用数据库的资源。而不是在一个独立的ETL服务器上做好转换再加载到仓库里,这样效率低而且对ETL服务器性能要求太高

2.仓库并不产生数据,只是进行一个数据组织方式上的转换,从业务源模型到仓库模型。因为源系统比较多,转换逻辑可能会比较复杂,所以很难用datastage这样的图形化工具准确的表达出来,不如直接写SQL方便,开发效率高。这种图形化的ETL工具拖拖拽拽的做演示还行,但是不适合大规模的工程化开发。比如100多张源表加载到一个数据仓库中的表,用ETL工具挨个拖拽到话,屏幕已经乱的没法看了。

报表目前是cognos占大多数,少部分用brio或其他工具的

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河