五千年(敝帚自珍)

主题:【原创】数据仓库软件的评测心得 -- 河蚌

共:💬58 🌺197
全看分页树展 · 主题 跟帖
家园 数据仓库当然不要求并发的实时更新处理能力。

我想你没有看清楚我要的东西。俺可没有希望既满足海量数据处理,又有高并发性请求。实际上,大家都知道并发更新(OLTP)和海量数据处理(OLAP)的两者的高性能是不可能同时存在的。所以没有人会这样变态的要求。

即使是银行的业务运营支撑系统,往往也是日常交易处理和日终批量处理分成两个库,同一种数据库也会按分析型和交易型的不同参数来配置。

俺要的是,数据仓库软件在满足海量数据处理的高性能的同时,在功能上(而不是性能上),要支持所有数据库该有的功能,特别是对标准SQL的支持。而某些数据仓库软件连UPDATE这一基本的SQL功能

都不支持了,这就有些过分了。在这种情况下,即使有再好的所谓海量数据处理和检索性能,实际上也是不太适合的,除非企业钱多,就是想用数据仓库来处理海量数据这一范围很窄的领域。

银行的数据量当然没有象电信那么变态(当然四大全国性银行的数据量还是很变态的)。对于数据分析而言,网络设备根本不是问题,数据仓库的各个机器之间都可以千兆网络,而且如果有可能的话,上光纤也不是什么难事,毕竟相对于数据仓库及硬件设备的价格而言,这些外围设备根本就不算钱。

银行的前台系统当然是传统数据库,现在的模式一般都是按天来抽数的。当然ODS(即所谓实时数据仓库里的操作型数据区)是希望按小时来更新的,不过在大多数银行是不会这么做的,因为以天为频度就够了。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河