主题:【原创】数据仓库软件的评测心得 -- 河蚌
我现在在做交易系统的开发和用户支持,发现不少trader对IT都很熟悉,自己写VBA之类的根本不在话下,很多人甚至本来就是IT出身业务熟悉了后再去干trader的。
teradata在项目前期给了客户这样的期望:teradata是行业解决方案专家,有成熟的实施经验,把项目给我们没问题的。
要说teradata的软硬件dw平台,最近10年来已然是落后了,而且最近还有新老型号连续性的问题。实际上客户使用teradata的产品,很大程度就是基于上述对“行业知识”和“实施经验”的期望。teradata打这个牌成功地把机器卖进了各大行。
但是实施下来,效果确实不怎么样。这个时候再说teradata “只是专注于DW,只是提供一个平台” “实施不好有客观原因”,帐都结了,客户只能接受,而且以后还要忍受非标准硬件带来的升级维护成本飙升,运行维护人员缺乏的问题。
用工业标准的刀片服务器 把昂贵的企业级存储阵列拉下了马,性能更好,价格更低,走的是PC集群替代高性能UNIX服务器的一样的路。
只要市场认可,技术上可以逐步完善。
IBM的数据仓库历史就是不断买进产品替换自己的组件的过程。如果用Netezza替换掉DB2,那么这个套件里面,就剩下OLAP Server还存在外,其它的部分就替换完了。
就效率上说NOT IN不走索引是非常差的,尽量避免使用。而EXCEPT/MINUS可走索引,性能很高。
另外pgsql 9.1支持UNLOGGED表即非日志表,速度接近内存表。非常不错。
对于堆表类型(比如pgsql)来说,MVCC实现UPDATE是先插入一条新记录然后改写版本指针指向新记录。即新老记录都物理存在,由版本指针决定哪条是最新记录。对于老记录可通过命令清理(比如pgsql的vacuum)。
对于索引表类型(比如mysql,ora不知道是否也是)也差不多。
送花成功。有效送花赞扬。恭喜:你意外获得 16 铢钱。1通宝=16铢
参数变化,作者,声望:1;铢钱:0。你,乐善:1;铢钱:15。本帖花:1
oracle和ASE是行数据库, 效率不够。
不过可考虑采用列数据库, Sybase IQ 或者 SAP&Sybase Hana