主题:【原创】无责任推测12306网站遇到的麻烦 -- 代码ABC
共:💬135 🌺246
数据量很大的话传统的数据库如DB2、ORACLE之类的肯定力不从心,用NETEZZA之类的数据库比较好。
首先最笨的方法是,每个车次只存一条数据记录,然后关联另一张节点表(存放经停站点用)。这样查询余票的时候需要联合这两张表(还可能有计算)并汇总已有订票记录表。这种存放方式的特点在于数据冗余少。但是查询开销极大,因为需要访问一个庞大的订票数据表(每天2000万的增长)。如果哪个坚持数据库范式的DBA这么干,那么一定就悲剧鸟。
每天2000万增长其实还好,可以将日期设为PARTITION KEY进行分割,相当于把数据量固定在2000万。估计主要瓶颈还是你后面说的,不同起止点的组合查询,
- 相关回复 上下关系8
🙂既然是窗口和网站并行 闻过则喜 字328 2012-01-11 20:24:13
🙂不会用原有的系统 代码ABC 字562 2012-01-11 20:39:20
🙂不太了解原来的铁路系统是怎么运作的 1 闻过则喜 字264 2012-01-11 20:49:17
🙂后台好象是ORACLE?
🙂总量是百TB级的ORACLE应用在国内请参考阿里巴巴集团 qwerty 字0 2012-01-13 06:30:24
🙂阿里在去o中 季侯 字74 2012-01-13 10:24:54
🙂去O计划是一直都有的 qwerty 字118 2012-01-14 01:27:39
🙂更强的用mysql集群把oracle给换了。 1 季侯 字32 2012-01-14 07:44:21