五千年(敝帚自珍)

主题：【原创】闲话Google集群 [4] 数据流和控制流的分 -- 邓侃

共:💬15 🌺46

老大河待整

全看分页树展 · 主题跟帖

复【原创】闲话Google集群 [4] 数据流和控制流的分

先花，再提问。GFS比较适用于海量数据，但是实时性不好

去年我有一个项目，原来考虑使用gfs，后来放弃了，原因两个

1、系统运行中产生大量的小数据文件，而且实时性要求很高；hadoop默认的文件块是64m，小了性能不行；大了实时性不能满足要求；

2、namdenode是一个有状态的单点，无法实时备份。

后来的解决方法是将中间文件放在存储上，但是硬件成本太高，而且睡着系统的运行，硬盘空间的需求越来越大。

请教有什么更好的思路么？

全看分页树展 · 主题跟帖

相关回复上下关系8
- - 🙂那就相当于google的用户又多了，买机器买机器去。熊仔字56 2008-10-24 02:14:37
  - 🙂花送好文蜡笔小新字59 2008-09-04 07:21:51
    🙂关于MegaUpload和RapidShare 邓侃字79 2008-09-04 07:38:34
  - 🙂先花，再提问。GFS比较适用于海量数据，但是实时性不好
    🙂关于GFS的实时性 5 邓侃字724 2008-09-04 07:35:40
    🙂最近用memcached做分布式内存cache集群，但是季侯字137 2008-11-23 14:57:31
  - 🙂多节点的访问寻径问题在通信领域和并行计算领域 2 看看字606 2008-09-04 06:26:56
    🙂去中心化的路由 4 邓侃字432 2008-09-04 06:36:36

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

Copyright © cchere 西西河

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明