五千年(敝帚自珍)

主题:【原创】闲话Google集群 [1] 引子 -- 邓侃

共:💬33 🌺147
全看树展主题 · 分页首页 上页
/ 3
下页 末页
家园 【原创】闲话Google集群 [1] 引子

[1] 引子 链接出处

[2] 存在的理由 链接出处

[1] 引子

奥运会是一个快乐的大party,party快结束了,我们也该收收心,补补功课了。补什么功课呢?

7月份以来,新员工陆续上岗,领导指示,"塑造锐意进取,开拓创新的企业文化"。塑造企业文化的任务不太好办。组织学习七个好习惯之类的书籍,大家觉得有说教甚至洗脑的嫌疑。组织郊游,大家事后惦记着的,是下一次什么时候郊游,去哪里,但是很少有人想着如何改进工作。

最近几个月,公司的用户数量大涨,这是好事。但是欣喜之余,后台服务器的吞吐量和稳定性面临严峻考验。总部领导垂询,有没有办法强化后台服务器集群,力争趋近5个9的指标?所谓5个9,就是绝大多数(99.99999%)的时间内,服务器集群稳定工作。即便5个9的指标一时达不到,那么能达到2个9也比现状强。

和大家商量商量,干脆,把两个任务合而为一,读论文吧。

读论文的目的有二,1. 扩大视野,强化专业知识,2. 唤起大家对专业对工作的兴趣。

认识一位美女的妈妈。女儿如花,做妈妈的很得意,但是也有烦恼。漂亮女儿的学习不好,先学会计,觉得繁琐,后转学护士,又记不住大量的医学名词。于是让我找美女谈谈。美女说,"我对会计和护士没兴趣,没兴趣就读不好"。问,"哪你对什么事情感兴趣呢?" 答,"和人打交道的事情。"

我的看法,兴趣和投入是密切相关的。投入越大,相关知识和技能就越强。能力越强,就越有自信。越有自信,就越有兴趣。

想成为世界顶级选手,的确需要天赋。但是入门并不需要强调天赋,主要还是多花时间。但是正襟危坐,悬梁刺股,是不是好方法,值得商榷。美女的问题是,有没有办法把学习,变得像谈恋爱那样有趣?这的确是一个值得思考的问题。

和一位初三的小同学去外地旅游。路上问小同学三个问题,1. "平均而言,坐火车的旅客有钱,还是乘飞机的旅客有钱?" 2. "火车站里的小偷多,还是飞机场里的小偷多?" 3. "为什么多数小偷不去飞机场行窃,而是选择火车站?" 一路上你问我答,辩论热烈。

最后,小同学问,"我们讨论这些问题有什么意义?为什么不谈谈数理化?" 思辨的快乐,无所不在。小同学言下之意,如果能像辩论小偷的经济模式那样,辩论数理化问题,功课就不是负担而是快乐了。

刘翔退出比赛,网上热议。1. 比赛是娱乐还是提振国家尊严?2. 留得青山在不怕没柴烧,还是明知其不可为而为之,哪一个是真英雄?3. 国家集训式的计划体制,还是商业推动,哪一个体制更适合中国体育国情?有了辩论,大家就有兴趣,讨论也就更深入。

为什么讨论技术问题,很少出现热烈的辩论?不是问题本身无趣,而是进入壁垒比较高。要参与辩论,首先必须明白论战双方在讲什么。进入壁垒高,参与者就少。人数少了,自然就不热烈。

如何挑起技术辩论?或许横向比较是一个招儿。集群技术有几个学派?这些学派的差异在哪里?为什么Google不沿用现成的技术,而是另起炉灶?都说Google的集群做的好,是不是其它集群技术就没有前途?

有记者问李开复,Google的技术优势在哪里?开复答,1. PageRanking的排序算法,2. 超大规模集群。 Google的集群,2000年初的时候由一千多台服务器组成。到了2006年初,根据Google给Dell的订单推算,估计是40万到50万台服务器的规模。两年多过去了,目前Google的集群有多大?有论者猜测,估计已经超过1千万台机器了,这个猜测是否准确,待考。

PageRanking的算法相对比较容易跟风,但是想效仿Google的集群就不是那么容易了。Google的集群里到底藏了什么药?我们这个系列就谈谈这个问题。之所以是闲聊,1. 节奏和篇幅比较随意,2. 强调横向比较,背景解释比较多, 3. 掺杂个人观点(当然会明确标注),欢迎大家拍砖。

关键词(Tags): #Google#集群#互联网#操作系统#网络元宝推荐:铁手,老马丁,

本帖一共被 7 帖 引用 (帖内工具实现)
家园 闲话Google集群 [2] 存在的理由

[1] 引子 链接出处

[2] 存在的理由 链接出处

[2] 存在的理由

早期的搜索引擎,基本原理是关键词匹配。

譬如用户输入关键词"奥运会",搜索引擎的任务是查找与奥运会相关的网页。如果恰好有一篇网页,内容无他,"奥运会,奥运会,。。。",连说100遍。早期的搜索引擎肯定把这个网页放在结果的首页,说不定还置顶,因为, 1. 网页内容中,"奥运会"这个关键词出现的频率非常高,2. 没有出现与奥运会不相干的内容。

早期搜索引擎的问题很明显,但是如何解决,却是仁者见仁智者见智。

1996年,刚刚入学Stanford计算机系的Larry Page和Sergey Brin哥俩儿觉得,提高搜索引擎的准确性,或许可以从网页与网页之间的相互链接入手。譬如,网页A中提到奥运会时,给了一个链接,指向网页甲,那么网页甲的内容很可能与奥运会相关。如果不仅网页A有这样的链接,而且网页B,C,D等等,都有类似的链接,那么网页甲的内容与奥运会相关的可能性就极高。

批评者说,这不是三人成虎吗?Larry心里也没谱,就跑去问他的导师,Terry Winograd。

导师外形很像爱因斯坦,想了一想,说,"先把Stanford校园网内所有网页收集下来,验证一下你们的想法。然后扩大到更大范围,再验证一下。如果验证的结果不错,就把全世界互联网的所有网页,统统收集下来,做一个搜索引擎,上线,让全世界的人用,让全世界的人都来验证你们的猜想。"

两年后,1998年,Google上线了,三人成虎的猜想被实践证明是行之有效的。

Terry导师大手一挥,"把全世界互联网的所有网页,统统收集下来",可把Larry和Sergey哥俩儿忙坏了。互联网上有多少网页,统统收集下来,需要占用多少硬盘空间?Larry和Sergey当时是博士班一年级学生,囊中羞涩,买不起那么多设备,没办法,开始四处讨钱。

托了七大姑八大姨,拐弯抹角找到了一个大款,名叫Andy Bechtolsheim。此公早年在CMU拿了EE的硕士后,跑到Stanford读CS/EE博士。没来得及拿到博士学位,就伙同Scott McNealy和Vinod Khosla,下海开公司去了,这个公司就是大名鼎鼎的SUN Microsystems。 Scott McNealy任SUN的CEO长达20多年,而Andy Bechtolsheim功成身退,跳出SUN自己开了一个小公司,后来这个小公司卖给了Cisco。

坊间传说,Larry和Sergey拜访Andy的时候,Andy正在电话上。冗长的电话,Larry和Sergey两个小伙子血气方刚,哪里耐得住这份性子,抬腿告辞。因为是朋友介绍,Andy有点过不去,就追到门口。问,"二位上门,有何需求?"

Larry和Sergey铁青着脸,说,"也没什么大事,就是想找点钱,做一个大规模文件系统。"

Andy问,"多大规模呢?存储什么数据?"

Larry和Sergey,"打算把互联网上所有网页都下载,然后建一个搜索索引。"

Andy,"把互联网上所有网页统统下载?!需要多大空间?几个Giga不行吧,几个Tera也不行吧,几个Peta,几个Zetta?。。。嗯,我看几个Googol也许才能撑得住。知道Googol吗?就是10的100次方,就是一个1后面拖100个0!"

Larry和Sergey,"是的,我们的确就是打算处理海量数据。"

Andy,"你们打算怎么做?买个EMC?那玩意儿很贵的哟,我可没那么多钱让你们烧。"

Larry和Sergey,"我们打算自己动手,用一堆PC做一个分布式集群。"

Andy,"PC?死机了怎么办?干嘛不用工作站,干嘛不用NFS?"

Larry和Sergey,"工作站比PC贵太多,NFS的不是很切合我们的需要。。。"

Andy挤出一点笑容,"好吧,小伙子们,给朋友一个面子,而且年轻人探险也是值得鼓励的。给你们10万吧,省着点花啊!"

Andy掏出支票本,一边签名一边问,"你们的公司叫什么?"

Larry和Sergey面面相觑,那时候他们还没来得及给公司取名。"要不就叫Googol吧?","Googol不太好拼写,要不改一改,叫Google吧。" Google这个名字从此诞生。

。。。

以上是传说,但是有几点倒是有价值的。

1. 以Andy的身价,10万美元实在是九牛一毛。1998年10万美元的投资,到了2004年Google上市时,值多少钱?现在又增长到多少钱?不忍心计算,估计Andy后悔得肠子都青了。

2. 如果需要10个Tera byte,也就是1万个Giga的硬盘的空间,或许1个EMC服务器就够了。但是同样空间,却需要10个PC。从价钱看,10个PC大致是5千美元,而一个硬盘空间相似的EMC服务器要价1.5万美元左右。当硬盘空间的规模大幅度增长的时候,购买EMC高端设备的花费,将远远超过购买众多低端PC的成本。

3. 用廉价的PC,就必须想办法保障稳定性。换句话说,少数PC死机了,不能影响整个集群的正常工作。

4. 处理海量数据,内存和IO速度是生死劫。廉价的PC,内存有限,IO接口速度也有限。如何解决?

5. 应付海量数据的存储技术很多,EMC,NFS(Network File System),AFS(Andrew File System),RAID(Redundant Array of Inexpensive Disks),还有SAN(Storage Area Network)和NAS(Network Attached Storage)等等。Google的两位创始人,为什么不沿用现成的技术,而是选择了另辟蹊径,莫非自讨苦吃?

欲知答案,且听下回分解。


本帖一共被 2 帖 引用 (帖内工具实现)
家园 好看
家园 等待下文
家园 先谢过,慢慢参加讨论中

恭喜:你意外获得【通宝】一枚

鲜花已经成功送出。

此次送花为【有效送花赞扬,涨乐善、声望】

家园 继续,嘿嘿。
家园 感觉最好的Search Engine 应该就是真正的AI

google的技术发展有生物神经网络发展的痕迹.

家园 花一个,正好最近在研究分布式计算/存储/文件系统

正在看hadoop源码,觉得Map/Reducer模式还是存在很大的局限性,呵呵。

家园 好文,继续期待
家园 花待!
家园 花教育理念!

说得很好啊。

家园 花个
家园 MapReduce稍后会谈到

MapReduce 解决的是如何把众多任务平行分发。

以后的章节会谈到,先把Google File System说完吧。

家园 这和搜索的静态信息的特点有关
家园 好文好文,实在是长知识
全看树展主题 · 分页首页 上页
/ 3
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河