五千年(敝帚自珍)

主题:【原创】网络分裂症 [1] -- 邓侃

共:💬33 🌺183
分页树展主题 · 全看首页 上页
/ 3
下页 末页
    • 家园 有趣,逐篇送花
    • 家园 送花

      真是牛人啊

      但是貌似第一句可以修改下

    • 家园 逐篇花并收藏了。兄台多写啊。
    • 家园 【原创】网络分裂症 [2]

      [1] 链接出处

      [2] 链接出处

      [3] 链接出处

      如果把人际关系看成是一个网络,每个人都是一个节点(node),如果A和B两个人相互认识,那么就存在一条连接节点A和B的边(edge)。人际关系网就是这样一张由节点和边组成的图(graph)。某个节点上的边越多,说明这个人的朋友越多。人与人的社交能力和偏好不同,有的人高朋满座,有的人乐于独处。从整个人类来说,人的社交范围的分布是什么样的呢?换句话说,每个节点上的边的数目,是服从什么样的概率分布呢?

      很多人以为是随机分布,就像男人的身高一样,在1.65-1.75米之间的男人很多,1.90米以上的人数少一点,超过2.00米的就更少。随机分布的形状像个倒立的钟,左右对称,如下图所示。很多人认为人类的社交范围也服从正态分布,大多数人平时经常联系的人,为数也就20-30个,少数人特别热衷于社交,他们或许会认识50个甚至更多的人,也有少数人习惯离群索居,他们平时接触的不超过10个人。果真如此吗?

      点看全图

      外链图片需谨慎,可能会被源头改

      1998年,美国圣母大学的教授Albert-Laszlo Barabasi写了一本书,书名叫“链接,网络的新科学 (Linked,new science of networks)”。这本书里谈到一个观点,认为人类的社交范围应该服从幂次分布,如下图。

      点看全图

      外链图片需谨慎,可能会被源头改

      通俗一点讲,20%的人认识很多其他人,他们是人际关系网的中枢(hub),而剩下的80%的人,他们的社交范围非常有限。在这个关于社会主义搜索引擎的文章系列的第一篇,我们曾经谈到过80/20现象,又称为长尾理论。Barabasi把80/20这样的通俗说法量化了,用幂次分布的数学模型,更精确地描述了80/20现象。

      Barabasi这个人很有意思,他的专业是理论物理。但是他没有去研究量子力学相对论等等经典的物理课题,而是涉足计算机网络,尤其是他的团队做了一个网络爬虫(web crawler)。做网络爬虫的人很多,譬如Google的两位创始人,他们也做了网络爬虫,在这个基础之上,他们开发了Google搜索引擎。使用同一种工具,生产出的结果却不一样,Barabasi没有用网虫来实现搜索引擎,却用它来研究网络的拓扑结构。

      说得详细一点,Barabasi看到的现象是,每个互联网的网页通常会有几个链接,连到其它网页。他感兴趣的问题是,每个网页的链接的数目相互不同,这些数目的分布有没有规律可循?随着互联网的发展,网页的链接也随之变化,变化的趋势是贫富分化加剧还是大家趋同?由此引申出来的问题是,如果我们想创建一个网站,我们应该如何经营才能使它越来越有人气。或者反过来讲,如何打击我们的竞争对手,争夺他们的人气?

      Barabasi 的研究发轫于互联网的拓扑结构,但是他没有局限于此。他把类似的思想方法推广到其它领域,包括传染病的传播与控制,公路网与航空线路网,基因与蛋白质的多元因子互动,人际关系网,语义网(Semantic network)等等。他发现这些不同领域的网络,具有类似的特性。他把具有这些共同特性的网络,命名为无标度网络(scale-free network)。

      无标度网络有几个显著的特点。第一个特点是,无标度网络的联通,高度依赖于几个中枢(hub)之间的联通。譬如中国和美国,各有几亿国民,但是两国国民的个体之间的联系并不能左右两个国家的整体关系。国与国的关系,掌握在政府,大企业和号召力强的民间团体手中。这个特点可以为我们提供一些行动指南。譬如有人建议通过民间外交来提升中美关系,假如遵循这个指导思想,我们通过奥运会或者世博会,争取了一千个甚至一万个美国草民来我们中国参观,并且成功地吸引他们热爱中国,中美关系会不会因此升温呢?无标度网络理论的结论是不会。反过来,如果我们有办法让CNN立场变得亲中,或者让好莱坞多拍几部像“功夫熊猫” 那样的宣扬中国文化的电影,美国民众就会普遍受其影响,改变对中国的观感。

      关键词(Tags): #互联网#六度空间#无标度网络
      • 家园 你的人品真好

        恭喜:你意外获得【通宝】一枚

        谢谢:作者意外获得【通宝】一枚

        鲜花已经成功送出。

        此次送花为【有效送花赞扬,涨乐善、声望】

        [返回] [关闭]

      • 家园 很有启发性的理论,花之

        恭喜:你意外获得【通宝】一枚

        鲜花已经成功送出。

        此次送花为【有效送花赞扬,涨乐善、声望】

        按照文中所说,民粹主义者恐怕要失望了,反过来说,这似乎又有一点鼓励愚民政策的意思,呵呵,说远了说远了,科技帖子怎么扯到“肮脏的政治”了,羽羊该打,面壁去了

      • 家园 挑个小错

        很多人以为是随机分布,就像男人的身高一样,在1.65-1.75米之间的男人很多,1.90米以上的人数少一点,超过2.00米的就更少。随机分布的形状像个倒立的钟,左右对称,如下图所示。

        从上下文看,“随机分布”应当是正态分布之误。其实单个人结识人数的分布不可能是正态分布,因为这个人数不会小于0。

        到底这个人数服从什么分布?只要考察一个人在单位时间内能够结识的人数就行了。这跟排队论中的顾客到达人数是同一类问题。这个问题的结论就是:服从指数分布,也就是下文说的幂次分布。

        • 家园 是正态分布而不是随机分布

          记得我已经改过来了,怎么帖帖子的时候还是错的。唉,这记性。

      • 家园 【原创】网络分裂症 [3]

        [1] 链接出处

        [2] 链接出处

        [3] 链接出处

        第二个特点是,随着无标度网络的进化,越来越多的边(edge)向中枢节点(hub node)汇集,形成贫富分化的局面。Barabasi研究了美国的公路网发展史。美国早期只有乡村小路,杂乱无章地连接各个村落。后来有了公路,再后来有了城际和州际高速公路。虽然乡村小路也有很大发展,但是自觉不自觉地,这些乡村小路都与城际和州际高速公路相联通,形成以城际和州际高速公路为主干,以乡村小路向四处蔓延的公路体系。互联网的发展也如此,刚开始的时候,各种网站百花齐放,各领风骚,但是逐渐逐渐,用户向少数几个大网站聚集,形成寡头局面,其它小网站渐渐退出舞台。

        第三个特点是围绕中枢与之密切联系的,是次一级中枢,而围绕次一级中枢的,是再次级中枢,形成一个等级结构。譬如新浪网的博客拥有广大的读者群,其中徐静蕾韩寒等人的博客人气极盛。而徐静蕾韩寒他们的朋友的博客,通常也很有人气,而且面向同一个读者群。假如我们也想建一个博客网站,与新浪网争夺人气,无标度网络理论给我们的建议是,争取徐静蕾韩寒来加入我们的网站,如果他们不同意,就争取他们的朋友来加入,因为他们的朋友会把徐静蕾韩寒等人的读者带过来。无标度网络理论把这个特点命名为“偏好连接(preferential attachment)”。

        第四个特点叫着"集群系数(clustering coefficient)"。在第三个特点里面,无标度网络理论告诉我们,中枢是分等级的,像是一个金字塔型结构。假如我们的博客网站野心很大,想把徐静蕾韩寒的读者群整个吸引过来。有没有必要花大力气,把整个金字塔从头到脚无一遗漏地统统策反呢?无标度网络理论的结论是不需要。金字塔的底部是一个一个小圈子,每个小圈子里的所有人都相互认识,但是他们与外界的联系相当有限。每个小圈子都有为数不多的少数几个人充当与外界的联络人。所以,只要争取到了这些小圈子的联络人,整个小圈子的意识和行为就会发生变化。

        应当指出的是,无标度网络理论目前只是一个设想,还没有得到严格的科学论证和普遍接受,与经典的学术理论也有冲突。譬如,经济学通常有个假设,认为每个人都是理性个体,他们有独立思考的能力,从而他们的意识形态也是独立的和理性的。但是无标度网络理论描绘的却是另一幅图景,以无标度网络为特征的社会人际关系网中,绝大多数草民的意识行为受到精英阶层的左右。从这个意义上讲,中国古代绘画与无标度网络理论倒是一拍即合,因为在中国古代绘画中,没有科学的透视法则,“大人”如达官雅士,通常被画得很大,而“小人”如仆役书童,通常被画得如侏儒一般。

        另外,还有一种对无标度网络理论的批评,认为这个所谓理论,只不过是把大家司空见惯的常识,用数学的语言,重新叙述一遍而已,并没有什么实质的新鲜内容。对于这个观点,笔者是不同意的。的确,无标度网络理论总结的几个规律,用通俗语言也是可以描述的。不同之处在于,无标度网络理论把这些规律量化了。设想一下,我们创立了一个网站,计划与新浪争夺博客名家。风险投资商提供了一笔经费,我们如何合理使用经费,使之发挥最大效能?首先,我们应当出价多少去争取徐静蕾韩寒?第二,是把所有资金集中起来争取几个顶尖的博客高手,还是分散资金吸引为数更多的二线博客写手,这两个策略哪个更有效能?优化类似的投资决策,我们需要量化的数学模型作为决策辅助工具。虽然无标度网络理论目前还没有非常成熟,离胜任这样的决策辅助工具还有很长的路要走,但是至少,它开辟了一个道路,为进一步的研究提供了宝贵的开创性思路。

        关键词(Tags): #互联网#六度空间#无标度网络
        • 家园 受教了!花之

          鲜花已经成功送出。

          此次送花为【有效送花赞扬,涨乐善、声望】

        • 家园 【讨论】这个系列算完了没有?

          发现邓兄的坑很多啊

        • 家园 好,建议中宣部认真学习。

          貌似可以有效地指导宣传(或称愚民,洗脑)的有效性。

          和另一篇“口碑动力学”有异曲同工之妙。

        • 家园 这个理论也许说明了一些现象的成因

          假如我们也想建一个博客网站,与新浪网争夺人气,无标度网络理论给我们的建议是,争取徐静蕾韩寒来加入我们的网站,如果他们不同意,就争取他们的朋友来加入,因为他们的朋友会把徐静蕾韩寒等人的读者带过来。无标度网络理论把这个特点命名为“偏好连接(preferential attachment)”。

          一个论坛的兴盛,往往都因为坛主在之前的某个论坛的地位或者论坛中某个人在之前某个论坛的地位导致,这方面在国内的互联网上可以找到很多的例证,现在对这个理论很有兴趣了,邓兄能否给出些参考资料?

分页树展主题 · 全看首页 上页
/ 3
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河