五千年(敝帚自珍)

主题:【原创】Wikipedia 启示录 [1] -- 邓侃

共:💬30 🌺170
全看树展主题 · 分页首页 上页
/ 2
下页 末页
家园 【原创】Wikipedia 启示录 [1]

[1] 链接出处

[2] 链接出处

[3] 链接出处

1906年,意大利有位经济学家叫Pareto,他在研究意大利国民财富分配的时候,发现20%的国民掌握了80%的财富。这是一个令人沮丧的现实,而且更加令人沮丧的是,这种严重的不平等现象不仅存在于意大利,而且当他研究其它国家的财富分配的时候,发现类似情况比比皆是。

到了1941年,美国管理学家Juran把这个充满悲剧色彩的现象,做了喜剧式的延伸。他发现,这种80/20的不平等现象不仅出现于财富分配,而且存在于形形色色各种地方,譬如,80%的销售额来自20%的客户,80%的利润来自于20%的商品,80%的问题来源于20%的起因,甚至于每个人每天80%的成就来自于20%的有效工作时间等等。

Juran把这种80/20现象,称为Pareto定律,或者80/20法则。为了推销这个理论,他还炮制了一条警句,“重要的少数与琐碎的多数 (the vital few and the trivial many)” 。

为什么说Juran把Pareto的悲观论点,演变成了喜剧呢?因为在Juran看来,80/20是自然界的一条通行的法则,既然是自然规律,那么占有80%财富的少数特权阶层也就不必有什么罪恶感了。但是解脱了富人不等于安慰了穷人,穷人们抗议说,如果我们是琐碎的多数,那老子我不干了,让你们这些20%的精英获得全世界100%的财富吧。这可万万使不得,如果80%的琐碎的多数都罢工了,那谁来扫大街,收垃圾?于是乎,几年后Juran改了口,不再是“琐碎的多数”,而是“重要的少数与有用的多数 (the vital few and the useful many)” 。

一转眼到了2004年,美国杂志Wired的主编Anderson,在研究了电子商务,譬如Amazon.com和Netfix.com以后,对Juran的警句再次做了修正,这次是“重要的少数与能挣钱的多数 (the vital few and the profitable many)” ,并且定名为长尾理论(The Long Tail)。

长尾理论的基本原理是:只要渠道足够大,非主流的、需求量小的商品销量也能够和主流的、需求量大的商品销量相匹敌。譬如,Amazon.com不仅仅卖那些可以创造高利润的少数畅销书,而且也出售包罗万象的冷门和另类书籍。结果证明,1995年成立的Amazon.com,在短短几年之内就以绝对强势超越了1917年成立的老字号书店Barnes&Noble。道理很简单,Barnes&Noble限于营业厅的面积,不可能像Amazon.com那样,一分钟接待成千上万名顾客,也不可能把千奇百怪包罗万象的各种书籍统统摆上货架。

搜索引擎和长尾理论有什么关系呢?注意,长尾理论成立的前提条件是“只要渠道足够大”,这里所谓渠道大,包含了两个意思,一是顾客要足够多,虽然每个人感兴趣的商品可能完全不同。二是大多数顾客能找到他感兴趣的商品,即便这个商品是非主流的冷门的商品。搜索引擎充当的角色就是帮助猎奇的顾客找到冷僻的商品。

Amazon.com的成功似乎颠覆了“重要的少数与琐碎的多数”的所谓自然法则,人们开始欢呼搜索引擎给世界重新带来了平等的希望。强大的搜索引擎似乎可以照亮互联网上每一个昏暗的角落,任何人都有可能在15分钟之内成为世界名人。

但是Wikipedia的异军突起却似乎为80/20法则再次做辩护。

关键词(Tags): #互联网#Wikipedia#群众运动元宝推荐:老马丁,

本帖一共被 3 帖 引用 (帖内工具实现)
家园 【原创】Wikipedia 启示录 [2]

[1] 链接出处

[2] 链接出处

[3] 链接出处

Wikipedia在2003年到2008年的五年内,流量大涨了8000%。尽管从2007到2008年,增长率明显下降,但是从五年跨度的总表现看,8000%的增长率实在是很惊人的。

年份 月流量 与去年同比增长率

2003 700,000 n/a

2004 2,082,000 197%

2005 6,753,000 224%

2006 25,970,000 285%

2007 45,934,000 77%

2008 55,820,000 17%

这么高的流量是从哪里来的?有好事者做了一番抽样调查。

来源 样本分布 百分比

总计 71873 100.0000

Wikipedia 内部链接 31512 43.8440

Google 17102 23.7947

主动访问 11873 16.5194

IE7 插件 3862 5.3734

Wikipedia 姐妹网站,如Wikimedia 2174 3.0248

Wikipedia 内部搜索引擎 2140 2.9775

Yahoo 1507 2.0968

其它网站 1162 1.6167

MSN 208 0.2894

Live 189 0.2630

AOL 84 0.1169

Ask 39 0.0543

AltaVista 21 0.0292

首先,Wikipedia及其姐妹网站如Wikimedia是如来佛的手掌,一旦跳进去,就不容易出来。尽管可以点击链接,但是跳来跳去,还是在如来佛的手掌里。如来佛的手掌有多大?Wikipedia 内部链接,Wikipedia 姐妹网站如Wikimedia,以及Wikipedia 内部搜索引擎,共创造了49.84%的流量。

第二,是谁把用户带到Wikipedia的?搜索引擎。Google,Yahoo,Live,Ask还有AltaVista,总共贡献了26.24%的流量,其中Google一家就输送了23.79%的流量。是Google的搜索算法特别偏爱Wikipedia吗?的确存在这个因素,因为Wikipedia每篇文章中都有很多链接,这篇文章链接到另一篇文章,而另一篇文章有可能又链接回第一篇文章。而Google的搜索排名算法,是与链接的数目有关的,如果有一篇文章被很多其它文章链接,就说明这篇文章很重要。截至到2008年1月,Wikipedia英文版总共有2,172,800篇文章。两百万篇文章相互推荐,结果是大家的排名都上升。

但是不能就此断言,Wikipedia的成功仰仗于搜索引擎,特别是Google的利益输送。主动访问的用户,带来了16.52%的流量,这些主动访问的用户,多半是回头客。回头客看重什么?质量。所以,Wikipedia的成功主要归功于文章的质量,而搜索引擎起到的是推波助澜的作用。

另一个旁证是“百度知道”的成功。在中国,无论用户搜索什么,Google中文版在首页显示“百度知道”链接的概率是12%,而用户点击“百度知道”链接的概率是20%。总不至于Google的算法偏爱对手百度吧?而且,与Wikipedia不同的是,“百度知道”的文章中,相互推荐的链接不多,所以Google的算法偏爱“百度知道”的猜测不成立。

的确,强大的搜索引擎似乎可以照亮互联网上每一个昏暗的角落,但是被搜索引擎的雷达发现,并不保证有足够的观众来关注。言论自由固然重要,但是更重要的是言论的传播力度。谁都可以关起门对着镜子高谈阔论,但是如何让世界听见你的声音却更重要也更有挑战。

说到底,用户还是关注主流,青睐精品。如果说互联网是一个大杂烩,形形色色,成色各异的内容都有存在的空间,但是质量好的精品依然是主流。翻出Juran的老话,“重要的少数与琐碎的多数 ” ,在搜索引擎和Wikipedia风行的今日,这句话或许可以改为,“少数依然重要,虽然多数不容忽视(the still vital few though the non-ignorable many)”。

但是时代毕竟不同了,少数未必是20%,精英的团体在扩大。大英百科全书的撰稿由4,000位专家担纲,而Wikipedia有75,000活跃撰稿人。如果谁想让世界听到他的声音,他不仅要会写好文章,而且最好要参加像Wikipedia那样的精英俱乐部。

Wikipedia的门,对琐碎的大多数而言,是敞开着的吗?

关键词(Tags): #互联网#Wikipedia#群众运动
家园 【原创】Wikipedia 启示录 [3]

[1] 链接出处

[2] 链接出处

[3] 链接出处

历史上的群众运动,通常存在两种倾向,一个是乌合之众的狂欢,一哄而上,漫无目的地发泄过剩的能量,然后就不了了之。另一个是暴民恐怖,以“人民的意志” 或者 “少数服从多数”的名义,肆意践踏剥夺少数人的权利。今天专政了一部份少数派,明天又专政了另一部分少数派。到头来发现,想保留做人民的资格,要么噤若寒蝉,要么违心说谎,“人民的意志” 实际上沦为寡头们的私欲。

Wikipedia实际上一场群众运动。任何人,只要有一台能上网的电脑,都可以为Wikipedia撰稿。但是这并不意味着绝对的言论自由,任何人的文章随时都有可能被别人改写甚至删除。截止2008年1月份,Wikipedia英文版的2,172,800篇文章,被改写过193,207,500次,平均每篇文章被改写过88.9次。

不过,如果符合Wikipedia的写作规范,你原先写的段落,被保留下来的可能性会大一些。同时,在符合写作规范的文章之外,还有高下之分。在英文版2百多万篇文章中,有4千多篇被评为优秀作品,也就是566篇文章中遴选出一篇优秀文章,除此之外,还有2千多篇文章被封为经典作品,比例是1:1150。如果把写作规范比喻成法律底线,那么优秀和经典作品,给Wikipedia的撰稿人设立了道德楷模。

Wikipedia是用户生成内容(User Generated Content)的成功范例。用户生成的内容很多,BBS,博客,甚至Instant messager中的闲言碎语。但是绝大多数用户生成的内容,都是打情骂俏式的信息垃圾。如何把散落在各处的信息汇集起来,加以编辑整理,提炼出有信息含量的内容?光靠搜索引擎是办不到的,最终还是必须依赖人力,尤其是坚持群众路线。

Wikipedia为什么没有沦为乌合之众的狂欢,也没有倒向暴民恐怖?它成功的秘诀是什么?依我看,有三个方面的原因。一,明确而合理的规范,二,相互审阅,三,核心团队。不发动群众不行,但是离开了正确的引导也不行。Wikipedia的三大法宝,从几年的实践来看,是行之有效的。

Wikipedia 有明确的写作规范以及行为规范。譬如你想介绍一首歌的歌词,单单拷贝歌词是不够的,还得叙述一下歌词创作的背景,听众反响,以及作者简介。此外,行文要保持中性,各种不同的观点要均衡报道,或许有听众认为歌词意境深远,激情涌动,也有人认为措辞晦涩,基调偏激,对青少年有误导,这些观点都要囊括在文章中。而且不能把作者本人的偏向写进去,例如,“最有代表性的意见是...” 这样的句子是不允许出现的,而应该写成 “以下的意见得到了为数xxx的听众的支持”,并且给出引用的出处。

至于塑造良好的行为规范,Wikipedia制订了细致的措施。2000年,John Lott写了一本反对枪支管制的书,叫“多一点枪,少一点犯罪(More Guns,Less Crime)”。为了吸引更多读者,他在2000年到2003年间,他化名“Mary Rosh”,给这本书写书评,溢美之词甚多,同时反驳来自其他读者的批评。这种行为被命名为“木偶”,类似于国内的“马甲”,在Wikipedia是不允许的。理由是,每个人都可以为自己光明正大地辩护,但是换个马甲,甚至披着多个马甲,借别人的名义为自己壮声势,有伪造民意,操纵投票表决结果的嫌疑。

1867年,马克思完成了“资本论”第一卷,在汉堡出版。刚开始,没有引起太多反响。于是,老马和老恩想了一个办法,化名在报纸上写反对“资本论”的文章,然后,老马老恩逐一反驳,正反双方争锋相对,你来我往,好不热闹,终于炒热了“资本论”。这种做法,被称之为“稻草人”,在Wikipedia也是不允许的。理由是,假反方一定蓄意暴露反方意见的荒谬,有误导读者的嫌疑。

Wikipedia积累了很多甄别回避“木偶” “稻草人”之类无良行为的办法。

精雕细琢出精品。一篇出色的作品,往往是千锤百炼产生的。不仅作者本人会修改,而且也鼓励更多人反复修改。多次修改以后,各派的见解都会得到均衡报道,措辞也自然会中性化,因为只有这样文章才能被各方接受。如果有分歧怎么办?看看关于“黑色穆斯林”的例子,当提及黑色穆斯林的领袖Elijah Muhammad去世时,文章是这么说的,“伊斯兰国(黑色穆斯林的教会)的信徒们长期以来坚持认为Elijah Muhammad并没有死,他只是逃脱了一个刺杀阴谋,然后恢复了健康。而且目前乘着 ‘一个巨大的飞碟悬浮在我们头上’ ”。在飞碟上与Muhammad同在的是那个神秘人物W.D.Fard"。我得承认,当我读到这一段的时候,忍不住哈哈大笑,对于飞碟之说,我的确有强烈的个人看法。但是尽管如此,我仍然敬佩作者为严格遵守中性原则所做的努力。

读Wikipedia 的规范,不禁想起毛泽东的名作“湖南农民运动考察报告”,因为都是在谈如何引导群众运动。但是如何发动群众,规范里说得很少。2001年1月, Wikipedia初创的时候,只有10个撰稿人。一年后,增加到524人,到了2003年1月,增加到2,498人,2004年1月,11,202人, 2005年1月,52,785。Wikipedia是如何招募最初的种子写手,以及如何保持目前75,000位活跃撰稿人的积极性,这两个问题,需要更深入的研究。

核心团队的建设至关重要。一个健康的社会,应当宽容地吸纳从草根阶层崛起的人才加入精英阶层,一个发达的社会,应当主动地寻找并且培育草根阶层中的人才加入精英阶层。

关键词(Tags): #互联网#Wikipedia#群众运动
家园 这么好的帖子,一定要顶
家园 好文章要顶起来

邓兄加油!

家园 好文献花!

篇篇花。

Wikipedia为什么没有沦为乌合之众的狂欢,也没有倒向暴民恐怖?它成功的秘诀是什么?依我看,有三个方面的原因。一,明确而合理的规范,二,相互审阅,三,核心团队。不发动群众不行,但是离开了正确的引导也不行。Wikipedia的三大法宝,从几年的实践来看,是行之有效的。

你这三个原因,倒让我想起了革命的三大法宝“统一战线、武装斗争、党的建设”,基本上是一一对应的关系。

看来,成功的要素都是类似的。

家园 好文章,英文wikipedia的经验的确非常值得中文世界认真学习

不过我想问一个问题:它的成功是否仅仅来自于制度和管理呢?

我觉得,英文wikipedia的成功,一方面固然是来自于合理的制度和管理,另一方面,也不是所有的群众都好发动,发动起来都管用的,所以也不能忽视英文wikipedia的群众基础:1.巨大的英语人口,尤其是可以方便联入internet的人口;2.有极高知识水平的人群——很多条目的作者,本身就是这个领域第一手知识的创造者或者发现者。

而中文世界,前一点也许尚可和英语世界相比,后一点恐怕还任重道远。这个差距,从中文和英文wikipedia的对比中可以明显的反映出来。

家园 wiki的成功就在于它的有规则的开放

有关内容的修改不受到任何国家(除去伟光正所在的国家)的官方限制,词条的编写者无法垄断词条的解释。另外,wiki很注重管理层之间的交流,wiki大会从wiki产生后每年都在召开,这也促进了wiki的发展。baidu在这些层面上远不能和它相比,baidu知道词条的中立性和贴吧敏感帖的保留可能都不是受到市场的控制,baidu知道的词条编写人员松散而且缺乏交流。另外,wiki在google的排名靠前是靠的实打实的点击率,而baidu不过是用左手的baidu搜索引擎控制右手的baidu知道排名,这种虚假的点击率没有什么市场参考价值。

家园 写不了就翻译吧

非常同意王兄的说法。且不说我们熟悉的计算机互联网等新兴科学,在较为传统的医学法学等方面,wikipedia英语版都是覆盖非常广泛,论述非常权威。作为中文用户,也许大多数没有能力写作,但是我们可以翻译嘛。最近在国内也看到一些进步,继Google, Yahoo的机器翻译产品后,技术力量比较薄弱的百度也推出了在线翻译,虽然质量有待提高,但方向无疑是把英语和其他语种的内容转化成中文,方便万千网友。

家园 wiki论述非常权威?

R u kidding me?

家园 Wikipedia是否权威?

敲字太快,措辞不当,被Jack逮了一个正着。

说Wikipedia的论述非常权威,言重了。事实上wikipedia的论述更像是一个gateway,对于每一个词条,wikipedia的论述覆盖面广,从历史到现状,到不同意见,等等,方方面面都囊括,但是都不是很深入。

说它是个很好的gateway,因为通过wikipedia,可以了解个大概,要是想深入研究,可以追溯文章后面附录的链接。

家园 对于专业性读者,wiki当然算不上权威

特别是学术性强的东西,那个有知识产权的限制,顶多能做成个简单的综述。但是作为入门介绍还是够格的,可以作为进一步搜索的向导,特别是在某一词条中的文字中还包含其它相关词条的链接,这个功能很不错,很像学术文献中的参考索引。而且多语言版本可以弥补单一语言版本wiki信息的不足。很多具有民族特色的词条的信息量往往是英文wiki不能完全包容的,比如日文wiki和俄文wiki。

家园 好文,献花

我从WIKI得到的经验就是英语太重要要了。

家园 我觉得缺乏中文作者的参与也是一个大问题

wiki中文的内容的深度和广度也比英文的差得不知道哪里去了。百度里面的好多解释也不那么正确,或者说太浅。我觉得这个现象的原因还是在于中文作者的缺乏。

另:wiki上简体字的内容好像比繁体字的还少。

家园 中文wiki都快成了台湾wiki了

zxb对wiki的限制简直是不可理喻。这么好的阵地自己主动就放弃了。

全看树展主题 · 分页首页 上页
/ 2
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河