五千年(敝帚自珍)

主题:【原创】中文文化消失的必然性:文化的传承。搜索引擎的搜索技术的影响 -- 铁手

共:💬23 🌺22
分页树展主题 · 全看首页 上页
/ 2
下页 末页
  • 家园 【原创】中文文化消失的必然性:文化的传承。搜索引擎的搜索技术的影响

    原标题是用了“GOOGLE的搜索技术”,改为“搜索引擎的搜索技术”--注

    但愿不是我危言耸听。

    之前有过一些想法,前些时候,正好又看到 苏萸【保卫西西-原创】拿什么对抗google。拖了些时候,写出来供大家讨论。

    几千年的存在了,作为一个会写中文,会看中文的人,我们都会为我们的中华文明史而自豪。在若干个历史上曾经辉煌过,而如今只能通过历史和考古来缅怀的其他文明的灯光摇弋下,我们都很庆幸,也很自豪我们的文明,经过千百年的锤炼,生存、并繁衍着。

    很多人都对这几千年的文化传承感到自豪,也必然相信我们的文明会子子孙孙的继续下去,也许几万年以后,我们的后裔还会象我们今天一样的自豪。

    坦率的说,我不乐观。即便中国的大量的人口天然成为一个极端有利的条件。

    有一次和朋友讨论中西之间语言对文明的影响(他是个德国人),他很惊讶于中文的一些特点。在欧洲国家里,表示同一个意思的词,比如说某个地方的地名,在不同的地方写法可以不一样,但是发音基本上类似。而在中国呢?同一个词,在不同的地方,写法是相同的,但是发音可能随着地域变化而不同。

    我想,正是因为“书同文”让我们的文化和文明,在几千年里不断出现的民族融合过程中而得以保存和延续。

    对中文文化消失的忧虑,或者说是对中文文化延续的不乐观,是因为现在的文化传播方式已经大不相同。

    现在,互联网已经改变了这个世界很多。能够上互联网的人,也很少有不利用搜索引擎来找资料的。在这种情况下,或者在可以预见的将来,文化的传播已经不能离开网络的存在。

    问题是在于,你到网上找资料的时候,搜索引擎提供给你什么,以什么样的次序提供,会有怎样影响呢?

    几乎所有的搜索引擎都会使用某种打分规则来给页面打分,从而决定页面的重要性,也决定某个页面有多大的机会被人看到。

    拿GOOGLE来说明吧。它使用的是PAGERANK为指标,PAGERANK由很多因素决定最后的值,其中很关键的一个是有多少个页面链接到某个页面,那些页面的重要性怎样?在某种程度上,这个PAGERANK的算法就是一种高人推荐的一种计算机实现。显然,诸葛亮的推荐显然要比蒋干的推荐更让人另眼相待不是?关键的关键,是有没有人推荐?

    最近我在网上搜一些资料,中文页面和英文页面,说实在,差别太大。

    同样的内容,可以在无数个中文页面里找到,但是不知道原作者是谁。而在英文的页面里,重复的很少,而从一个页面里,也能够很容易的通过链接的引用而找到其他网站的相关内容。

    因为GOOGLE搜索引擎的地位,也因为我们日益依赖于搜索引擎“喂”给我们东西,GOOGLE的PAGERANK的存在,虽然未必就是英文页面里众多链接现象的根本,但至少也是鼓励了很多人尽可能的通过链接的交换,通过引用别人的链接而让别人也链接自己来提高自己内容的受关注程度。最终,群体的行为,直接和间接的导致相关内容的相互关联,也导致原创的、有实际内容的页面更容易被人看到。

    这就是游戏规则!

    也会是 如果 我们 不 注意 引用 别人 的 内容 和 链接,而 导致 中文 文化 和 文明 在 网络 和 现实 中 消失 的 根本 原因。

    会不会呢?

    (待续)


    本帖一共被 3 帖 引用 (帖内工具实现)
    • 家园 老大,我不能认同你的观点

      我当年混搜索业的时间很短,工作时间只有半年,更多地是从内容的角度去关注它。

      但您从google的角度来讨论中文文化的消亡,实在是太偏颇了点。

      下次用google找中文不如意,麻烦你用下百度看下对比。实在不行,百度的相关搜索也会提供比google好得多的中文用户选择。

    • 家园 google的技术有问题的,

      现在99%的网页没有被任何连接指向。

      google的ranking其实已经无效了。 只是,这些默默无名的网页, 还没有什么新的大应用出来。

      google被取代,打回原形只是个时间问题。

      目前的潮流是论坛值钱, 只是论坛无法机械化处理, 成本太高。网络文摘也是方向之一。

      看来, 中国网络文化还是有不少可取之处的。代表了网络的方向, 只是国外传统媒体太发达, 所以一时半会转不到网络上来。

    • 家园 要想甜,多加盐。

      要有盐,多下海。

    • 家园 没看明白

      不过以前倒是看过一篇文章,说google因为是机器自动收集网页,所以引用链接越多,这个页面越靠前。带来一个什么问题呢?就是人气越高越会广为流传(哪怕它是错误的)。。。所以google搜来的东西不可靠。

      不知道是否就是楼主表达的意思?

    • 家园 【文摘】果然是危言耸听

      个人——企业(组织)——民族——文化(文明)

      不是这样简单就能够链接起来的吧。

      google用什么样的算法筛选、排序会对情报/知识的获取做出怎样的影响,

      是个问题。但是,人还是可以做出自己的选择和排序的。这和控制环境恶化,

      避免最终生存在垃圾之中所要做出的劳动是类似的。

      问题的关键在人自身。要付出学费、要付出汗水鲜血乃至生命来意识到

      问题的存在,并在此基础上做出解决问题的努力是一个痛苦的劳动过程。

      媒体、互联网和著作权的话题,自己所欠的账并没忘。容俺再准备些馅和柴吧。

      列几个参考先

      ·关于[知识共享]( CC——Creative Commons )

      http://cn.creativecommons.org/

      http://www.creativecommons.cn/

      ·《Republic.com》作者 Cass Sunstein

      中文译名是《网络共和国》或《网络共和国的民主前景何在》

      (日文书名直译成中文是:互联网是民主的敌人吗)

      关键词(Tags): #劳动
    • 家园 响应舵主号召,献花讨论

      大家对中文、西文孰优孰劣意见不一,对Google引导互联网技术发展或许分歧不会太大。我个人认为从人类智能的发展,中西方应该不会有大差别,就象80年代初PC引入国内,输入法是最大的阻碍一样,但现在小孩们打字贼快。我觉得问题在于中国的科技体制有问题,高喊“创新”,急功近利,鞭打快牛,出小聪明者众,大智慧者少,如能不能不跟从Google的思路而另辟捷径。

      我个人认为中文不至于有生存危机,中文互联网仍然会热闹下去,因为互联网除了传播知识的功能外,娱乐更是普罗大众的基本要求。

      我也相信中文搜索技术也会慢慢出现不同于Google的一些方法。

    • 家园 不会不会

      看一种文化的延续,关键还是要看这种文化的载体,说白了就是运用这种文化的人民.只要中国,中国人在这个世界上保持经济,政治,军事的规模,其文化必然会保持和发扬.

      顺便说一句,目前跟政府打交道的事情,很多表格,文件,必须是以中文为准,英文只作为参考,不具有法律效力,很多人(包括我)在具体操作时候,曾经很希望能有英文同等效力的文件---

      然而现在看起来,这样坚持是对的.

      • 家园 同意大厨,另外

        中国互联网文化目前来说还是相当有活力的,虽然小P孩在网民中占据了数量的大多数,他们的愤青、无知、狂热也具有相当大的影响力,但并不能阻挡整个互联网的百花齐放。

        无论如何,不可忽视互联网本身的包容性和草根性。

    • 家园 文化不会因为技术而消失。中文网络世界的弊端。

      这篇文章提出了两个问题。第一是中文的方言发音不规范的问题,第二是Google的page ranking的问题。中间的过渡不太连贯,我没看明白其中的逻辑。

      英文的one,有的地方念“万”,有的地方念“旺”。英美发音区别也很多。但是没有到中国的方言造成不能交流的地步。这更显出推广普通话的重要性。

      一个搜索引擎的技术问题,不会导致文化的消失,大请放心。技术是跟着人走的。假想一下,当初计算机产生,不能处理中文,没有合用的中文输入法,那时候的恐慌要比你现在的更巨大。其实这都是细枝末节。技术上没有不能实现的道理。Google采取适合英文世界的技术,也会改进自己来适应中文世界。如果西方人不搞,中国人也会自己搞。你描述的确实是个问题,我不是搞算法的,也不知道解决的答案。但是如果说这是个不能解决的技术问题,我会非常非常惊讶的。

      关于中英文网络世界的区别我愿意多谈谈。

      我去英文网站比较多,逛论坛也一直去英文的。后来再回到中文论坛,才看出了各种弊端。还不得不自己办了个小论坛。不过先夸夸西西河,不是吹捧,而是真心的。西西河的讨论气氛非常好。也是我知道的唯一能来的中文论坛。如果我以前知道有西西河,可能就不会自己开论坛了。

      中文网络世界的弊端很多,但是我只就着你的话说一点,就是互联的问题。中国论坛有个特别的“原创”的概念,这在英文论坛是没有的。为什么有原创呢?因为转载太多了。转载,就是ctrl-c,ctrl-v。别说论坛了,正经做网站的也敢这么干。所以你搜索什么,都是发现一模一样的东西,所有网站都有。但是英文论坛,(还有我的论坛也是这么要求的),转帖,给个连接就行了,加个摘要更好。除了特殊的理由,比如所连网站被封、只好全文转载,我看不出有任何理由把全文摘过来。互联网的方便之处就是连接。你给出连接了,别人看到了,为什么非要全照抄过来呢?

      一个重要原因是论坛怕访客流失,怕访客从连接找到别的地方去了。极端的论坛根本就禁止连接的功能。所以我在西西河也比较小心些,都是全文照抄过来,以免版主不悦。

      真是很可悲,简直是粗暴的取消了互联网的最大功能。这一点,我觉得是太小气了。如果我论坛的访客,从我的连接,发现了他需要的东西,找到了其他更多的东西,我会因此高兴,我认为的帖子帮助了别人,有价值。正因为连接多,才更使你有价值。

      并且我也不担心别人会走。来论坛的,是和坛子里的人聊,他去别的地方读文章,还是会回这里聊。如果他觉得我这里不如别的地方好,尽管去,我怎么会强留人呢?

      有些作IT的人非常明白这个道理,有些IT界名人的blog都是给别人给朋友做很多连接。我很赞赏这个态度。

      把中文网络世界的各立山寨的封闭特色上升为文化问题不算过分。我们还没有形成这种开放的互助的双赢的文化。

      • 家园 对你的关于转载问题的看法

        国内的网站的转载固然有不尊重作者版权的问题,但是也有对于好东西分享的想法,因为很多原创作者的网址可能短期内还能保持链接,长期下来链接失效的可能性很大,毕竟中国的网站维护技术还很不完善。如果所有网站都限制死不准转载,很多好作品只能成为孤芳自赏。像很多慕西河名而来的国内网友如果不是看到那些文章的全文,只有孤零零的链接,那样很容易因为连接的困难而放弃的。

      • 家园 我倒是很喜欢全文转贴

        只要转贴的同时不要忘记写上转贴,并尽量把作者名字写上就行,当然贴上原贴地址就更好了。

        我很讨厌直接贴链接,首先链接要是网站还好,要是论坛,很多都是需要注册才能看,让人很是不爽。而且如今网络病毒横行,谁知道链接里面有没有毒?

        • 家园 嗬嗬,用户要求第一!

          嗬嗬,喜欢全文转载的人还是挺多的。这些说得也都是实情。不过我逛的网站少,恶意连接没见识过。

          如果我只是个用户,可能还要多说几句。但我是个程序员,也是个小网管,所以我深知,用户是对的!

          这个事情当然是铁手肯定都很熟悉。

          做软件嘛,必须让用户满意。但是让用户满意的方案可以有很多种,这里面就可以作出引导。

        • 家园 你说的这也是个问题,所以我也不大喜欢链接

          有些连接里面带着像3721那种恶心的东西确实要命。还有些挂着羊头卖狗肉的,你一点跑去不知道什么地方看恶心图片就更坏了

分页树展主题 · 全看首页 上页
/ 2
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河