五千年(敝帚自珍)

主题:【原创】普京的心思 -- 达闻奇

共:💬317 🌺1568 🌵40
全看分页树展 · 主题 跟帖
家园 语言实际才是中国这波技术爆炸的真正基础

从1450年古登堡活字印刷到鸦片战争,差不多400年。推动西方科技发展的根本实际是纸张和活字印刷术与拼音文字的化学反应。由于活字印刷学天然对拼音文字友好,在活字印刷时代,西方知识传播,普及和更新的效率大大压倒东方,这是客观决定主观。这种优势延续到几十年前,他们打字机就可以生成标准文稿,形成规范文档。而中国到建国后相当长时间政府文件初稿都需要手写批注。

但这个在从电脑信息化时代开始改变,最开始似乎拼音文字还是优势。但先是激光照排,汉字的印刷品成本终于下来了,知识普及的成本大幅度降低。然后就是pc, 再到手机。汉字作为信息交流媒介的效率优势开始爆炸性展现。比如现在很多海外人看翻译的中国网络爽文小说,扣除其他文化水平之类原因。汉字码字太快了。同样写一章小说1万字,汉字可能1,2个小时作者就敲进去了。比如现在我和你扯淡,一千个字实际很快就码出来了。汉字1万字小说,可能敲击键盘2万次就ok了,写手一分钟输入个200字应该很轻松。内容生成速度和思维速度基本能同步。要是英文写那,1万汉字可能对应2万个单词,哪怕有输入提示,很可能作者也需要至少敲击键盘10万次才能完成同样的信息内容表达。这个产出效率就有5倍差距了。

实际信息的接收和输出是基本能力,无时无刻,无处不在。从90年代后中国经济就没有大的明显衰退过程,老泉个人觉得实际这是这种信息化演化革命的原因。汉字汉语体系的信息收发效率在互联网和移动互联网时代产生了爆炸性效率提升。这点在现在实际在加速体现,比如短视频和长视频,汉字文案和视频内容组合,可以15秒传达比如50个字汉字的信息内容加视频讲明白一个小故事或者新闻事件,15分钟视频可以5千字文案大致让人了解某个学科具体知识内容框架。这种信息收发优势更加明显。(用英文,50个汉字可能对应100个单词,对应300个音节,念不完,念了人听力也跟不上)

而在AI领域,大数据领域,这点更明显。比如一个西方马逆造谣世界卫生组织和中医药,那么就是WHO(世界卫生组织)和TCM(传统中医药)如何如何。你无论人工还是人工智能去进行大数据检索的时候,WHO和 who这个高频单词的干扰就非常严重,TCM这种也和其他专业容易冲突,人活着人工智能都不容易找到精确需要的信息。而假设是中文那,世卫组织,中医。这2个关键词是精确的,搜索范围能一下子几千倍,几万倍的缩小,人工智能或者大数据的精确匹配难度会降低多个数量级。

中国从80年代激光照排,五笔字型开始算,差不多40年走完了西方400年的信息传播优势。现在大致到了中国是1840大英,美国是1840大清的时代了。后边拉开的会更快,因为AI,大数据,机器学习等,都需要某个系统自己去学习大量新的知识,或者说人工智能开始实现对部分脑力劳动的机器替代。而汉字在信息或者知识定义的效率和精确性上在AI时代的碾压会比人与人之间信息沟通更大。

这种是无解的,或者说这种类似生物学上,同一个物种中某一支的神经系统和大脑的传输运算效率突然大幅度提升,那么后边必然是这一支对其他同类的碾压。其他的捆在一起,都打不过的。也就是说,美欧俄印什么这些,将来捆起来一起上,照样把他们全轻松放倒。何况现在,俄罗斯短期怎么也不可能捆进去了。

通宝推:达雅,empire2007,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河