五千年(敝帚自珍)

主题:【原创】分形历史学 -- 同人于野

共:💬27 🌺100
分页树展主题 · 全看首页 上页
/ 2
下页 末页
  • 家园 【原创】分形历史学

    本文试图探索用数学方法研究历史。

    中国古代知识分子,包括现在的国产文人,喜欢用特别简单的结论来解释朝代兴亡。比如"得道多助失道寡助"说,"荒淫无道说","得人心者得天下"说。这些说法当然完全站不住脚。康熙好色,乾隆朝贪污腐败,国家没有亡;崇祯勤政而节俭,国家反而每况愈下;建奴和蒙古人从来没得过人心,居然也得了天下。如果实在无法用君王品质解释,文人们干脆祭出"气数"说。西方学者对君主个人品质和气数兴趣都不大,更侧重于人口,自然环境,甚至气候变化对朝代兴亡的影响。【同人于野:素质问题,制度问题,还是天气问题?】。

    其实如果我们仔细考察历史,其实很多历史上的重大变化都不是由于一个或者几个简单原因导致,而是由一系列大小事件综合作用的结果。比如明朝灭亡,至少需要五个必要条件:1.小冰河气候,2.东林党争,3.皇太极有才,而且运气实在太好,4.一系列投降事件,5.北京城流行鼠疫。熟悉明史的人很可能还会再加上几条。这里的要点是缺少其中任何一个条件,明朝都不至于被满清取代,这些事件必须共同起作用。英文有个新词叫做 "完美风暴"(perfect storm,说的就是这个意思。也就是说每一个孤立事件都不至于影响大局,然而碰巧这些事件都发生了,导致一个极小概率的大变化。

    历史很可能是一系列的偶然事件的结果。一个例子是拿破仑滑铁卢战败。有个网上流传的说法:

    滑铁卢一役,一代英豪拿破仑居然会输给能力平平的惠灵顿,确实让人感到不可思议。但其实拿破仑根本就没有亲临现场指挥这场战斗。拿破仑没有亲临现场是因为他在自己的帐篷里休息,他在自己帐篷里休息的原因是他要吸食鸦片,他吸食鸦片的原因是他要止痛,他疼痛难忍 的原因是他痔疮恶化,他痔疮恶化的原因是他穿紧身裤,而他穿紧身裤 的原因是当时整个巴黎都在流行穿紧身裤。

    当然这个是笑话。在真实历史中拿破仑直接指挥了滑铁卢战役,而且我看的书里也没说他患有痔疮。不过滑铁卢战败的确是拿破仑和其手下的一系列错误导致 的完美风暴:拿破仑不应该分兵,更不应该让庸才格鲁希指挥分出去的部队,格鲁希不应该在关键时刻犹豫不决,而且老天也不应该在那个时候下大雨,等等等等。

    如果进一步考察为什么这些小事件能够发生,其中背后可能又有一系列的小小事件,也许会发现每一个小事件本身也是一场完美风暴。比如我们如果考问洪承畴为什么投降,范文程为什么甘心当汉奸,再到东林党为什么就没有于谦这样的人物,其背后很可能有和明朝灭亡本身一样复杂的原因。

    那么现在如果我们问明朝到底为什么会灭亡,这个问题还有什么意义么?如果答案仅仅是"复杂"这两个字,那么我还有第二个问题:明朝灭亡和宋朝灭亡和元朝灭亡,其原因 的"小事件集合",是相似的么?这些事件集合是完全随机选取的么?

    一个和"明朝为什么灭亡"类似的问题是,当然你肯定猜到了,英国的海岸线有多长。海岸线是一个特别复杂的结构,它的长度取决于你用什么样的尺子去测量。具体情形西西河网友可以参考【安德的游戏:千奇百怪话分形——从海岸线到分形的定义】。

    测量出来的海岸线长度L,和所用尺子的长度G,之间有一个简单数学关系:L(G)=MG^(1-D). 其中M是一个常数,而D称为海岸线这个分形结构的"维数",它 的值在1和2之间。下面这张图来自 Mandelbrot 1967年发表在Science 上的里程碑论文,他给出了几个地区的海岸线的维数:

    点看全图

    外链图片需谨慎,可能会被源头改

    我需要特别强调的是这么几点:

    - 这个双对数图上面的海岸线测量变化曲线是几条吻合的相当好的直线,而这个简单数学关系绝对不是从直觉上就对的。如果你用不同的尺子去测量杂乱无章随便乱画的曲线,再看看测出的结果,最大的可能性是两者之间根本没有这么整洁的数学关系。这种关系之所以能够存在,是因为海岸线的形状不是完全杂乱无章的。这种关系说明海岸线具有自相似特性。也就是说你拿出一小段英国的海岸线,可能会发现它跟英国另外一小段海岸线的形状很相似。只有具备这种特性的海岸线才是分形,才能计算维数。

    - 不同国家的海岸线的维数并不相同,而这个维数跟海岸线的"长短"没什么关系。如果理解了分形表示自相似,那么这个结论就不会令人感到特别惊讶。

    - 海岸线具有分形特征,这只是一个"经验主义 (empirical) "的数学性质,而绝非数学定理。

    - 事实上并非所有国家的海岸线都能简单计算分形维数。这也很容易想明白:我们已经知道不同国家的海岸线维数不同,那么假设我们人为制造一条新的海岸线,其形状是英国海岸线和澳大利亚海岸线的拼接,显然这个新的海岸线就没法算维数,因为英国和澳大利亚的维数不同。2002年有一篇论文,说一个叫做Nanji的小岛的海岸线其实是由六种不同维数的海岸线拼接而成的

    - 既然如此,那么为什么英国就那么凑巧,正好是一个单一维数的海岸线?。。。海岸线的分性特征根本就不是数学定理。

    我认为历史事件也具有自相似,即分形特征。比如中国从汉朝以来大一统的两千多年历史,就有明显的轮回特性。每个朝代的开始和结束,从最大的视野去看,给人感觉差不多。甚至有人比较了汉朝初年和共和国初年的历史事件,也发现不少相似之处。

    一个大的历史进程中的各个小事件也具有相似的特性。比如满清入关这个大事件的历史时期,投降和杀戮可能就是时代的主题。再比如说解放军打国民党,大局上是以弱胜强,而其中具体到每一个小战斗,也经常具有以弱胜强的特征。

    这种自相似特性其实还有一个可能的应用,这就是《梅花易数》。《梅花易数》一类 的书进行算卦的理论基础就是如果你正在经历什么自身相关 的大事件,这个大事件可以用《易经》中的一个卦象来表示(注意这很有数学味道)。而这时候你 的一举手一投足,甚至抽中什么签,扔出去铜钱的排列组合,也都必然符合这同一个卦象。

    既然历史事件具有自相似性,那么就应该可以用分形办法来研究。现在我们可以回答前面提出的问题了。明朝灭亡和宋朝灭亡一样么?当然不一样。这就好比说英国 的海岸线和澳大利亚 的海岸线维数不同一样。一个大事件,比如明朝灭亡,也很可能像诡异的Nanji岛一样,由不同维数的几个大事件拼接而成。

    假设我们可以创造一个数学方法来量化计算历史事件的维数,那么不同大小的维数代表什么呢?我认为代表事件的复杂度。维数越高就越复杂,比如最简单的直线,维数是1.

    这样一来分形历史学就找到一个应用:比如说可以用事件的维数来给电影和电视剧分级。真正的商业片,比如《变形金刚》,维数都很低,主要让观众看完过瘾。而某些文艺片 的维数就很高,导致很多人没看懂。试想如果电影海报上有

    "Rated R. 1.25D"

    的标记,是不是能让观众多一点选择呢?比如一部PG-13的电影如果维数只有1.1,那么基本上就是要情节没情节要暴力没暴力,干脆不必看了。

    分形历史学的最大难点很可能并不是怎么量化计算事件,而是怎么给事件清楚的分类,也就是说分形结构的形状。通过一点调查研究,我可以负责任的告诉大家,怎么给事件分类,比如说怎么给所有的笑话分类,是人类目前还做不到的事情。

    一篇相关文章:

    同人于野:【原创】量化计算电视剧的拖沓程度

    另外广告一篇没有足够多点击量的文章:

    同人于野:【原创】受控核聚变 -4- 氦3的政治经济学

    关键词(Tags): #分形#历史#复杂#周易#易经元宝推荐:橡树村,爱莲, 通宝推:文化体制,游识猷,匿名:1

    本帖一共被 2 帖 引用 (帖内工具实现)
    • 家园 花顶好帖——
    • 家园 期待下文

      喜欢同人兄这种跨学科联想。

      补充一下,维数是复杂度的一种,是个拓扑概念。

    • 家园 图形中的双对数坐标有点奇怪

      应该是手工作出来的。先把数据取对数,却又画成均匀分布,就是为了找到相似的曲线。研究还可以这样做,佩服!又学了一手。

      • 家园 这个有什么问题?你理解的“对数坐标”是那种非均匀的吧?

        那并不是真正的对数坐标,比如1000,100和10,在对数坐标下本来就应该是间隔相等的,否则就失去对数坐标的优点了。

        • 家园 似乎不应该标成对数坐标?

          比如1000,100和10,在对数坐标下本来就应该是间隔相等的

          但是对数坐标中,1.0到1.5的距离和1.5到2.0的距离应该不是相等的。现在的图中画成相等的,就应该是线性坐标了。似乎不应该标成对数坐标?

          • 家园 呵呵,你说的对数坐标也是常用的一种

            通常用来表示一方值比较大的函数关系。不过真正意义上的对数坐标我觉得还是应该是取对数的这种,这个在科学研究里面非常方便,最方便的地方在于它可以很容易的看出一个曲线函数的因变量和自变量是否具有次方的关系,这个对于分形研究很重要,因为有的函数比如高斯函数也是曲线,但就不具有次方的关系。

        • 家园 不是说图有问题,是说处理方法比较特殊。

          特殊图是没问题的。但这样处理效果图的规律显示得更明显。但用绘图工具可能画不出来。

          • 家园 绘图工具指得是什么?

            至少MATLAB实现很轻松。其它一些软件里我也可以设定这种坐标。

            对数-对数坐标一般在函数的自变量和因变量,或者实验数据跨越多个order的情况下用(即使最后的函数关系不是指数形式)。比如我测量电阻,画电压和电流曲线,理论上应该是一条斜线。当你用线性-线性坐标的时候,小电流的情况根本看不出来。只有用对数-对数坐标,即能检查是否是斜线,又可以看到各电流水平下的电压分布。

            • 家园 确认一下,文中的图没有问题,只是画法有点特殊.解释见内。

              常规的对数坐标图,应该是用原始的数据,在对数刻度的坐标上画出点来。而轴标题应该是原始的数据。从古董级的对数([半,双)坐标纸,到现在的绘图工具(origin, sigmaplot, kplot, axum,excel,免费的gnuplot, 乃至大一点的计算工具mathcad, maple, mathematica,matlab 画对数坐标应该都是这样画的。

              如文中的那种画法,需要把数据先取对数,然后在线性坐标系中画出来,但轴标题应该标明是原始数据的对数,如文中图那样。两种画法的结果完全一样,这里更正我上面的说法,曲线的形状没有改变,拟合方程也应该一样。(试了下,拟合方程参数一样,但拟合误差不一样)。

              上述的工具也不是不能画出这样的图,但是多了一道手续:先把数据取对数,再在线性坐标中画。多了道手续,而且这种画法在文献中比较少。

              顺便浏览了下楼主给出的链接,好像这个著名的曲线应该是Richardson在1961年的一本书上给出的。这样的话那个著名的拟合公式也应该是他做出的(因为图中有拟合线)。只是不知他是怎么解释的?MANDELBROT用分形的理论给出了新的解释,就把文章发到了Science,所以Idea是极其重要的呀。看这个MANDELBROT是在IBM 的Watson中心工作,应该是个数学家?也不一定.我以前的同事,学得是化学,却在这个中心搞了几年半导体器件。

          • 家园 呵呵,这种方式便于观察两个量之间的指数关系

            比如说x的平方和y的立方成正比,这种处理方法过后就会得到一根直线,斜率是2/3,要是成反比,那么斜率就是-2/3,非常方便。你说的对数坐标有个好处是可以直接读出值来,不过可能不那么精确。

      • 家园 图没问题,坐标轴上标的是长度的对数的值,而不是长度

        你自己换算成长度它不久不均匀了吗?

    • 家园 很有创意的历史视角!花之
    • 家园 历史的合力.
    • 家园 受教了,了不起

      先生开阔了我的思维。是谁规定的一帖只能一花,想多给几个都不行。

分页树展主题 · 全看首页 上页
/ 2
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河