主题:【原创】数学与战争 -- 晨枫
军人讲究的是孔武之道,写写算算是文人的事情。在连队里,和数学最接近的大概就是司务长了,要把粮饷之事计算清楚。但数学和战争其实相距不远。
第一次世界大战前夕,多才多艺的英国人兰切斯特用数学开创了半经验的作战模拟方法,建立了经典的兰切斯特方程。兰切斯特用平方律定量地解释了特拉法尔加海战中纳尔逊各个击破的成功诀窍(人称Nelson Touch),恩格尔在1954年用线性律精确地复现了硫磺岛中美军伤亡情况。经典兰切斯特方程对士气、地形、机动、增援和撤退等没有考虑,但对战斗的一般规律仍有指导意义。
兰切斯特把战斗简化为两种基本情况:远距离交火杀伤和近距离集中火力杀伤。远距离交火时,一方损失率既和对方兵力成正比,也和己方兵力成正比。换句话说,敌人越多,自己损失越大;另一方面,自己人越多,目标越大,损失也越大。这个情况以微分方程表示即为
dy/dt=-axy
dx/dt=-bxy
其中x和y分别为红军和蓝军的战斗单位数量,a和b分别为红军和蓝军的平均单位战斗力,因此双方实力相等的条件为
ax=by
即任一方的实力和本身战斗单位的数量成线性关系,也称兰切斯特线性律。这就是说,如果蓝军平均单位战斗力(包括武器、训练等因素)是红军四倍的话,100名蓝军和400名红军的战斗力相同,100名蓝军和400名红军交战的结果是同归于尽。集中优势兵力只是拼消耗,并不占便宜。
但近距离集中火力杀伤时,一方损失率仅和对方战斗单位数量成正比,而和己方战斗单位数量无关。换句话说,敌人越多,自己损失依然越大;但短兵相接,自己方面已经无所谓目标大小的问题。于是微分方程变为:
dy/dt=-ax
dx/dt=-by
双方实力相等的条件变为
ax^2=by^2
即任一方实力和本身战斗单位数量的平方成正比,也称兰切斯特平方律。仍假定蓝军平均单位战斗力是红军的四倍,100名蓝军和400名红军近战后,当蓝军100人全军覆没时,红军仍有√(〖400〗^2-4×〖100〗^2 )=346人留下,即损失54人,实际损失比蓝军还小。这就是集中兵力打歼灭战和避免添油战术的数学依据。
考虑另一个情况:200名蓝军和400名红军近战,双方实力相等(√(〖400〗^2-4×〖200〗^2 )=0)。如果红军通过战术动作或计策使蓝军分成各为100人但互不支援的两半,则红军可以54人的代价先歼灭蓝军的第一个100人,再用剩余的力量以64人的代价歼灭蓝军的第二个100人,红军总代价为118人,总战果为200人。这就是“各个击破”原则的数学解释,也是兵败如山倒的数学解释,因为兵败的典型特征是各自为战,首尾不顾,即使不考虑战斗意志瓦解的问题,也在客观上强化了被各个击破的机会。
再考虑一个情况。仍然考虑蓝军100人,红军400人,双方战斗力差距为4:1的情况,但双方相距很远。如果红军付出一半的代价推进到近距离,按4:1的线性律,这时红军还剩200人,蓝军50人。但接下来红军就可以发挥近战优势,以27人的代价消灭蓝军的第二个50人。这就是勇猛突破、近战歼敌以克服敌人远射火力优势的数学解释。
兰切斯特平方律和线性律还可以有特殊情况,比如游击战中,游击的一方在暗处,容易主动集中兵力,近战歼敌;反游击的一方在明处,需要分兵把守,比较被动。这样游击一方服从平方律,反游击一方服从线性律,游击一方占便宜。空袭和反空袭也是类似的情况。
兰切斯特方程当然是把战场情况简单化、理想化了,后人在此基础上大大扩充,用于研究更现实的战场实际。但兰切斯特方程在本质上是确定性的,没有考虑随机的因素,比如说,规模相当的王牌军和乌合之众交战,王牌军的胜算较大,但不能排除偶然的因素,使得乌合之众获胜。这个胜算的大小就是概率和随机的范畴。
在兰切斯特之前,德国总参谋部就在世界上率先使用兵棋推演。兵棋推演不仅构造一个模仿战场的模型,还要在摆兵布阵时考虑部队机动能力、天气地形条件等因素,到最后交战的时候,丢骰子决定战斗的胜负。根据战斗力的差别,较强的一方可以多丢几次,较弱的一方少丢几次,但最后结果依然是随机的。这里面的科学道理就是概率和随机过程。老毛奇指挥下的德军依靠这一科学的指挥体系,在普法战争中像机器一样精确地作战,把曾经称霸欧洲大陆的法军打得一筹莫展。在第二次世界大战后期的阿登反击战中,德军丧失先机,遭到美军反击。莫德尔元帅命令A集团军参谋部和所有尚未投入战斗的一线部队主官在指挥部继续进行推演,当前的战况作为输入数据。后来的战事果然如作战模拟所示那样危急,第116装甲师师长瓦尔登堡将军在几分钟内就将作战模拟时的假想性命令作为实际作战命令下达,待命的第116师得以在短得不可思议的时间内有计划地投入战斗,虽然没能最终扭转战局,但还是显示了作战模拟的实战价值。
另一方面,忽视作战模拟所揭示的问题,有可能在战争中带来巨大损失。第一次世界大战坦能堡战役前,俄军总参谋部的作战模拟表明,为避免形成缺口和被各个击破,萨姆索诺夫的第二集团军必须先于莱能肯普夫的第一集团军三天行动,方能在因斯特堡形成钳击。但这一要求没有在作战计划中反映出来,也没有包括进后来的行动中。果然,德国名将鲁登道夫将军和兴登堡元帅(两人关系有点象解放战争中三野的粟裕和陈毅)及时抓住战机,先全歼萨姆索诺夫的第二集团军于坦能堡,再重创莱能肯普夫的第一集团军于马苏莱湖,扭转了德军在东普鲁士的危局,给沙俄这个已经危机重重的柴禾堆上添加了一大捧干柴,只等十月革命的最后一根火柴了。在中途岛海战前日本海军的作战模拟中,当假想的美军空袭时,南云的飞机在攻击中途岛,舰队受到惨重损失,裁判判定南云的航母受到9次命中,赤诚号和加贺号沉没。演习总指挥宇垣海军少将专断地否决裁决,将击中次数减少3次,航母沉没为1艘,于是被判沉没的1艘航母重新参加战斗,演习继续。实战结果比演习更具灾难性,4艘航母全被击沉。
描述作战过程的数学理论还有诺依曼的博奕论(也称对策论)、马尔科夫过程的微分-差分方程、杜普伊的战斗效能定量比较方法、蒙特卡洛方法等其他数学方法。计算机的出现使作战过程的数学模拟实用化,计算机化的作战模拟已经成为现代军队制订作战计划、研究战略战术、评估武器效能的有力工具。
除了作战模拟,数学还用于作战分析。在第二次世界大战前后,美英科学家用数学方法对雷达搜索、船队护航、反水雷和反潜搜索进行研究,推出一系列有效的战术,为盟军所采用,为反法西斯战争的胜利立下了功绩,成为人们所熟悉的佳话。
在今天,战争的焦点转向反恐,至少对美英来说如此。在伊拉克和阿富汗,最使盟军头疼的是防不胜防的土地雷,这种IED(Improvised Explosive Device的缩写,意为自制爆炸装置)不仅造成很大的伤亡,还给盟军官兵带来巨大的心理阴影。在所有巡逻路经上全时监视是不可能的,但时不时来一遍空中侦察是完全可以做到的,在巡逻队到达前空中侦察更是不在话下。但空中侦察如何探测地下的IED呢?空中侦察可以形成高分辨率图像,包括多光谱图像。有经验的老兵可以用目视观察,仔细对比以前同一地点的图片,发现蛛丝马迹,找到IED的迹象。但人工判别工作连太大,时间太长,数学再次出马,这就是图像识别和比较。
最简单化的图像比较就是把两张图放到一起比较。在数码光学时代,数码相机把一幅图像数字化,也就是说,一幅画面被分割成几百万甚至更多的细小方格,每一方格是一个象素,每一个象素的亮度范围用0-255的数值范围表示,0为全黑,255为全白。当然全黑到全白也可以用更大的数值范围表示,那样可以反映更细腻的细节。市面上通常的数码相机是8位通道,就是0-255的范围;更高级的数码单反有的已经采用16位通道,那就是0-65535了。单一通道只能表示亮度,图像就是黑白的,如果在单纯黑白通道上加红、蓝、绿滤色镜,就形成红、蓝、绿通道。用相邻的三个像素分别担任红、蓝、绿三个通道,分别记录亮度,然后再把三个通道的信息叠加起来,就可以还原彩色图像。这就是数码相机的基本原理。由于每一个象素的信息都是数字,计算机就可以对两幅数码图像作逐格比较。最简单的做法就是把图像A和图像B相减,相同部分数值相等,结果为零;不同部分数值有差值,结果数值取绝对值消除负数的问题,就可以在图像上还原出“问题区域”。进一步判别就可以有的放矢,容易找出IED;或者省点事,指令巡逻队直接绕过去了事。
当然,实际上图像比较没有那么简单,前后两幅图像不大可能在绝对相同的角度、光线、距离下拍摄,简单比较容易造成太多的误判。这就牵涉到图像识别。图像识别通过对数字化的图像的分析,像筛子淘沙一样,用分类算法把数据分类,抓出特征性的数据。在图像识别的基础上,前后图像只比较特征性的数据,这样就可以避免为琐碎因素所误导。除了对可见光图像比较,还可以用多光谱图像捕捉红外、紫外特征,区分土壤温度、植被变化,进一步增加探测的几率和精度。
由于巡逻路经很长,空中侦察下载的图像信息量巨大,图像处理本身需要很强的计算能力,再厉害的普通个人电脑也跟不上这样的数据处理要求。另一方面,图像数据处理需要的是大量的向量处理能力,也就是说,运算量是天文数字,但运算本身并不复杂,所以基于电脑图像卡技术的GPU反而比通用的CPU更加适合。美国陆军已经向阿富汗运送了大批具有特别加强数据处理能力的微型超级计算机,这些是具有向量处理插件的顶级普通个人电脑,专门用于图像数据处理,为巡逻队保驾护航。这样的技术在常规战争中也可以应用,用于判断战场态势、敌军动向等。
图像识别是模式识别的一个分支,另一个分支是语音识别,这在战场上也很有用。每一支巡逻队、野战分队作战回来,都有大量有用信息上报。但要疲惫的官兵再写详尽的书面报告不现实,口头报告加语音识别,可以迅速把前线信息数字化,以备后用。语音识别也用到大量的数学。
在反恐战争中,数学的应用还不止于此。反恐作战的难点不在于实际战斗,正规军的火力不是恐怖分子能比的,但要发现恐怖分子的活动规律,有目的、有准备地打,而不是被动应付,这才是难点。在常规战争中也有类似的问题,找到敌军的规律,对症下药,敌变我变,这比制定一厢情愿的战略战术要有效得多。发现对手活动规律分为两步:
1、定性确定因果关系
2、对因果关系定量化
在朝鲜战争中,刚愎自用的麦克阿瑟在仁川登陆得手后,轻敌冒进,被志愿军打了个鼻青脸肿。李奇微审时度势,准确地找到了志愿军“星期攻势”的规律,并制定反制战术,最终导致志愿军在第五次战役中的失利。志愿军“星期攻势”的规律看似不难找到,主要变量就是一个时间,李奇微找到了,麦克阿瑟没有,这不能完全怪罪于麦克阿瑟的无能。事后诸葛亮是容易做的,但在事前要找出因果关系并不容易,这里面的关键就是在浩如烟海的数据中,找到因与果之间的配对。在科研和工业实践里,这样的问题也很多,人们开发了很多数学方法,有些很直观,有些就需要一点写写算算。
最简单的做法是把结果和可能的原因的数据绘制成曲线,放在同一个框架下比较。如果是时间、温度、降雨量,或者敌人攻势的时机、长度、人数,这些本来就是数值化的数据,绘制曲线比较相对容易。如果是描述事件的离散数据,可以首先量化,比如敌军出现地点作为一个变量,张庄算作1,李庄算作2,王庄算作3;指挥官作为一个变量,胡传魁指挥算作1,刁德一指挥算作2;装备水平算作一个变量,只有步枪手榴弹算作1,带机枪算作2,带火炮算作3;诸如此类。量化之后,就可以和数值化的数据一样处理。
如果这些曲线同进共退,那他们之间就是有关联的。但这是简单的关联,复杂的关联光这样比较还不一定能够抓出来,表面上的步调不一致不一定就是没有关联,关联或许比较弱,或许需要通过几个变量的合成作用才能体现出来。这个问题在变量数量很大的时候尤其突出。由于事先无法确定到底哪些变量和结果有关联,在数据分析的时候容易“宁可错杀三千,不可放过一个”。但一般目视比较七、八条曲线还可以,几十、几百条曲线就不大容易了,需要有别的办法。
数理统计上有主元分析方法(principal component analysis,简称PCA),根据数据之间的相关程度把很多相关的变量归拢到少数“主元”,这样就容易研究问题了。比如说,要预报上海的天气,可以选取人民广场、徐家汇、曹家渡、五角场、陆家嘴、奉贤、松江、嘉定、崇明甚至启动、昆山、海盐、枫泾等地的温度、湿度、风向、风速、日照、云速等等数据。这些数据互相邻近,有所重叠是难免的,要是把这些数据统统拿进来一锅煮分析,容易把水搅浑。要是用平均温度、平均湿度等,问题就明晰化了。更有效的做法是根据远近给予不同测量点的数据不同的“发言权”,数学上叫加权,那就更加科学。这就是主元分析的简单化的描述。在主元之间再绘制曲线比较,就比较容易了。
这样基于计算的方法还是有不够直观的问题,但常用的直角坐标图形有坐标维数的问题,二维是平面,三维是立体,四维已经没法画出来,几十、上百维就更没辙了。然而采用平行坐标的话,这个问题迎刃而解。平行坐标把代表每一个变量的坐标轴并排排开,在直角坐标里的一个各轴投影汇聚的点,在平行坐标里就是连接各轴的一条折线。从这个意义上来说,两者是完全等价的,差别在于高维数的平行坐标可以画出来,可以看得到,而高维数的直角坐标就无法图示了。但直角坐标下的时间序列数据可以画图直接比较,平行坐标下的时间序列数据粗看就是一大坨,很难看出内在关联。然而,如果对关键数据进行分类和排序(sort),就可以看出端倪。如果把敌军出现地点、指挥官、装备、时间、天气、季节、赶集等数据标绘出来,或许可以看到,敌军在王庄出现时,指挥官总是胡传魁;装备不一定,什么都可能;时间总在晚上;天气不一定;季节不一定;总在赶集的时候;那可以推测一个规律,敌军对王庄的兴趣在于赶集后的休息人群,乘人不备抢劫,而且胡传魁亲自出马,很重视。发现了这样的规律,就可以有的放矢地制定种种反制战术,可以打埋伏,可以掏老窝,可以预先疏散群众,可干的事情就多了。
数据分析的时候还要考虑动态影响。从蒸锅里把烫碗拿出来,如果动作快,就不会烫手;但要是捧着烫碗几分钟,肯定就把手给烫熟了。这就是动态响应的概念,感觉到的温度不仅和碗的温度有关,还和接触时间有关。在战场上,部队出动到打响有一定的时间,行军要调头也需要一定的时间,这就是动态影响。更复杂的动态响应还可以有暂时的反向响应。煮饺子的时候,水开了,沸腾的水会迅速涨上来,这时候浇一瓢冷水下去,就会把水位压下去,但接着猛灌水,水位最终是会涨上来的。对丧心病狂之敌的火力压制可能有类似的反应,敌军先是更加嚣张,但最终还是要被压下去的。如果对这样的暂时反向响应没有准备,数据分析就会出偏差。
确定因果关系后,可以用各种曲线拟合方法建立定量的数学模型,但战场上确立定性的因果关系经常已经足够。数据挖掘(data mining)是数据分析的进一步,也就是在大量的数据里发掘有用的信息,就像在矿山里挖金一样。战场上人的因素使得数据挖掘高度复杂化,有经验的指挥官会避免被敌人找到规律,但人都是有思维和行为惯性的,即使是掩盖自己踪迹的做法,也是有一定规律可循的。只要有足够的时间,积累足够多的数据,就有可能找到规律。情报机构用数据分析和数据挖掘寻找人和事件的关联并得出有用结论已经有很长历史了,CIA在30年前就把情报库数据化了,五角大楼在20年前也开始了类似的工作,但应用到野战部队,这还是第二次海湾战争之后的事情。萨达姆被俘,基地组织二号人物扎卡维被击毙,上百名基地组织大小头目被俘或被击毙,这些都是根据数据挖掘发现的线索。在更低的战术层面上,美军通过对已知IED的分析,建立了一套预测IED时间、地点、强度的方法,用于指导巡逻队设伏或者绕过威胁,取得相当的成功。美军声称数据挖掘已经帮助击毙3000多正在埋设IED的恐怖分子,抓获几百个,并破除或避免了几千个IED。在前线缴获的敌军笔记本电脑或者文件直接输入数据挖掘系统,很快产生顺藤摸瓜的新线索,使成功的雪球继续滚动。
数学在战争中的应用还不止这些。数学对战争有用,这不等于军人都应该成为数学家。但了解其中的道理,破除神秘感,发掘新应用,这还是很重要的。或许在不久的将来,分队指挥官的军用手提电脑将不仅用作一般意义上的通信指挥终端和电子文件系统,还是情报分析和决策的工具。
本帖一共被 1 帖 引用 (帖内工具实现)
对策论跟模式识别写到一起去了。
通常说沙盘演习的话,人们会直观的认为这个演习是在立体沙盘上进行的。事实上这类模拟更多的是在地图上进行。因为沙盘尽管直观,却不利于定量的度量部队行进距离,也不利于进行大范围的模拟。
德国人用的模拟方法西方通常称为war game,中文一般翻译为兵棋推演。这是一种由德国人在游戏基础上发明的有效的战争模拟手段。二战结束以前的兵棋推演大多是在特制的地图上进行,地图上画出六角形的格子,双方的部队部署在格子里面,部队人员,编制,都用不同的棋子表示,部队的行进和退却则表示为朝特定方向移动一定数量的格子。双方攻防中的士气和运气等随机因素则用掷骰子或者使用特定的随机数表格来确定。到二战结束为止,在西方这种兵棋推演已经发展的非常完善,规则往往可以写成一本书,每次推演通常还要有专门的裁判判定胜负,甚至交战双方和裁判要分别在不同的屋子里使用各自的地图,从而体现战场上双方信息的不对称。
兵棋推演最大限度的将战场上的情形定量的复现在地图上,因而成为西方参谋机构和军事院校普通采用的模拟方法。二战结束以后西方军界的兵棋推演多改用电脑进行,专业的作战模拟软件可以将各种战场上的情形复制的更为逼真,也避免了查阅整本规则这样的枯燥工作。另一方面,纸质棋盘的兵棋推演,则变成了一种战争游戏而在民间广为流行。迄今为止,欧美等国出版的纸质兵棋游戏已有千种之多,内容涵盖从原始社会到当代战争,从班排作战到世界大战的各种级别,层次和军兵种的作战。其中不乏经典之作。
由于种种原因,截止到八十年代之前,兵棋推演一直未在中国军队中流行。八十年代之后,兵棋推演和战争模拟开始为中国军队和民间所知。现在的北京已经有很多兵棋游戏发烧友,甚至出现了专门的组织和论坛,台湾出版的兵棋杂志也开始在北京销售。这是其中一个论坛的地址。外链出处
在实用上,不管它是什么论,能用上的都可以放到一块,哈哈。
德国风格的兵棋推演还有严格式和自由式之分,这是西方参谋业务的基本功。
用超级计算机去对付IED,唉,说那些美国佬什么好呢?
这也就是欺负游击队没有反坦克导弹。
当然,无论用什么武器,背后一定存在某些统计规律,数学永远是有用的,但只对战术有帮助,战役都不一定管用,更不要说战略。
这个要处理天量的数据了
谢谢:作者意外获得【通宝】一枚
鲜花已成功送出,消耗 铢钱 1 个,可能得宝。可通过工具取消
提示:此次送花为【有效送花赞扬,加乐善、声望、帖得花总数】。
这样的幸福感,不花不行啊。
萨达姆被俘,基地组织二号人物扎卡维被击毙,上百名基地组织大小头目被俘或被击毙,这些都是根据数据挖掘发现的线索
不是说是有内鬼吗?数据发掘能到这种程度我是不大信的……
技术上先进,战斗中有效,战术上胜利,然后照样要灰溜溜地撤退。
图形软件这一段让人想起胡志明小道的传感器大阵列。
是不是这种技术上的优势形成了战略上掌控一切的幻觉呢?
除了二战时期在欧洲,美国似乎总有办法很快地把自己弄得孤立不得人心,真有意思。
用统计模型分析网络信息,以提前预测穆斯林分子暴动的时间
这个穆斯林暴动是在国内还是国外?我看中国也可以用用这样的技术。
战斗的胜利的累积不等于战争的胜利,这已经被一次又一次的战争所证实。你可以发动一场战争,但只有敌人才能结束这场战争。只有敌人承认失败才是战争的胜利,如果敌人始终拒绝承认失败,那战争就不可能胜利。约翰·伯伊德在20年前就指出了这一点,但美国人似乎到现在还不大体会到这一点。