五千年(敝帚自珍)

主题:【原创】数学与战争 -- 晨枫

共:💬192 🌺1004 🌵1
全看树展主题 · 分页首页 上页
/ 13
下页 末页
家园 我见过用十几个样本做数据挖掘的

几个当然是少了点,但十几个已经不少了。我们在Curvaceous受训的时候,很多工业实例就是只有十几个样本,大多是实验室结果。

家园 正是这么回事

和我前面的统计方法vs概率事件的比较是一个意思。

家园 这就要靠耐得住性子了

吃的到底是螃蟹,还是毒蛰,吃之前是不容易知道的,是要有胆识和远见的。

家园 【讨论】继续讨论

目前普通军校里面都有军事运筹课程,里面印象最深的除了“烧水沏茶”就是兰彻斯特方程。如晨兄所言,兰彻斯特方的确是开数学模拟战斗之先河,但较之牛顿定律与物理学的关系,我觉得重要性就要差些了。持这种看法或许跟我个人成见有关,传统上我们就是重谋略、轻量化,崇尚的是万马军中取上将首级的骁勇,更是奇袭、疑兵、佯动、断粮、以弱胜强、以少胜多的智谋,不过“十则围之,五则攻之,倍则战之”应该也算是数学应用^_^

目前数学模拟还不完善,使用上只是简单的战术计算,比如兵力兵器对比、机动、装载、换乘时间等等,辅助决策尚可一用,战场态势千变万化,变量层出不穷,如果想开发出成熟的系统,没有巨大的投入和长期战争实践是不可能的~

PS:名词解释——基帝即史老七

史老基本纪

史老基,帝都人也。史姓大族,行七,人皆谓史老七。初,起行伍。尝从李将军克农部下,号内卫。其事密,世人所不知。已后,以清白子入基宋。坊间云,见幸于女帝,致皇天震怒,始兴大狱。语在露露本纪中。

基宋有望气者于帝都相见史老七,阴相其面大惊而奔。后私与于人:“史老七者,气王霸,达天听。此非人臣应有之分尔。”众人皆以为笑。谈然观其交游,皆政事堂左右仆射,点女之辈,素知其非常人。后老七掌秋官,杀伐果断。有御史台劾以酷吏峻刑,复有白衣响登闻鼓,基宋大哗。朋党攻扦于朝堂,胥黎争之于酒肆。老七进表自辩,字字珠玑,隐隐有鞠躬尽瘁,黄鹂泣血之志。后开封府检侦蔡皓无菲巫蛊事,帝震怒。众皆知史老七为宵小所害。朋党渐平,遂大索天下,弃市者凡几。

基宋浪涌,民主风潮日盛,帝渐不视事。时有辽国浪皇帝半仙者践祚朝廷,欲遣使为祝。然浪皇帝贵气逼人,朝廷恐为其所轻,史老七自请曰:“浪皇帝,吾正欲其知基宋之威也。”乃遣史老七为贺,与辽国浪皇帝会于魔都。两人相谈语甚欢,一夜无话,皆引为同志,乃相倾慕。传为基宋佳话。

史老七还朝,政事堂叙功。史老七志得意满,刑部杀伐愈甚。复有白衣不堪,以暴虐为名请与政事堂。国史云:白水潭叩阙。时有白水潭七子,语在白水潭列传。政事堂秉公义,仿古例,命天下行瓦片放逐之例。当是时,天下一成憎之,九成以为内堪其事,故所知基宋民心所向也。基宋好事者做话本《露点女三戏史老七》。政事堂以其事不经,禁之。

后有万国足球大会演于南非比利亚。记有三十二国诸侯兵锋齐聚。基宋好兵者众乃集观之。国运遂至万国足球大会所牵。

史老七素以知兵事能。时有意大利法兰西诸强,上番万国会猎拔其头次二筹。老七为其谋三番,试合两国皆败走,溃不成军尔。众惊恐,始知老七之能。后诸国复以堂堂之阵,两两对圆。史老七几为奇谋,观兵英吉利。英吉利溃败。方英吉利粉丝甚众,皆惊恐,欲尊史老七。后老七复罢巴西兵事,巴西者素以强闻,尚不敌老七。蠢蠢有尊史老七为帝,记数人,奔走皆以拥立之功非凡尔。史老七乃为阿根廷谋。有儿歌云:“阿根廷败,老七王。阿根廷败,老七王。”

民心如此。史老七素持沉重,虽得于知兵之能不以骄矜。时有谋主云:“今德意志将战阿根廷,天赐也。老七为之何?”老七沉思片刻,批密笺曰:“若天命所归,吾自不负众人。”德意志阿根廷试合未及,德意志已拔头筹。众山呼迎立,史老七作色曰:“此非时,吾不当涉天命。”下半场阿根廷复中枪,众人拜服,持九锡侍卫老七。老七尚扭捏:“汝等欲陷吾于不义呼?”不顷刻,使者传报阿根廷又中弹,溃败已。众人躁动:“此天命尔!违天命不详。请帝速践其位,指引万民救百姓于水火。”史老七仰天长叹曰:“吾故坚辞三次,然情势逼人。吾不当作小儿女态。此天意民意乎?”始登基。前方贺捷,德意志又戕于阿根廷述及四也

初登基,民间反侧宵小云:“故为其运,非为其能也。”老七震怒,灭德意志以降。基宋惶恐。愚妇以其有神格,飨以全聚德帝都烤肉。老七微颔首不做色。复荷兰会猎西班牙,老七回顾诸拥立之臣:“汝等欲上尊号乎?”众股战不敢言。老七以帝王心事信手指曰:“吾当为荷兰谋,汝等自便其利。”

耶元二零一零年雾月初十,事现西班牙绝杀荷兰。基宋上下莫不拜服史老七之能,乃上尊号“史老基”。故为基宋万事业已。

女史公云:前有章鱼哥保罗,后有基宋史老基。子虽不语怪力乱神,莫不知其英明神武。实乃天授以王霸之气,起尊号为万世祖。此不世之业已,后来人可知否?史老基,基宋中的战斗基!

基宗衰皇帝者,浪皇帝中子也。初,帝为布衣时闻南玄洲万国蹴鞠盛会,帝曰:吾观泰西伊达利必冠。伊达利遂三战皆罢,遁走。帝不喜,乃谓群臣曰:孤以为,南米州巴西国必不负朕望。不日巴国遂败。群臣窃窃私议,谓二国之败皆因帝之衰气所眷顾也。帝不悦,乃曰:南米州阿根亭国四张二两个王,必胜。复三日,阿国遂败。群臣皆谓帝衰已极,可为帝也,劝进者众。帝沉默数日,曰:今吾观德师必胜,如其不胜,吾为衰帝。不日德师果败,天下咸服,帝登大宝。数日后,伊比利亚与立德兰国会师决赛,帝曰:朕初登大宝,薄德藐躬,上干天咎。今朕言兰国胜,百姓可因之下注,富我新宋国民也。翌日帝聚衰气于兰国而败之。广南东路有寒飞雨者,问帝之言,下注伊比利亚,获利20万贯。帝声望大隆,群臣上尊号曰史老基,晋神格。基宗在位30日,菊裂而崩,天下号恫,曰:从今世事难料矣。

太史令小笼包奏曰:早孤短折曰衰;德之不建曰衰;遭难已甚曰衰;处死非义曰衰;言皆不中曰衰。大行皇帝,预言蹴鞠,有若神格,在位30日,早孤短折,德行甫建,已遭大难。宜谥曰:继天凝道诚明仁敬崇文肃武宏德圣孝衰皇帝。庙号基宗。

家园 十几个样本做数据挖掘

这个有些超出我的知识范围了,有空还请多指教。不过工业上需要的样本数可能本来就比社会领域上需要的就少,毕竟人的总体运动规律是按照概率进行推测的。

家园 呵呵,这个我也不是很熟悉

从网络搜到一些介绍,谨供参考:

1.九号公路战役

http://baike.baidu.com/view/145438.htm

2. 败逃的南越兵把当地居民活活开膛破肚,掏吃人心人肝。

http://www.tianya.cn/publicforum/Content/no05/1/9791.shtml

家园 关于中途岛

中途岛之战,就简单的实力对比而言,日军傻子当司令都能打赢,美军天才当司令都得输。可日军的一系列错误背运加上美军的狗屎运,才造成最后的结局:

日军的根本错误:分兵。否则8航母+8战列对3航母+1机场,连推演都不用。

日军的奇怪阵型:航母在前,战列在后。如果是战列在前炮轰中途岛,航母在后提供保护并准备攻击美军航母,根本不会搞到天上没有飞机护航的困境。

家园 倒地狂笑........
家园 日军中途岛输在航母使用上

日军以战列舰为主、航母为辅,企图以航母分舰队诱敌,再以战列舰围歼之,说白了还是大舰巨炮主义,依赖战列舰进行海上决战,真不明白经过珍珠港的闪光之后,日军为何突然如此使用航母与战列舰,只能说是倒霉催的

家园 【讨论】关于PCA相关解释和数据挖掘

晨老大说的我的理解是回归分析(regression)。

回归分析简单地说就是求出一个因变量Y和自变量X的关系。

比如我们推测X和Y具有线性关系,即Y = X * B + E。如果我们建立一个回归模型,Y(hat)= X * b1 + b0, 那么我们希望地是模型和实际关系式应该存在差值最小,也就是 Y - Y (hat)=0,根据最小二乘法(Least Squares regression)的原则,我们可以推测出b1和b0。这样,如果我们拥有了X时,可以依照回归模型推测出Y的大小。

下边就是多变量的问题。假若战争分析可以用上述的模型进行回归分析。那么X我们可做成一个n*p的矩阵。n代表样本数,也就是你做了多少次实验,p代表多少个变量,这变量可以看作是影响战争的因素。

这样,上面公式就可以写成如下: Y(hat)=x1*b1+x2*b2+...+xn*bn+b0,可见,我们现在用了n个因素来建立回归模型。这就到了多元回归问题。当变量增加了就会增加模型建立的难度。所以我们希望变量能减少。于是,出现了变量选择方法。PCA就是其中一种方法。

PCA准确中文翻译应该是主成分分析。这是一种多元变量分析方法(Multivariate Calibration or Multivariate Analysis)。主要思想是利用正交分解和方差分析,实现“主成分”(Principal Component)代替原始多变量以达到以最少变量建立回归模型的目的,判据就是权重(vector weight)。主成分分析我个人觉得还是主要用于线性回归分析。而使用这种多变量分析方法去分析物质组成、组分、或者聚类(Cluster Analysis)是比较好的快速分析方法。缺点是主成分分析会受到多重相关性的影响,所以人们后来发展出PLS(Partial Least Squares regression),偏最小二乘法,简单定性地说就是主成分分析+典型相关分析+最小二乘法。这种方法是在过去权重分析中从只导入自变量到加入因变量。

还是那句话,对于战争分析,确如诸位所言,和天气预测有点相似,我个人觉得非线性分析更适合。

关于数据挖掘(Data Mining),这不是一个新东西,它主要思想是对数据行概率统计的分析,以得到未来可能的结果趋势。这项工作的最早成就我记得应该是二战中,英国在大西洋反潜战的指挥就应用数据挖掘的成果。

家园 数据挖掘有一定价值,但其滞后性、高成本、低可靠性等缺陷

还是很显著滴。

滞后性:数据挖掘首先要有数据,而且要足够的数据,而数据的积累是需要时间滴。战场瞬息万变,胜利往往取决于及时的反应和决策,指挥员的临机判断还是很重要的。等积累数据,进行分析(用哪种手段,如何分析。。。),黄花菜都凉了。。。,若说有一定的指导作用,主要还是在事后,或者是教长期的对峙态势。

高成本:数据的采集、分析、评估需要很多人力物力投入。费效比是一个问题。

低可靠性:同样的数据,怎么分析,如何分析,其实也有很多的主观倾向或者说潜在(不为当事者认知)的倾向夹杂其中,最简单的就是“未尽因素”。 分析人员的知识、经验所限(特别是无一线战争经验),很容易在分析中忽视一些因素,特别是新的因素,从而导致分析结果的偏差。

同世界上所有东西一样,有简单手段的时候,就尽量不要用复杂手段。

说实话,俺长期在IT一线,数据挖掘确有一些价值,但不可夸大。现实中,所谓数据挖掘,更多时候是多收钱多送钱的幌子罢了。挖掘出来的一点东东,不如直接找一线人员座谈一下就更清楚了。数据挖掘做的好,确能揭示一些不那么直观的规律。但也很容易犯脱离实际、脱离基础的毛病。

萨达姆被俘,基地组织二号人物扎卡维被击毙,上百名基地组织大小头目被俘或被击毙,这些都是根据数据挖掘发现的线索。在更低的战术层面上,美军通过对已知 IED的分析,建立了一套预测IED时间、地点、强度的方法,用于指导巡逻队设伏或者绕过威胁,取得相当的成功。美军声称数据挖掘已经帮助击毙3000多正在埋设IED的恐怖分子,抓获几百个,并破除或避免了几千个IED。在前线缴获的敌军笔记本电脑或者文件直接输入数据挖掘系统,很快产生顺藤摸瓜的新线索,使成功的雪球继续滚动

最后,所谓“建立了一套预测IED时间、地点、强度的方法,用于指导巡逻队设伏或者绕过威胁”,俺想对于危险的地点,一线基础指挥员,比如班长,只要在一线干过一段时间,对于危险地点和危险时间,恐怕是相当清楚滴。而且这个一段时间,恐怕要比数据挖掘的数据积累时间要更短些。完全无需某些坐在大后方的某个分析员告诉他哪是危险的。(当然,通过对比不同时段相同地点的图片,分析地形地物变化来判断IED还是有价值的)

上面的说辞,俺看更像是掩护潜伏的说辞罢了。

当然,区别还是有滴。区别在于:数据挖掘的钱进了分包商和拔毛者的腰包。数据挖掘的结果如果说是正确的话,并能够被脱离基层的上层接受的话,那还是有价值滴。毕竟,对于脱离基层的上层,是不屑一个基层指挥员的说辞滴。。。。而比较容易采信通过看起来令人生畏的公式计算出来的结果。。。。当然,最好是一线人员及时发现规律及线索,及时讨论总结,并可进行实验性动作来进行检验,若认可后推广。并在时间、经费允许的情况下,由后方在大量数据的基础上,进一步深入研究和提高,并尽可能及时的反馈一线检验。

人哪。。。 TG还是T一点的好。

家园 请教下

这个史老七, 和本河的史老7, 不知有何关系?

家园 这是理科男傲视群雄的原因吗?

认为数学真的可以主导世界?

俺是猥琐无能的文科男,俺就是不同意数学能力大大滴这一观点(同时也嘲笑那些号称用统计方法治理国家的家伙)。

俺脚着吧,伟大领袖说的对:决定战争胜负的是人。数学能算出人的行动么?

如果能算出来,为什么美国人总打败仗?

如果不能算出来,哦,那是不是数学家在骗吃骗喝呢?

另,俺脚着抓萨达姆这事儿,N千万美金比什么数据挖掘管用的多。

击毙3000+埋设IED的恐怖分子?皇军战果大大滴有。那为毛美军还I ED了?为毛伊拉克人不愿意沐浴在自由民主的光辉下呢?

家园 不要以为只有文科男会摇羽毛扇

你会摇,我们理科男也会,智商肯定不会差。只是理科男摇羽毛扇的时候旁边还有台计算机,哈哈哈

家园 恩,果然是文科思维

鉴定完毕

全看树展主题 · 分页首页 上页
/ 13
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河