五千年(敝帚自珍)

主题:那些著名的围棋妙手,AI的评价 -- hwd99

共:💬13 🌺45
全看分页树展 · 主题 跟帖
家园 “名人”还是“业5”?从“围棋AI分析”看中国清代围棋水平( -- 补充帖

“名人”还是“业5”?从“围棋AI分析”看中国清代围棋水平(一)

文章来自:https://zhuanlan.zhihu.com/p/400466120

作者 崔灿是五段围棋职业棋手 专注于围棋AI研究与教学

本部分是介绍现代国内外对清代围棋水平的看法,典型的如当代棋圣聂卫平曾在一次湖南卫视的访谈节目里大赞黄龙士的棋才,但认为他“下不过那个道策”。黄比道策小6岁,是同时代中国棋圣,道策是日本第一位棋圣。但AI评判的结果,道策恐怕比黄差很多了。

本文为第九届(2021)中国杭州国际棋文化峰会课题成果,首发于“杭州智力运动”微信公众号。由于公众号发文时未作格式调整,导致了个别图片不清晰,表格文字缺失等问题。经重新排版,在知乎放出全文。

导言

中国古代围棋历经千年发展,在清代中期达到了巅峰水平,这一史实如今并无太多争议。然而清代围棋国手们的棋力究竟如何,与当代棋手相比又孰高孰低?历朝历代的围棋高手对于这一问题,可谓是众说纷纭,褒贬不一。

在国内各大围棋论坛上,“古今之争”向来是棋迷们激烈争辩的话题。“崇古派”大多被中国古谱中呈现出的激烈战斗所折服,认为围棋的本质就是计算,清代国手强大的中盘力量更胜今朝;“贬古派”则对古谱中“奇怪”的布局定式,以及大局观嗤之以鼻,时代背景的不同,也是“古不如今”的惯用论据。两方讨论的基础并不统一,观点难以调和,古今围棋规则方面的差异,客观上也让中国古谱内容评价的难度增加。因此,中国古代围棋的水平——主要以黄龙士,范西屏和施襄夏为代表的清代围棋水平争论,持续多年也没有什么结果。

2016年,人工智能AlphaGo横空出世,击败了人类围棋顶尖高手,围棋也从此进入了AI时代。四年之后,能够自由调整贴目的开源围棋AI“KataGo”,支持了包括“还棋头”在内的所有围棋规则,这让古今围棋高手“关公战秦琼”成为可能。如今,网络上已经出现了一些利用围棋AI分析数据,评价不同时代棋手水平高低的尝试。然而这些研究大多缺乏规范性,甚至违背基本的统计学原理,如果使用的方法在逻辑上漏洞百出,结论的可靠性自然无从谈起。围棋AI分析能否公正的鉴定棋手水平?棋谱数据与分析指标的选择,如何做到不偏不倚,令人信服,并经得起统计学的检验?这些都是将围棋AI作为棋力评价工具之前,必须要回答的问题。

作为传统文化的组成部分,中国古棋的内容一定程度上体现了前人的思想与价值观,具有深刻挖掘与整理的必要。中国古代的围棋规则未能延续至今天,缘于晚清时期中日围棋水平的巨大差距。中国古棋的思想内涵不被今日棋界所重视,“全面落后于日本”的刻板印象是其一大原因。围棋AI为人们提供了考察中国古棋的全新视角,中国古代围棋国手的技艺,能否因此而得到正名呢?

一、“清代围棋水平”职业棋手观点综述

清代围棋国手的技艺,在当世就有极高的评价。清代知名小说家,《镜花缘》的作者李汝珍曾颂赞黄龙士“异想天开,别创生面,极尽心思之巧,遂开一代之盛”。清末围棋棋谱编撰家邓元鏸,称范西屏“奇妙高远,如神龙变化,莫测首尾”、“崇山峻岭,抱负高奇”,施襄夏“大海巨浸,含蓄深远”、“邃密精严,如老骥驰骋,不失步骤”等等。

不过,这类评价多为极尽赞誉之词,严重缺乏区分度。另外,对棋手的评语基本出自文人之手,受到棋力方面的限制。根据记载,李汝珍与清代中期国手的差距至少有二至三子;邓元鏸据说是张乐山让二子的水平,而张乐山在清末高部道平访华期间,受其二子互有胜负。考虑到低手难以对高手棋力做出准确的评估,对于清代围棋国手真实水平的推断,文人留下的只言片语并没有太大的意义。

晚清著名国手周小松,被人问及其与本朝同行的高下时,答曰:“如遇施、范不能敌,余皆抗行耳”。这也是如今唯一能够看到的清代“国手”级棋士,关于彼此之间棋力水平相对清晰的评价。作为清代最后一位公认的国手,周小松的观点具有一定参考价值,但某一时期内部的棋手水平排序,与一个时代整体围棋水平的高低并无关联。俗话说“当局者迷”,下面主要考察一些不同时代的“专家级旁观者”,对以清代国手为代表的中国古棋水平的观点。

江户安永年间(1772-1781),一部清代棋书传到了日本。本因坊察元、井上因硕(八世)以及当时的其他一些棋手,对书中棋谱进行了讨论,认为对局者大致有“三四段水平”。这是最早的来自外部的棋手,对清代棋手水平的评价。

按照当时的日本段位制度,四段与最高水平“名人”的交手棋份为“二三”,即两盘棋中一盘受二子,一盘受三子。这基本代表了当时日本棋界对于中国清代围棋水平的看法。被誉为“日本古代围棋三棋圣”之一的本因坊丈和,对于清代棋谱表现出的水平,也持类似的观点。

上面这段记载,出自1849年刊行的《烂柯堂棋话》,著者为江户棋手中学识广博的“准名人”林元美,他也认为清代棋手水平与日本的“名人”有很大差距。书中并未提及当时传至江户的清代书籍名称,以及被评价的究竟是哪几位清代棋手。不过作者在同一处提到,他已经从中挑选了一些觉得比较有意思的棋谱,收至其个人著作《棋经精妙》当中。经查,该书第四卷收录的清代著名国手棋谱,包括黄龙士、徐星友,以及清代中期“梁程范施”四大家。范西屏与施襄夏“当湖十局”中的两局也赫然在内。可见上述几位日本江户时代的棋手,并非是未见高人名谱,才给予清代围棋水平“三四段”这样的低评价。

一百多年后,日本又一位“学者型”棋手安永一,对中国古棋的历史沿革进行了全面考察。书中用“技术显著地发展”,“令人惊叹的准确计算”等字眼称赞了清代的棋手,并认为清代棋手中盘阶段展现出的水平,与当时(1977年)中国的顶尖棋手陈祖德、王汝南等人相差无几。但对清代棋手的布局,安永一给出的评语是“价值不明的定型”,“实在不敢恭维”。书中还将“一直未能摆脱过去的形态”的清代围棋布局,上升至世界观,民族性格等方面,并将近代中国围棋落后的原因归结于此。这种将清代围棋的布局与中盘水平“一分为二”的评判方法,成了此后对中国古棋评价的一个“范式”。即便是在力挺中国古棋的职业棋手那里,也普遍承认清代围棋布局水准不高,理论匮乏。与“贬古”棋手们的分歧只剩下清代国手的中盘到底是“职业水平”,还是“乱砍乱杀”。

新中国成立以来,由于资料的匮乏,国内老一辈棋手大多对中国古谱有所涉猎。其中最具权威的中国古谱研究者非陈祖德莫属。在其生前所著各类古谱书籍中,他认为清代国手在棋谱中展现出了极高的素质,许多棋局关键之处的构思与着法,值得我们欣赏与学习。但对清代国手的棋力相当于今天什么水平这一问题,并未明确做出回答。

至于清代围棋“乏味”的布局,以及棋谱中一些明显的瑕疵,陈老认为时代与规则不同,那时中国围棋的竞技性尚不完备。今人应当有容乃大,不宜戴着有色眼镜,对古代棋手责备求全。他曾在书中这样写道:

……进一步讲,如果我们固步自封,自高自大,失去了进步的动力,也许几百年后,那时的人们回头来看今天的棋,也如今人看清代的古棋一般,认为我们的下法不够先进,不够谨严,甚至不明棋理,如果不幸出现这种情况,那可就糟糕之至了。

这段话从侧面说明了当今国内棋界对中国古棋的主流观点。从“不够先进”以及前面的“有容乃大”可以看出,陈老并没有否认之前由安永一奠定下来的,对中国古棋布局的负面评价。

与陈祖德同时代的另外两位古谱研究大家——程晓流和赵之云,对中国古棋的看法更为“悲观”。程晓流认为,梁程范施“四大家”时期,中国的棋艺发展到一个顶峰,但与当时(十八世纪)日本棋理研究的进步相比,还是有相当大的差距。赵之云在被问及“古今之争”的问题时说的更直接:“与现代棋手相比,(中国)古代棋手处于较低的水平”。理由包括时代进步的因素,以及相比古谱旁边的评语,当代棋评的内容更加丰富与深刻。他甚至还推测,明代以后,日本的围棋水平已不在中国之下。

由于程、赵二人在棋手群体中有着相当高的文化素养,上述观点颇具影响力,时常被“贬古派”棋友拿来作为论据。其他几位新中国第一代知名棋手,对中国古棋水平大致抱有类似的看法。罗建文曾在探讨“棋风”话题时谈道:

……明治时期,本因坊丈和所下的杀棋,我看与中国的古棋没有什么两样。后来日本慢慢变了棋风,从秀荣以后趋向平稳了,因为棋发展到了这个时候,“手割”等现代的东西渐渐出来了,说明人们对棋艺的思维已提到一定的高度。当日本人将座子撤消之后,布局类型多了,也才开始有研究理论的条件。

上面的描述与史实有一定出入,“手割”与日本围棋步入平稳风格的历史时间,都早于丈和所处的年代。不过罗老显然认为,中国古棋布局受“座子”的限制,缺乏理论研究的基础。在这一点上,王汝南也有过相似的表述:

中国的棋风呢,由于历史的背景,古代棋一摆开座子,不讲布局就开始上,历史上这么过来的。……

关于“古今之争”,王汝南认为从竞技层面上说,当代的围棋水平是有史以来最高的。无论是布局还是中盘的计算力,现在的棋手钻研得更深,棋力肯定超过前人。原因主要是“现代棋手把竞技围棋作为自己的事业”和“当代的资讯发达是古人无法比拟的”。这与赵之云的观点基本一致。

聂卫平曾在一次湖南卫视的访谈节目里大赞黄龙士的棋才,但认为他“下不过那个道策”。另一次围棋活动中,聂老在“谁是古今第一高手”这个话题面前避实就虚,但对“现代高手在中国古棋规则下,能不能赢黄龙士”做出了明确回答:

如果让现在的棋手去下座子棋,只要熟悉了规则,还是要厉害些,毕竟这么多年了,围棋的理念和技术都在进步。年轻棋手在黄龙士那个时代不一定下得过他,但现在肯定能赢他。

与老一代前辈的含蓄相比,一些青年棋手在谈论中国古棋水平时更加直言不讳。2000年5月,俞斌在LG杯夺冠后参加了一场与棋迷的网络交流活动。当被问及“你认为中国古代一流高手能否下过如今的业余强手”时,答道:

我觉得按现在的围棋规则还是当今的业余棋手厉害一些,但如果是座子制的话就很难说了。

这是第一次有明确纪录的职业棋手表态,将中国古代围棋国手的水平与当代围棋业余高手划等号,“古棋业6论”也由此诞生。

需要说明的是,2000年左右的国内业余围棋强豪,大约是职业高手让两子水平,这个评价要比江户时期日本棋手的“三四段”还高一些。然而“业余水平”这种说法毕竟过于刺耳,“崇古派”棋友对这一观点自然是大加批判。不过,余平在提及此事时,认为这种评价“已经够客气了”。理由是现代顶尖业余棋手的训练时间与环境都要远远超过范施等人,没有理由认为古人更强。古人与现代人之间的差别类似“大刀长矛对机枪”,中国古代对围棋的认识与日本创新后的理论相比,无疑存在着“骑兵对坦克”的时代落差。

上述言论还不是职业棋手“心直口快”的极限。2014年1月,刘世振在上海五星体育频道《棋牌新教室》栏目解说“当湖十局”时,对范施二人作了如下评价:

(对于前面陈老“三百年前能下出这样的棋已经非常了不起了”的观点)并不是说他们的棋质量有多高。平心而论,如果我们实事求是地说,施襄夏和范西屏放到现在的围棋水平来说,应该是业余强5(段)的实力。

(对于“古棋力量特别大,计算特别深”的说法)之前曾经深以为然,但现在再来看,恰恰他们最缺乏的就是力量。不是说他们的力量小,计算差,在于他们发力的点不对。

考虑到近年来国内业余段位“水分”不断增加,2014年的业余强5段与十多年之前的业余强豪并不在一个水平线上,“范施业5论”可谓是将中国古棋的评价又降低了一个档次。再加上刘世振将部分前辈赞誉有加的古代国手计算力评价为“发力点不对”,节目一经播出,就在各大网络围棋论坛引起轩然大波。

在当时,围棋TV网趁机推出了“古今之争”系列专题,邀请当事人与各路专家棋手畅谈对中国古棋的看法。在后续的专题节目中,刘世振对他之前争议言辞的表述不严谨之处,做了补充说明——他觉得范施肯定下不过当代的职业“新初段”,“强业5”的说法,是与上海地区部分业余6段棋手对比而来;他心中的“力量”一词内涵更为广范,与一般人的理解可能有所差别。同时,他表示对中国古棋的基本观点并没有改变。大多数年轻职业棋手在不同场合谈及此事时,也对“今胜于古”这一观点表示了支持。至于中国古棋的水平,觉得古代国手能够踏入当今职业门槛的,已经算得上职业棋手中的“挺古派”了。

也有少数职业棋手对古代国手的水平持正面态度,甚至给予了相当高的评价。例如吴清源年轻时就觉得中国清代围棋水平相当于日本的七段水准,在其全盛时期时更进一步,认为清代围棋顶尖高手可与日本“名人级”棋手平起平坐,直至晚年他仍然保持这种信念。

王元曾在各种访谈与棋评中提及“范施的棋艺与境界,今人远远没有达到”,还认为围棋人工智能“AlphaGo”都对中国古棋着法进行了借鉴。胡耀宇称范施二人若是穿越到现在,职业(棋手)的实力无可争议。若二人能逐渐学习当代的围棋理论,很可能会超越如今“时代的局限”。但总体而言,认为中国古代国手可于当今顶尖围棋高手相抗衡的职业棋手屈指可数,在棋界普遍看低中国古棋的大环境下,这一类声音并未受到太多重视。

在职业棋手的评价之外,这几年还出现了一些从各种角度探讨中国古棋的学术论文。这些文章大多结合古籍与棋谱,对中国古代围棋的不同方面进行梳理,证明了中国古棋绝非“一味好杀,未能形成理论”,并希望通过总结古代围棋理论与技术发展过程,公正评价古代国手们的技艺高度。但上述探讨中国古棋各种技术细节的学术研究,与通过棋谱片段来评价中国古代国手的当代职业棋手们一样,很难对中国古棋的真实水平提出具有说服力的评价。

胡煜清与陈祖源通过对“晚清高部道平访华”一事的考证与当时的棋谱分析,认为晚清国手周小松的水平可与日本“末代名人”本因坊秀哉一争高下。然而这一结论主要通过不同年代棋手之间授子棋份的“链式关联”推导而来[1],作者在文中也承认路线过长的关联,意义可能相对有限。此外,使用“授子棋份”来建立棋力参照系这一方法,至少有以下两点缺陷:一是棋手在不同时期的水平并不一致,很难断定“血泪篇”时黄龙士让徐星友三子,此后徐星友一统棋坛到底是“棋力大进”,还是同时代的对手太弱,以及其晚年与梁程对战时,水平究竟下滑多少。二是棋手的授(受)子棋战绩,不一定与互先棋谱表现出的水平完全相同,有些棋手可能对让子棋有额外心得。例如陈祖德曾是公认的指导棋高手,面对同样水平的棋友,他往往能比其他职业棋手多让一子。关于第二点,作者在文中亦有提及,但认为“指导棋是当时职业棋手的主要收入来源”,故“没有不擅长下让子棋的棋手”。这一推论在逻辑上并不完备,况且指导棋的收费不一定与胜负挂钩,高手未必会全力争胜,这与也中日两国棋手在“指导棋”上的观念差异有关。

最后,该文采用了围棋AI(弈客“鹰眼”)辅助分析,但并未说明具体标准——使用的AI权重版本、每步棋计算量,采用何种规则,有无贴子等等。这为AI分析数据结果的验证增加了难度。千百年来,对于棋盘上布局或中盘阶段一手棋的好坏,棋手个人乃至一个时代的围棋水平,基本上只能通过定性分析评价。由于这种方法易受个人价值观的影响,时常面临“无解”的争吵。随着围棋AI领域的快速发展,人们第一次拥有了对上述问题进行定量分析的可能。不过,使用围棋AI进行研究,也应当遵循相应的学术规范。毕竟任何一项研究想要保证结果的真实与客观,都绕不开严谨性、透明性、可重复性和独立验证等科学方法的基石。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河