五千年(敝帚自珍)

主题:360- Alain Goriely:是不是脑子越大就越聪明 -- 万年看客

共:💬3 🌺8
分页树展主题 · 全看首页 上页
/ 1
下页 末页
  • 家园 360- Alain Goriely:是不是脑子越大就越聪明

    https://www.youtube.com/watch?v=7VlhYHHbrdM&list=PL4i9YSoIJiPeWWDfOimNzy08bFl_pX8Zl&index=20

    Does having a big brain make you smarter? - Alain Goriely

    今年是我成为格雷沙姆几何学教授的第一年,我将关注数学与大脑之间的密切关系。我们都知道大脑是情感、感知以及一切数学思维的来源。但是当我们观察大脑的矢状面切片时,作为数学家的你会看到许多结构,复杂的几何形状,连接大脑不同部分的细丝网络,大脑不同部分之间的动态交流。因此自然会产生一个问题:这些几何形状、构造、拓扑和网络如何影响了大脑功能。我们将在接下来的几场讲座中详细研究这个问题。但今天我想先从一个看似简单的问题开始,即大脑的大小与其表现——比如智力——的关系。这个问题的考察对象不仅局限于人类,还包括人与动物的比较。

    既然今年我们的主题是数学与大脑,那么最好的开端当然是数学家的大脑。而且还不是随便哪个数学家的大脑,而是堪称有史以来最伟大的数学家之一——卡尔.弗里德里希.高斯。高斯于1777年出生在布伦瑞克,早在少年时期就崭露头角,随后迅速成为哥廷根大学的一员并且在这里度过了余生。青少年时期的高斯对一个可以追溯至公元前300年欧几里得时期的经典问题产生了兴趣,这就是可构造性的问题,即如何依靠尺规作图绘制边长数目为n的正多边形。在高斯降生之前两千年这个问题始终没能取得任何进展,直到他证明了可以用尺规构造17边形。他的作图不是一步步进行的,而是借助了三角学与代数之间的关系。他证明了只要用平方根的形式来表达2Π/17的余弦值,17边形就会自然而然地具有可构造性。当然这个问题并没有止步于此,但他的独特解法确实震撼了当时整个数学界,也促使他决定投身于数学而不是神学。在攻读博士学位期间他证明了一条代数基本定理,并在整个生涯中革命性地改变了数论与代数分析。与此同时他在物理学领域也完成了开创性的工作,高斯定律至今仍然是电磁学的基本定律。他曾担任哥廷根天文台台长,在天文学和测地学上做出了重大贡献。他制作了全世界第一台日观测仪,还在哥廷根建立了全世界第一个电磁电报站。此外他对于统计学也颇有贡献。可惜的是,人固有一死。1855年2月23日,高斯因为心脏病发作在家中去世。此时的他早已声名显赫,以至于汉诺威国王格奥尔格五世特意制作了纪念他生前事迹的勋章。勋章正面是高斯的头像,背面镌刻着MATHEMATICORVM PRINCIPI的字样。这句话经常被误译为“数学王子”,更准确的译法应该是“数学魁首”,或者用当代年轻人的话来说就是数学界的GOAT。

    高斯的逝世当然是数学界与科学界的重大损失,不过对他在哥廷根大学的同事鲁道夫.瓦格纳/Rudolf Wagner而言却是千载难逢的机会,因为此人的主业是解剖学。在1855年前后,解剖学——尤其是大脑解剖学——正处于一场危机。大约五十年前,颅相学刚刚沦为了一场闹剧。颅相学基于两个基本思想:首先,大脑分为不同模块,分别对应不同的功能,例如诗歌或者数学;其次,当颅骨形成时,所有模块的区域都会在骨头上显现出来。换句话说,如果你的颅骨的某一特定区域胀大,这意味着你的大脑在那个地方更大,你也更擅长该区域对应的特定技能。弗朗茨.约瑟夫.高尔/Franz Joseph Gall是这一理论的主要推手之一。按照他的理论,如果你擅长数学,那么你的额头就该鼓起两个大包。颅相学家们也曾周游世界,广受欢迎。他们参加社交活动,触摸宾客的头骨,并且告诉人们他们有多优秀,就像现代的占星家一样,然后他们就来到了巴黎。弗朗西斯.高尔抵达巴黎时正值拿破仑时期。如今我们都知道管理欧洲并不需要天才,但是征服欧洲则是完全不同的另一回事。拿破仑当然不是傻瓜,他接受过水平很高的数学与科学训练。他对颅相学非常怀疑,因此他要求法国科学院针对颅相学进行调查,并制作了一份体量庞大的报告。报告结果认为:颅相学完全没有科学依据,纯粹是伪科学,智力与颅骨形状之间没有任何关系。因此颅相学的理论至少在科学界遭到了完全否定。但是这一理论如此深受欢迎,以至于继续流行了一个世纪。直到今天我们在某种程度上仍然受到它的影响。比方说我们将浅薄直白的内容称作低眉/low brow,这正是颅相学遗留下来的术语残余。

    但是当时关于大脑与智力的关系还存在另一套理念,这套理念最早由高斯在哥廷根大学的物理学教授克里斯托夫.利希滕贝格/Georg Christoph Lichtenberg提出。他的主张如下:“我们应当研究每个国家的伟人、囚犯和精神病人,因为这三类人是足以调合生成所有其它类型的三原色。”瓦格纳是这套理念的追随者。他的想法非常简单:将天才的脑子、精神病人的脑子、罪犯的脑子和普通人的脑子进行比较,从而找出天才的特征。于是他请求高斯的家属捐赠他的脑子。画面上是高斯大脑的美丽绘图。那么我们对于高斯的大脑都知道些什么?我们知道它的重量约为1492克。这个重量与一般人相比是大是小?在你发表任何意见之前必须了解人脑重量数据的总体情况。因此让我们用现代数据来研究这个问题。

    画面上是来自2018年达尼丁研究/Dunedin Study的数据。该研究包含435名45岁的男性,只需对他们进行MRI扫描就能轻松获得他们的大脑体积。然后你可以将这些数据绘制成直方图,显示在给定体积区间内的大脑数量。展示这种类型数据的最有效模型是高斯分布或者说正态分布,也就是钟形曲线。这个模型只有两个参数,首先是均值或者说分布的最大值,其次是标准差或者说分布的宽度。鉴于我们正在格雷沙姆学院讲学,我必须告诉你们,标准差这个名称首次在格雷沙姆学院由几何学教授卡尔.皮尔逊/Carl Pearson于1893年引入,此外他还引入了直方图与正态分布等名词。不过我们实际掌握的数据是高斯大脑的重量而不是体积,因此我又使用了另一个与重量直接相关的数据集,来自于二十世纪七十年代进行的2000多份尸检报告——那个时候还没有MRI扫描——可知人脑重量均值约为1390克,标准差为120克。综合可知,大约68%的人口的大脑重量位于1390克上下偏差120克的区间内,95%的人口位于上下偏差240克的区间内,99.7%的人口位于上下偏差360克的区间内。那么高斯在这个分布当中占据了什么位置?高斯的脑子比80%的人口更大——倒也还算说得过去,但是对于万中无一的天才来说毕竟差点意思。

    我们再来看看其它科学家的大脑。比如说1869年去世、享年54岁的解析数论之父约翰.狄利克雷的脑子略微超过了1500克,不算小。再看看差分机的发明人查尔斯.巴贝奇——你从这里出发走十分钟就会到达安特博物馆,查尔斯.巴贝奇的脑子就收藏在那里——他的脑子略微超过了1400克。此人被视为现代计算机的祖父,与艾达.洛芙莱斯共同设计了差分机的原型。著名德国物理学家兼生理学家赫尔曼.赫尔姆霍兹——他在德国的地位相当于麦克斯韦之于英国——他的脑子比巴比奇沉一点但是不多。那精神残障人士呢?那些被称为“白痴”的人?——我给“白痴/idiot”打上引号,是因为这个词长期以来都是真正的术语,一直使用到了二十世纪中叶——他们的平均大脑重量倒是不出所料地小,大约在600克左右。但是接下来情况就变得更加复杂了:二十世纪最伟大的头脑之一爱因斯坦又怎么样?大约是1250克多一点,实在有些上不得台面。再来看一下非常非常大的大脑?太大其实也不好。非常大的大脑在病理学层面与“弱智/imbecile”关系密切,这些人的脑子重量普遍超过了1800克。话说至此,我们面临着一个棘手的问题。当年的研究人员在德国、巴黎以及美国收集了这么多不同的大脑之后——当时巴黎有共同解剖协会/la Société d'autopsie mutuelle,美国也有人类形态学协会——他们意识到大脑重量与智力并没有什么确切的对应关系。十九世纪末,美国解剖学家伯特.格林.怀尔德/Burt Green Wilder收集了600个大脑,并将其分为受过教育的、理智的人的大脑与精神失常或者犯罪之人的大脑。他同样发现给人成就与大脑大小之间并没有关系。极具天赋的人们的脑子在任何意义上都不算特别大。这虽然是一个否定的结果,但是仍然很有趣。

    接下来我们看看另一个略有不同的问题。我们已经已经有了直方图与钟形曲线,只要知道某个大脑的具体重量就能确定这个大脑的重量多么典型。那么如果我们掌握了庞大的大脑群体数据,能否找到大脑尺寸与某种形式的智力之间更好的衡量标准呢?我来讲一下我们在这个方向的第一次尝试。首次尝试的先行者正是卡尔.皮尔逊,他研究了上千个大脑。1906年,他在他创办的《生物统计学/Biometrika》杂志上发表了一篇关于这个问题的文章。尽管我很尊敬卡尔.皮尔逊,但是如今他的口碑却十分尴尬,因为他还是优生学的创始人,并且在社会上大力倡导优生学政策,他在种族问题上的观点更是只能用骇人二字来形容。尽管如此,他对于统计学的贡献依旧不可否认。他发展了皮尔逊相关系数、卡方检验、主成分分析等等技术,世界各地使用的统计语言在很大程度上都要归功于皮尔逊。他的研究的科学严谨性堪称完美。正反两面都考虑到之后,我们来看看他的工作。

    皮尔逊研究了一千名剑桥学生和5000名学童,观察了头骨的大小——因为那是他唯一可以进行的研究,当时还没有观察活人大脑的手段。他观察了多个参数,不仅包括大小,还包括耳朵之间的头宽、额头到后脑勺之间的头长,以及其他诸如眼睛颜色、发色、卷曲度等任何他能想到的指数,并把这些数据整理成表格。那么智力又如何?他发展了一个系统,称为门泰斯/Mentaces,大致相当于智商。这个体系将均值设定为零,标准差设定为100,由此将不同的人归入不同的类别。例如剑桥大学的一等学位毕业生至少比平均值高出两个标准差。也许他们在这个体系当中还够不上天才——千中取一是天才的最低标准——但是也绝对堪称“能力超群/specially able”。反过来在坏的一面也有更加有趣的类别,比如“很笨/very dull”,“白痴”,甚至更糟糕的“弱智”,这些词语都在二十世纪初成为了心理学和精神病学领域的术语。总之皮尔逊要求老师对学生进行排名,以便确定他们应该归入哪个类别。

    现在让我们假设有某种数据同时包含颅骨大小与智力高低的信息,接下来我们该怎么办?假设我们有五个这样的数据点,对应五个学生;每个数据点都有两个参数,分别是这名学生的智力值和他的颅骨尺寸值。我们将这五个点全都画在坐标系里,横轴是颅骨尺寸,纵轴是智力。想要找出这两者之间是否存在任何关系,方法就是试图找到一条通过这些点的直线。我们可以想象这条线是y = ax + b,其中a是斜率,b是截距。然后我们可以考虑在各个地方移动这条线,直到找到一条最适合这片点云的直线。我们考虑这条直线与点之间的垂直距离,称之为d,五个数据点分别对应d1到d5。然后我们计算d1到d5的平方和D。既然D取决于a和b,那就可以表达为a和b的函数,并且找到使D最小化的a和b。这就是所谓的最小二乘法,由高斯和勒让德在大约1809年发明,并且由此推导出了所谓的数据拟合线。这一招在高斯时代已经得到了充分理解,但是皮尔逊又进一步发展了这一方法:既然我有了一条拟合线,那么数据与这条线的距离究竟是近还是远?他提出了估算这一点所需的不同系数,其中最著名的是皮尔逊相关系数,通常称为r,r的取值范围在-1到1之间。如果r = 1,那么所有点都非常精确地位于一条线上,这是最好的情况。但在统计当中总有噪音和误差。因此r通常总会小于1。比如r=0.8,这时你依然可以用眼睛观察到一条穿过数据点的线;或者r=0.4,这也还可以接受;如果r=0,那就意味着数据点与拟合线之间什么关系也没有,换句话说两个变量之间实际上没有相关性。r还可以是负值,意味着拟合线可以朝相反方向倾斜。例如如果你将大脑体积作为年龄的函数来观察,就会发现大脑体积在30岁或40岁之后会以线性方式随年龄增长而缩小,一直到90岁。至今为止皮尔逊相关系数都是统计学当中最简单也是最重要的数值,全球各地每天都在使用这个数值来评估特定数据集的拟合优度。

    现在让我们看一下皮尔逊的一部分结果,画面上是他论文中关于颅骨大小与智力的绘图,体现了剑桥大学毕业生的智力分布。学生们的智力被分为四档:一等学位、二等学位、三等学位和及格。图表上方是颅骨长度与智力的最佳拟合线,图表下方是颅骨宽度与智力的最佳拟合线。可以看到两条线基本上体现不出颅骨尺寸与智力的相关性,因为两条线几乎都是水平的横线,换句话说一个变量的变化并不会导致另一个变量的变化。他尝试了许多其他关于颅骨尺寸的变量,最终得出结论:“颅骨尺寸与智力的相关性如此之小,以至于在任何情况都没有用于预测的价值。”进一步说,“如果你希望将人体测量学数据纳入考量——这些数据同样毫无价值——例如头发与眼睛的颜色之类的数据就像颅骨尺寸一样毫不相关。”因此他主张:“当前的研究结果让我相信,人的外在身体特征与心理特征之间没什么关系。”

    我们这里姑且不讨论这项研究的每一处错误——比如凭什么一等学位的毕业生就一定比二等学位的毕业生更聪明,或者颅骨尺寸凭什么就能反映大脑尺寸,毕竟颅相学并不能揭示大脑的实际情况——如果让我们来进行这方面的研究,我们应该怎么办?我们需要两样数据:某人的大脑尺寸以及他的智力值。在大脑尺寸方面如今的我们很幸运。随着二十世纪八十年代磁共振成像技术或者说MRI技术进入医学界,当前全球每年大约会生成至少一亿份大脑扫描影像,获得大脑体积的数据已不再是问题了。现在真正的问题在于应该如何评估智力。这显然是一个非常困难的话题,因为它直接关系到我们的自我认知。在这方面存在各种分歧很大、极具争议的观点,但是我们至少都同意人与人之间的认知能力存在差异,反正我在与同事日常交流的时候经常痛苦地意识到有些人就是比我聪明得多。一般而言,智力可以粗略定义为人在多种环境当中实现目标的能力。关于智力的定义有数百种,哲学家们对此争论不休,不过我们只想要一个最能代表平均认知能力的数字,于是智商的概念应运而生。

    智商的理念最早由阿尔弗雷德.比奈提出,此人原本的研究兴趣是儿童发育以及为了教育目的识别具有相同心理年龄的儿童。他的算法是将儿童的心理年龄除以生理年龄再乘以100。比方说一个10岁的孩子具有14岁的心理年龄,那么她的智商就是140。但是事实证明这一定义并不好,因为心理年龄的概念非常模糊,对于成年人来说更是几乎毫无用处,因为我们没有理由认为40岁的人一定比30岁的人认知能力更强。换句话说按照这套测量标准,所有人的智商都会随着年龄增长而逐渐下降。现代的智商理念则使用高斯曲线,首先收集所有智商测试的成绩,然后规定均值为100分,标准差为15分——这步操作随便建立一个Excel表格就能轻松完成——这样一来我们就可以非常清楚地得出各种结论,例如智商超过130的人们仅占人群的2.5%。如果你的得分高于130,那么你就有了加入门萨俱乐部的资格,前提是你乐意每年支付60英镑的费用,而且还喜欢那里的社交活动。

    正如我所说,智力和智商的理念历来充满争议。早在二十世纪二十年代,心理学历史学家爱德温.博林/Edwin Boring就曾经主张“智力无非是智力测试的应试能力”。这是最经典的循环论证,因为我们真正想要的是确定某人做某事的智力。因此问题实际上在于智商测试得分的可靠性。在这方面存在从支持到反对的各种不同观点。最坚决的反对意见是斯蒂芬.J.古德尔的极端怀疑论。这位著名美国生物学家写了一整本书来探讨这一点,书名是《人类的误测》,这本书主张“智力无法浓缩为一个分数”。反过来说,最坚决的支持观点则来自现代心理学界:“智力领域的研究表明,智商测试的测量实际上非常可靠,能够预测学业成绩、工作表现以及生活其他方面的成功程度。”同时智商得分也非常稳定,事实证明它是年龄增长过程中最可靠的测量标准之一。这意味着在特定人群当中,不同个体的排名会随时间保持稳定。也许某个个人的智商会随着年龄而变化,但是如果此人的智商在平均水平之上,他们通常会一直维持在同一类别,无论如何年长。

    总而言之,智商得分确实很有用。然而我们也知道,过去一百年来智商的理念遭到过许多误用和滥用。例如《每日邮报》在2022年刊登头条《一名英国男孩以162的智商超越爱因斯坦和霍金,即将加入门萨俱乐部》。太棒了。两年后《每日邮报》又报道:《12岁的男孩以相当于爱因斯坦和霍金的智商被接受加入门萨俱乐部》。真不错,建议入会之后多交朋友。当然你会说《每日邮报》的狗嘴本来就吐不出象牙,但是几个月前的《卫报》的标题也写道:《一位来自德文的男孩智商高于爱因斯坦和霍金并且加入了门萨俱乐部》。我相信这些孩子们都很优秀,我也不知道他们在门萨会有怎样的表现。不过我确切知道迄今为止没有任何证据证明爱因斯坦或者霍金曾经进行过智商测试。更值得注意的是,霍金曾表示自夸智商的人都是人生的失败者,这一点我认为大家都可以同意。

    智商测试的类型有很多,目前使用得最多的是韦克斯勒成人智力量表,这套量表在很多情况下都替代了斯坦福-比奈智力测试,为得是引入与语言无关的测试方面。测试包括10到15个题目,涵盖许多类型,比方说矩阵测试:八个花纹不一的方块排成九宫格,要求用花纹正确的方块填补九宫格缺失的那一角。我这里有一道样题,也许我们可以利用集体智力来解决一下。第一列三个菱形分别涂黑了左上角、左下角与左半边;第二列三个菱形分别涂黑了右下角、右下角与右半边;而第三列的两个菱形分别涂黑了上半部分与下半部分。横过来看,每一行的前两个菱形相互重叠可得第三个菱形。所以我的猜测是空白处应该是一个完全涂黑的菱形。我必须强调,我之所以能做出这样的猜测是因为在我在不熟悉这个谜题的情况下依赖了逻辑推理,但是出题者对于解题思路或许有不同的解释。总之如今我们可以运用这些测试,它们高度标准化且十分完善,同时我们还能够获取大脑大小的相关数据。自从MRI技术发展以来已经有数十项研究尝试建立大脑体积与智力之间的相关性。文献极为混乱,涉及大样本的综合分析。智商问题的技术性很强,可能出错的地方很多。因此我想寻找这样一种数据集,保证我能够不依赖于其他科学家进行分析。

    于是我们又回到了达尼丁研究,这是一项非常有趣的研究。达尼丁是一座位于新西兰的城市,那里的人们进行了一项非常长期的研究。或许你还记得,记录同一群体发展历程的最伟大纪录片之一是由迈克尔.阿普特制作的《人生七年》,跟踪记录一群孩子如何成长。达尼丁研究就是这部纪录片在科学层面的延续。他们考察了出生于1972年4月1日到1973年4月1日之间的一千名儿童,重点观察他们的生命体征以及各种智力测试,并且进行了卓越的纵向研究。这一群体非常同质,进行的测试也完全一致。因此我们得到了非常干净的数据,我查看了他们的论文,他们没有讨论这方面的问题,但是我联系了他们:“我想将数据分享给格雷沙姆学院的朋友们,您能给我一份吗?”令我惊讶的是他们说“当然可以,毕竟这是格雷沙姆学院的请求。”于是我得到了数据并且绘制出了数据图。

    如上所示,X轴为通过韦克斯勒成人智力量表测得的智商,Y轴则是通过MRI扫描获得的大脑体积。你马上可以看出数据样本分成两类,一类是红色代表女性,一类是蓝色代表男性。我们一眼就能看到蓝点占据了坐标系的右半部分,换句话说男性的平均大脑体积更大。这绝对是男性平均身高更高的直接结果。男性的身高与大脑体积之间有很强的相关性,这并不奇怪。我们稍后还要讨论这个差异。你还会发现如果选取特定的大脑体积,数据在智商纵轴上的分布非常广泛。比方说体积靠近平均水平的大脑可能有资格加入门萨,也可能中学毕业都难。换句话说,对于特定大脑体积或者智商的人群来说,我们无法针对其中任何个体的智商或者大脑体积做出任何陈述。我们所能观察的是整个群体的水平。我们可以应用皮尔逊的方法找到最佳拟合线并且计算皮尔逊相关系数。最终我们得到了一条斜率为正的线,表示智商确实会随着大脑体积的增加而提高,相关系数相当适中,大约为0.2。其他研究得出的相关性在0.17到0.28之间。英国生物库的研究使用了大约18000人的样本,得出的结果接近0.28。这个r值的重要性在于其平方。0.2的平方是0.04,也就是4%;0.28的平方则约等于0.09。这表明大脑体积的变化能够解释4%到9%的智力变化。这是一个有趣的结论:在群体层面上确实存在大脑体积对于智力的正向影响。但是你必须深刻理解,这与自夸脑子大所以智商高是两回事。

    虽然大脑体积对于智商的影响并不很大,但是显然如果我们开始比较自己与动物的智力差异,结果应该很清楚,因为我们的大脑肯定比动物更大——对吧?让我们也来研究一下这个问题,看看是否可以看到相关性。人类大脑确实很大,重量将近1.5千克,但是并不算特别大,比方说非洲象的大脑足有5千克。在动物界当中我们人类的难熬绝对不是最大的。更进一步,鲸鱼的大脑甚至可以达到9千克。你当然会说:“鲸鱼和大象的身体也比人类大得多,你必须考虑大脑与身体的比例。”确实,从比例的角度看,人类的大脑占体重的2%,而非洲象仅占0.1%。此外人类这占比2%的大脑其实非常耗能,需要消耗日常摄入能量的20%。那么也许人类大脑的体重占比在所有动物当中最高。可惜生物学总是充满了例外。大象鼻鱼是一种生活在非洲淡水湖中的电鱼,它的神经系统占其体重的3%。再比如鼩鼱大脑的体重占比更是达到了7%。我想我们应该都同意,人类的认知能力比起鼩鼱或者大象鼻鱼多少还算更强一些。

    不过生物学还告诉我们,当我们比较不同生物的同一个器官的重量时,缩放关系通常并不遵照体重比例。这就是线性缩放和非线性缩放的区别。在线性缩放当中,如果有一组数据点,那么只需一条直线就能很好地拟合这些数据点。我们可以应用最小二乘法找到最佳拟合线并且确定其斜率和截距。但是生物学当中大多数关于器官重量与体重的数据看起来要复杂得多。应对这些数据需要用到异率测定。这些数据的拟合线更像是非线性函数——比如抛物线——而不是简单的一条直线。你不需要进行任何统计分析就能发现这一点。你真正希望找到的是一个更适合数据的函数,比方说幂函数。你可能会觉得要想找出这样的函数非常困难,必须从头另起炉灶,但是这里有一个绝妙的技巧可以将幂函数的曲线转化成线性函数的直线。比方说你有Y=bX^a这样一个函数,首先你可以在两边取对数——所有这些数值都是正数——并且记得乘积的对数是两个乘数各自对数的加和。这样以来Y的对数就成了X的对数的线性函数加上一个常数项,或者说log(Y)=a*log(X)+log(b),与之前的形式完全相同。你所需要做的就是将Y和X的数据绘制成log(Y)与log(X)的图表。这样数据就会排列在一条直线上。如果我们用这个方法处理大量的动物数据,就能找到人类在动物王国所处的位置。如果人类的位置显著高于拟合线,那就意味着人类的大脑与体重比例似乎是某种规律的例外,换句话说着我们战胜了自然选择和进化,发展出了特殊的能力。

    对于幂函数来说,真正重要的是幂或者说a的数值。如果幂大于1,函数的增长速度就会超过线性增长;如果幂小于1,函数的增长速度则会低于线性增长——换句话说假设体重翻倍,对应的特定器官的重量在前一种情况下不止翻倍,在后一种情况则达不到翻倍的程度。就大脑而言,从生物学角度来看,a如果小于1意味着当动物的体重加倍时大脑重量的增加达不到翻倍的程度。现在我们可以运用这个理论来处理关于动物体重与脑重的数据集。你会发现从只有几克重的鼩鼱到几吨重的抹香鲸,数据点的整体趋势确实在一条直线上,a的值极其接近3/4。这是基于1552种哺乳动物的数据。生物学家——特别是进化生物学家或比较动物学家——审视这些数据时通常会试图寻找其背后的原因。他们会说:“3/4这个值很有意思。”还有其他法则也发现了3/4这个值。比如175年以前就有的卡普拉法则/Kleiber's law,表明生物的代谢率作为体重的幂函数,幂值同样也是3/4。因此大脑的尺寸可能与代谢需求有关。不过一旦深入研究这个论点就会发现这个假设同样站不住脚。基本事实在于数据确实非常强烈地表明了脑重量与体重的缩放关系,但是我们无法全面解释为什么会是这样的缩放关系。那么人类的位置究竟在哪里?是否真的高居动物数据的拟合线之上?不是。我们的数据点虽然位于点云上部边缘的外侧,但是并未脱离点云,我们旁边紧贴着海豚。我们的脑重与体重比例在动物王国并不特别突出。

    我们还可以观察不同动物亚群各自的拟合线斜率。例如海豚与鲸鱼、食肉动物以及灵长类动物的斜率各有不同。这一点表明这些群体都进行了实质性的权衡,有些优先提升脑重,也有些优先提升体重——例如鲸鱼——从而最有效地适应各自的环境。这种权衡在不同动物群体当中导致了不同的结果。它们都为了在各自环境当中通过自然选择的考验而做出了不同的进化取舍。

    • 家园 是不是脑子越大就越聪明,完

      我们还可以进一步探讨这方面的思想。当前这个领域的科学家之一就是苏珊娜.赫尔克拉诺-霍泽尔/Suzana Herculano-Houzel教授。她是一位巴西神经科学家,1999年在巴黎获得博士学位。之后在马克斯.普朗克研究所工作,随后又回到里约热内卢担任了一段时间的教授,直到2006年搬到田纳西州的范德堡大学。她一直参与科普工作并且做出了重要贡献。她挑战了许多神经学领域的神话,尤其是涉及大脑神经元数量与人类大脑特殊性的神话。正是她运用缩放法则揭示了人类大脑与动物大脑在体重占比方面并没有多少不同,因此肯定还有其他因素导致了人脑的特殊性。她写了一本关于这个主题的精彩书籍,名为《最强大脑:为什么人类比其他物种更聪明》。我在这里介绍一下书中的一个观点:我们不应该单纯关注大脑体积,因为我们所依赖的实际上是神经元而不是整个大脑。对于不同动物,神经元的数量可能会有所不同,因此她深入研究了神经元的数量。神经元是认知过程中的最重要细胞,能被电激活并相互通讯,从而支持大脑当中的所有感官运动和认知功能,这是所有脑活动的基础。问题在于如何计算大脑中的神经元数量?霍泽尔教授想出了一个叫做“各向同性分馏器”/isotropic fractionator的方法。这个想法来源于她2023年的一篇论文,她在其中观察了两个人类群体,一个受过高教育,另一个受教育程度较低,并比较了各自的神经元数量。具体做法是将遗体捐赠者的大脑切成小块并且搅拌成流体,然后利用化学试剂提取神经元的细胞核,最后进行常规成像并计算细胞核的数量。这个想法很简洁,化学过程也并不复杂,不过用真正的人类大脑进行实操却是一项相当艰巨的工作。

      那么人类大脑当中有多少神经元?这方面的估算结果非常有趣。如果追溯到1895年的第一次的估算,结果是30亿;到1981年则出现了相当突兀的1万亿;接下来大约在1985年,最终的估算稳定在了1000亿。1000这个数字让我有些不安,因为作为整数看上去太干净了,这意味着这个估算可能非常粗略,否则起码也应该是一千零几十或者差几十。许多教科书都采用了这个数字。在过去二三十年1000亿这个数字一直是业内共识,尽管事实上我们很难找到这个估测的根源。直到2009年,赫尔克拉诺-霍泽尔与同事们提出大脑总神经元数量为861亿,上下偏差81亿。这是神经科学当中被引用最多的论文之一,被引用超过3000次。当我看到这个数字时心想,这又未免太精确了。因此我查看了这篇论文。它是一篇非常有趣的重要论文,发表在《比较神经学杂志》。论文当中的数据基于四名男性的大脑,这四人的神经元数量分别是788亿、797亿、903亿以及954亿,取平均值确实是861亿,标准差81亿,计算本身并没有问题。但是我们不妨想一想:如果我想确立人类的平均身高,然后在这个礼堂里找四个人来测量,也能得出一个平均值。然而你会说:“这样的取样方式太奇怪了,为什么非得选这四个人而不是另外四个人?”显然,如果我只有一两个样本大概是不够的,那么四个样本够不够?数据点数量很少时该怎么办?

      统计学家被这个问题为难了很久,因为它极大地限制了统计学的效力与应用范围。不过有一种方法可以解决此问题,只需要一个优雅的公式就能以95%的置信区间计算出上下浮动的误差,名叫t检验公式。根据这个公式,首先计算常数t乘以方差——皮尔逊当年也曾深入研究过t值——再除以样本量的平方根;平均值加减这一结果之后得到的就是误差区间。样本数量为4时t值大约为3.182。因此你可以基于这个数据集做出的唯一主张是:男性人类大脑的神经元数量的平均值并不是861亿,而是在730亿和990亿之间的某个值。这个说法明显弱化了许多,但这是我们能够做出的最可靠主张。还有一篇来自巴西的论文,也是一篇很出色的研究,主题是比较健康的人脑与患有神经退行性疾病的人脑。这个研究中分析了5位健康女性的大脑并且进行了同样的分析,发现女性大脑的平均神经元数量在620亿到730亿之间。这与男性的数值之间出现了一定的差距,或者也可以说人类大脑神经元数量在620亿到990亿之间。因此我们并不太清楚人类大脑到底有多少个神经元,至少我们目前的答案并不具备统计显著性。这个结果的确让人感到震惊,毕竟在科学当中没有什么比人类大脑更受到深入研究的领域了,可是我们就连人脑神经元数量这样的细节都拿不准。不过这一点对于我们来说并不重要,因为即使这个估算也足够与其他动物做比较。

      霍泽尔还提出了一个非常有趣的观点。她开始研究啮齿动物与灵长类动物并指出,水豚的脑子是76克,神经元数量是16亿,而体型远远更小的僧帽猴的脑子只有52克,神经元数量却接近37亿。因此大脑的重量或体积并不能说明问题,真正重要的是神经元的数量。如果观察不同的啮齿动物与灵长类动物并进行相同的缩放比较,观察身体质量与神经元数之间的关系,我们就会意识到灵长类动物与啮齿动物的缩放拟合线斜率并不一样,前者的神经元数量随体重增加而增长的比例更高。这正是不同动物群体得到不同进化结果的关键,它们在神经元数量上出了不同的选择。虽然用“选择”一词不太恰当,但是这个词确实暗示了不同动物的神经元数量在时间演化当中的不同趋向。至于我们人类的数据点依然紧贴灵长动物的拟合线。用霍尔泽的话来说:“人类无非是等比放大的灵长类。”我们的神经元数量在灵长类大家族当中确实数一数二,但是并非多到了与体重不成比例的程度。既然如此,我们与其他灵长类亲戚之间为什么存在认知能力上的鸿沟?如今的人工智能与大语言模型也面临着同样的问题。人工智能的性能似乎也遵循幂律规模,一旦达到一定规模就会突然发生质的飞跃,这些程序突然就能够以不同方式完成许多任务。

      说了这么多,我们究竟学到了什么?我们研究人类时不妨回顾一下查尔斯.达尔文的观点。达尔文明确指出“无法通过颅骨的容积来准确比较任何两个人的智力”。然而在人口层面上仍然可以观察到某种效应,比方说就男性与女性的差异而言,女性大脑的平均体积相对于男性小约11%。因此从统计学的角度来说,如果两者确实属于同一群体,智商应该会存在差异。然而智商数据却表明男性与女性的平均值完全相同。换句话说,至少在智商测试时女性使用大脑的方式不同于男性。她们以某种方式更高效地利用了大脑,以此弥补了体积不足。另一方面,在动物王国当中人脑的大小也没有什么特别之处。但是达尔文又说,真正了不起的是很小的脑子能够完成的事情。比方说爬行动物和鸟类的认知能力就很有趣。鳄鱼体重700公斤,而脑子却只有10到20克重,但是它仍然能够做出复杂精妙的行为,并且历经漫长岁月依旧幸存。达尔文还曾说过:“蚂蚁的大脑可能是世界上最了不起的物质之一,甚至比人类的大脑更出色。”

      最后让我们回到高斯这边。瓦格纳意识到自己的研究肯定有问题。于是他的儿子接手了高斯的大脑,可是同样没能研究出个所以然。他们发现高斯大脑的大小毫不特殊,跟一般人没啥区别。然后他们发现也许能从大脑的结构复杂性入手。用瓦格纳的话来说:“该大脑的褶皱的复杂程度着实十分可观。”所以如果大脑的大小与聪明与否无关,或许关键在于大脑的几何复杂性。这就是我们接下来要讨论的主题。谢谢大家。

      通宝推:大眼,
    • 家园 人脑的单元和连接都是有限的

      问题在于可变,但电脑可以通过冗余来大体实现。

分页树展主题 · 全看首页 上页
/ 1
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河