五千年(敝帚自珍)

主题:【神经科学科普】惊人的假说--灵魂的科学探索(目次,前言) -- 衲子

共:💬22 🌺4
分页树展主题 · 全看首页 上页
/ 2
下页 末页
  • 家园 【神经科学科普】惊人的假说--灵魂的科学探索(目次,前言)

    作者:弗兰西斯.克里克 (衲注: 诺贝尔奖得主,去年去世)

    ------------------------------------------------

    前言

    第01章 引言

    第02章 意识的本质

    第03章 看(Seeing)

    第04章 视觉心理学

    第05章 注意和记忆

    第06章 知觉瞬间:视觉理论

    第07章 人脑的概述

    第08章 神经元

    第09章 几类实验

    第10章 灵长类的初级视觉系统

    第11章 灵长类的视皮层

    第12章 脑损伤

    第13章 神经网络

    第14章 视觉觉知(1)

    第15章 一些实验

    第16章 种种推测

    第17章 振荡和处理单元

    第18章 克里克博士的礼拜天(1)

    关于“自由意志”的跋

    -----------------------------------------------

    前言

    本书试图用科学方法来解释意识的奥秘。在此,我并非想给出关于意识问题的直截了当的答案。我倒希望能够如此,但是目前似乎太困难了。当然,某些哲学家误认为已经解决了这一问题,但对我而言,他们的解释并不属于科学真理的范畴。这里我想做的是勾划出意识问题的本质,并提出一些如何用实验方法来研究这一问题的建议。我将要提出的是一个特定的研究策略,而不是一个充分发展的理论。我想要知道的是,当我看某个东西时,在我头脑中究竟发生了什么事情。

    某些读者也许会发现这种思维方法有点令人失望。因为它有意避开那些他们乐于听到的关于意识的许多议论,特别是如何定义意识。仅仅靠争论清楚关于战斗一词的意义,你不可能赢得胜利。你需要一支训练有素的队伍,装备精良的武器和出奇制胜的谋略,然后才能有效地击溃敌人。这些同样适合于解决一个困难的科学问题。

    本书是为那些对于意识问题有科学兴趣却没有专业知识的一般读者而写的。这意味着我必须用相对简单的术语去解释关于意识的方方面面。即便如此,某些读者仍会发现本书的某些部分难于理解。对此,我想说:不要因为那些不熟悉的争论和实验细节的复杂性而泄气。再坚持一下,或者干脆只是浏览一下这些难懂的章节,大致的意思一般是很容易懂的。

    研究心脑问题的哲学家和科学家,将会清楚地看到我忽略了许多他们非常感兴趣的问题。尽管这样处理过于简单化,我仍希望他们能从本书中学到些东西,即便只是在他们所知甚少的章节中,我尽量避免对事实的曲解)由于大自然的极端多样性,在生物学中做到这一点不太容易。同样我也不能完全避免观点上的曲解,意识问题是一个远未取得一致意见的研究课题,没有一些最初的偏见我们不可能得到什么结果。读者将会明白,此刻我并不热衷于功能主义和行为主义的观点,也不倾向于数学家、物理学家或哲学家的论调。也许我明天就会发现此时思考问题的错误,但今日我仍尽力而为。

    现在应该从科学的角度来思考意识问题(以及它与假设上永存的灵魂的关系),而且最重要的是,现在是开始严肃而精心地设计实验来研究意识问题的时候了。这正是本书给出的启示。

    以下关于本书的概述将有助于引导读者穿越脑科学的丛林。本书主要分为三个部分。第一部分由以下几章组成:

    第一章 ,我开始大胆地陈述我的“惊人的假说”。它概括了我研究脑的方法。为了弄清楚我们自身,必须要知道神经细胞是如何活动的,它们又是如何进行相互作用的。接着,比较了意识和灵魂的前科学思想与宇宙的现代科学知识的不同。最后,我简要地讨论一些带有哲学味道的问题,诸如还原论、可感受性、突现行为以及世界的现实性。

    第二章 略述了意识的一般性质(如一个世纪前威廉?詹姆斯(Wlllian James)和三位现代心理学家所论述的),并把它与注意机制和极短时记忆联系在一起。然后是我为解决这个问题而做出的种种假设,说明了我为什么要集中于一类特殊的意识(视觉意识),而不是其他类型的意识,如痛的意识、自我意识等等问题。

    第三章 说明了为什么多数人所具有的关于如何看东西的朴素想法在很大程度上是不正确的。虽然,至今我们还不清楚当我们观看事物时,头脑中真正发生了什么,但是,至少可以大概他说出用科学的方法来研究这一问题的可能途径。第四、五章 用相当长的篇幅描述了视知觉心理学中的少数几个复杂问题。这些章节将会给读者一个印象,即什么是必须解释清楚的。

    第二部分主要对大脑,特别是视觉系统,作了扼要的概述。我不想给读者过多细节的描写,只提供了关于神经系统如何组织和如何工作的一些知识。我首先在第七章 中概述了脑的解剖学,紧接着在第八章 中给出了单个神经细胞的简单描述。第九章 介绍了有关脑研究中常用的(包括细胞学和分子生物学的)实验方法。随后的两章概述了较高级灵长类视觉系统的一般性质。第十二章 说明了如何从研究大脑受到伤害的患者病例中获得有用的信息。第二大部分以第十三章 为结论,描写了各种理论模型(称为“神经网络”),它可以用来模拟由一小群类似神经元所构成的单元的行为。

    前两部分为进入第三部分提供了必要的背景知识。在第三部分中论述了各种可能的研究视觉意识的实验方法。其中任何一种都还没能导致谜底的揭晓,但其中有些方法是有前途的。作为第三部分的结论,第十八章 讨论了由于我的提法而引起的一些普遍争议。最后我用关于“自由意志”的跋作为本书的结束语。

    为使文章保持紧凑,我把不太重要的论据作为脚注给出,并提供了词汇表以便对正文中的科学术语加以简明扼要的解释,此外,在词汇表前,对长度、时间和频率等共同的科学单位有注记,这是因为脑活动发生的距离和时间比之日常经验中要小得多。

    对于那些愿意就某些东题作深入探究的读者,我提供了进一步阅读的书目表,有的适合于外行,有的适合于专家。在多数情况下,关于它们的内容,我加上了简短的评注。正文中方括号里的上标号码,牵涉到技术性更强的参考文献,主要是发表于一些研究性的期刊上的(本书的附录部分列出了这些参考文献,译者注)。这仅仅是包含了有关文献中的极少部分,但提供了进一步具体探索的起点。我并不想把这些论文推荐给外行读者,因为多数论文写得太艰深、太枯燥了。

    我要对那些指出本书不足之处的读者致以最崇高的敬意。但我对于一般性讨论缺乏热情。许多人对意识问题有其自己的想法,其中不少人觉得很有必要见诸于笔端,请原谅,我不能通读许多读者有关这一主题的所有来信。我的常规做法是,只考虑那些在有参考价值的期刊上和有信誉的出版商出版的书籍中发表的思想。否则的话,别人的叽叽喳喳的建议会使我无法有效地思考。我将继续探索这些困难的问题。希望这个前言会引起读者的一些兴趣。


    本帖一共被 1 帖 引用 (帖内工具实现)
    • 家园 太祖教导我们:"读书要钻进去,跳出来." 现在该是跳出来的时候了
      • 家园 【短讯(附评)】"灵魂"只是一组细胞吗? 诺奖得主提出惊人假说

        2003年3月讯

        DNA双螺旋结构的提出者之一,1962年诺贝尔医学奖获得者佛朗西斯.克里克日前在医学杂志《自然神经学》发表论文,称他的研究小组已经通过大量实验发现了人类的“灵魂细胞”,克里克称,人的灵魂或意识根本不是先天就有的,而是人体大脑中的一小组神经元细胞产生和控制的。

        自1962年后,克里克一直致力于研究意识的产生,尤其致力于反驳灵魂存在学说。多年来,克里克做了大量实验,他在医学杂志上写道“这是我们第一次在哲学、心理学和神经学等领域将神经细胞和意识产生完美地联系在一起。研究显示,人类意识仅仅只由大脑中一小组神经元细胞来表达,说得更精确一点,这组神经元细胞位于大脑皮层后部到前沿的一小块地区。”

        克里克曾出版过一部科学著作《惊人的假说》。书中说“惊人的假说是说:你——你的喜悦、悲伤、记忆和抱负,你的本体感觉和自由意志,实际上都只不过是一大群神经细胞及其相关分子的集体行为。”

        尽管克里克拿出了他自己的实验证据,但目前仍有许多人不赞同他的观点。

        --------------------------------------------

        网友的评论:

        克里克这里犯了明显的逻辑错误。就算承认其实验结果:"人类意识仅仅只由大脑中一小组神经元细胞来表达",这也不能推出他的“惊人”结论:"人的灵魂或意识根本不是先天就有的,而是人体大脑中的一小组神经元细胞产生和控制的。" 例如,您家里的电视机如果坏了,就看不到图象和声音了,修好了,就又能看了。 有人对您说,根本没有什么电视台在发送节目,电视信号就是您家里那台机器里的元器件产生的,您会怎么说?

        这个“惊人的”假说,一点都不惊人,是老生常谈,根本站不住脚。诺贝尔奖得主John Eccels早就发现了意识与脑的相互作用。

        J. Eccels 的相关书目:

        1. The Self and Its Brain: Argument for Interactionism

        ~Karl R. Popper, John Eccles

        2. The Wonder of Being Human: Our Brain and Our Mind

        ~John Eccles, Daniel N. Robinson

        3. Mind and Brain: The Many-Faceted Problems

        ~John Eccles

        4. The Human Mystery: Gifford Lectures

        ~John Eccles

        5. Reach of the Mind: Nobel Prize Conversations (MIND AGE SERIES)

        ~John Eccles

        关键词(Tags): #灵魂#还原论
    • 家园 关于“自由意志”的跋 (全书贴完)

      关于“自由意志”的跋

      “意识,意志使它充满活力……”

      ――托马斯?哈代(Thomas Hardy)

      从许多方面来说,“自由意志”是一个老话题了。许多人认为它是一件理所当然的事,因为他们感觉到,通常他们可以自由地想干什么就干什么。律师和神学家必须面对这个问题,但总的来说哲学家对这个问题已失去了兴趣。心理学家和神经科学家几乎从不提及这个问题。那些关心量子测不准原理的少数物理学家和别的科学家,有时猜测不确定性原理也许会是“自由意志的基础。

      1986年以前,我本人还没有注意“自由意志”。当时,我收到老朋友的一封信,情况才有所改变。他叫卢斯.里纳尔蒂尼(LuisRinaldini),是一位阿根廷生物化学家。40年代后期,我与他在剑桥第一次相遇。卢斯和他的夫人现居住在门多萨(Mendoza,阿根廷的一个省城),该城靠近安第斯山脉。一次他来到美国访问期间,想会见一些人,谈谈他的一些想法,当我们在纽约会面时,他告诉我,他与他的朋友在门多萨已经组成一个讨论组,他们对“自由意志”很感兴趣,随后,他写信给我,更详细地谈到这一问题。

      直到那时,我浑然不知我个人关于“自由意志”已有了一种理论。但是。从他谈到的一些方法,我能看出,我的一些思想有别于他。那时我把它写出来,十分简短,我坚信我发现了一些什么,并把它寄给他,整个内容不足三十行。我曾把它给哲学家帕特丽夏?丘奇兰德(Patricia Churchland)看过。这样做的部分原因是使这个问题的叙述不致于太傻。她十分乐意给予帮助,在词语上加以明晰化,并附加了一些注记,她认为我的想法似乎是合理的。下面的内容就是我寄给卢斯稍加扩充的版本。

      我的第一个假设是:人脑的某个部分与制定进一步行动的计划有关,但不一定执行它,我也假定人可以意识到这个计划,即,至少可以直接回忆起来。

      我的第二个假设是:人不能意识到这部分脑所执行的“计算”过程,而只知道它作出的最终“决定”,也就是计划。当然,这些计算将依赖于这一部分大脑的结构(部分由于进化,部分由于过去的经验),也取决于来自脑其他部分的当时输入。

      我的第三个假定是:执行这个计划或那个计划的决定受到同样的限制。换句话说,人可以直接回忆起决定是什么,但不知道作出这个决定的计算过程,即使可能知道一个计划在进行中。①

      于是,如果这种机器(这是我信中使用的字眼)能像人一样决定自己的行为,即有一个“自身”的映象,那么这种机器看来具有“自由意志”了。

      决策的实际起因可能是十分清楚的(帕特丽夏添加的),即:可能是决定性的但却是混沌的。一个非常小的扰动可能造成最终结果的巨大差异。由于这一点,输出结果在本质上成为不可预测,所以,使得“意志”看起来似乎是“自由”的。当然,意识活动也可能影响决策机制(帕特丽夏附加的)。

      这样一种机器能够试着解释自己为何作出某种选择(运用内省法),有时会达到正确的结论。而在另一些时候,它将不知不觉,或者更可能进行虚谈,因为它没有意识到作出选择的理由。这意味着一定存在着一种虚谈的机制,只要给出一定量的证据,不管它们是否会产生误导,脑的某部分总会得出一个最简单的结论。正如我们已经看到的,这一切太容易发生了。

      这就是我的自由意志的理论。显然,它依赖于对意识的理解(这是本书的主要议题)、大脑是如何计划(和执行)行为的以及我们如何进行虚谈,等等。我不知道整本书里是否真的有点儿新东西,尽管这里的某些细节并没有被包括在以前的解释中。

      ***

      在那之后,我心满意足地将事情丢在一边,接着我在纽约会见了卢斯,随后他访问了加利福尼亚州的拉霍亚(La Jolla),得以同保罗?丘奇兰德(Paul Churehland,帕特丽夏的丈夫)讨论这个问题。我本不想在这个问题上多加思考,但是,一旦引起了我的兴趣,我就发现自己一天到晚在不停地思考着它。

      我想知道“自由意志”可能位于脑的哪个部位。显然,“意识”牵涉到大脑几部分的相互作用,但是,大脑皮层的某个特殊部位应当与其有种特别关系,这个想法不是不合理的。人们可能期望,这部分接收来自感觉系统高级水平的输出,又要馈送到运动系统的高级计划水平。

      在这一点上,我偶然找到了一个有利于我的理论的证据,这就是安东尼奥?达马西欧(Antonio Damasio)及其同事关于一位大脑受损妇女的病例的描述。她受损伤后,表现出对事物没有反应。她一声不响地躺在床上,脸上带着警惕的表情。她能用眼睛追随别人,但不能自觉地与人讲话。她对任何提问都不回答,虽然看起来她是理解这些问题的。她只是用点头加以答复。她用极慢的语调能重复词汇和一些句子。总之,她的反应极其有限,又总是一成不变。

      二个月以后她得到很大程度的康复。她说她以前不能交流,并不感到不安。她能跟上交谈,但她感到“没有什么可说的”而不开口,她的头脑是“空”的。我马上想到“她失去了意志”!那么,大脑的什么部分受损呢?文献中指出,受损部位靠近波罗德曼(Brodmann)区的24区(1),在一个叫做“前扣带回”的地方。如果大脑被一切为二,它就位于上顶部的内表面上。我高兴地得知,这部分接收许多来自高级感觉区的输入,又在靠近运动系统的高级水平。

      索尔克研究所的特里?塞吉诺斯基小组在工作周内有多次午茶会。这是讨论最新实验结果的理想场合,比如提出一些新的想法,或者只是关于科学、政策和一般新闻的闲聊。我曾参加过一次午茶会,并对帕特丽夏和塞吉诺斯基说,我已经发现了“意志”的部位!它就在“前扣带回”上及它的附近。当我与达马西欧讨论此问题时,我发现他也有类似的想法。他帮助我补充有关这部分脑区的解剖学上的联系。它与大脑另一侧的对应部分有极强的联系――正如我们所知,尽管裂脑人有两个独立的“意志”(看第十二章 ),而我们正常情况下只能有单个“意志”在起作用。再则,大脑一侧的这一区域有极强的投射到两侧的??胝体(运动神经系统的重要部分),这也正是我们从单一意志当中所要预料的结果。的确,这一切看来十分理想。

      过了一段时间,我读了一篇迈克尔?波斯纳(MichaeI Pesner)写文章。在论文中他也提到了一种罕见的病症,由于一种特殊类型的脑损伤引起的“异己手”症。例如,患者的左手可以活动,做一些十分简单的、刻板的动作,但他却拒绝对此手负责。例如,此手可能自发地抓住放在近旁的某个东西,但有的时候却不能把它放下,不得不用右手把它从东西上拿开,有一位患者发现,他不能用他的意志力使“异己手”放开物体,但如果大声地喊:“放开!”,也许它会把抓住的东西松开。

      那么“异己手”症是什么部位受损呢?又是靠近或正好在前扣带回上(如果“异己手”为左手,那么损伤位于右脑),也可能是胼胝体的相应部分受损,以致于左侧区域发出指令不能到达由受损的右边区域控制的左手。再则,正如第八章 提到的,某种选择性过程前扣带回处于活动状态,这可以从这部分血流增加上看出。

      “自由意志”位于或靠近大脑的前扣带裂上,这一想法可能有点新意(1)。实际上,事情可能会更复杂。脑前区的其他部位也可能与其有关联。需要的是更多的动物实验、“异己手”和有关病例的仔细研究,其中首要的是,对视觉意识的神经生物学有更多的了解,并由此增加对其他形式的意识行为的了解。这也是把这些建议附在本书末尾的原因。

      =====================================

      ①邻近的运动附区也被破坏。

      (1)约翰.埃克尔斯爵士先前提出,靠近24区(运动附区)可能是“自由意志”所在。

      ①奥蒂弗雷蒂(Odifreddi)教授对我指出,应当假定,决策与相应行为之间应当有某种一致性。

    • 家园 第十八章  克里克博士的礼拜天(1)

      第十八章  克里克博士的礼拜天(1)

      “作为人类真正重要的是我们自己主观的精神生活,包括感官感受,感情,思想,有意志的选择。”

      ――本杰明?里贝特

      意识问题的研究已经提到日程上来了。我们已经了解了视觉系统的复杂性,以及视觉信息是如何按一种准等级的方式进行处理的(这种准等级方式只有部分是我们所了解的)。我还概述了关于视觉觉知的神经机制的几个观点,并概要提出了可能有助于揭示它的机制的几个实验。我们显然还未完全解决这个问题,那么到目前为止已经得到了些什么结果呢?

      科赫和我正在试图去做的就是使人们,特别是那些与脑研究有密切关系的科学家,相信现在是严肃地对待意识问题的时候了。我们猜测,真正有用的可能是那些关于意识的一般性的探讨,而不是某些详细的建议。本书所讨论的那些设想并不是一些详细拟定好的、有条理的观点。相反,它们还在发展之中。我相信,我们尚未发现将意识概念化的确切途径,而仅仅是在朝这方向摸索着前进。这正是实验证据如此重要的原因之一。新的结果会引出新的观点,同时也会使我们察觉出旧观念中的错误。

      哲学家们试图去寻找解决这个问题的更好的方法,并想指出我们目前思考中的谬误,这当然是正确的。但他们仅仅取得了极少的实质性进展,这是由于他们是从外部观察系统的。这使得他们使用了错误的术语。从神经元的角度考虑问题,考察它们的内部成分以及它们之间复杂的、出人意料的相互作用的方式,这才是问题的本质。只有当我们最终真正地理解了脑的工作原理时,才可能对我们的感知、思维和行为作出近于高层次的解释。这将有助于我们以一种更加正确和严谨的方式理解脑的所有行为,以取代我们今天的那些模糊的庸俗观念。

      许多哲学家和心理学家认为目前从神经元水平考虑意识问题的时机尚不成熟。然而事实恰恰与此相反。仅仅用黑箱方法去描述脑如何工作,特别是用日常语言或数字化编程计算机语言来表达,这种尝试为时尚早。脑的“语言”是基于神经元之上的。要了解脑,你必须了解神经元,特别是巨大数目的神经元是如何并行地一起工作的。

      读者也许会接受所有这些观点,同时又抱怨我更多地用推测而不是铁一样的事实来谈论意识话题,并且回避了归根结底最让人困惑的问题。我几乎没有涉及可感受的特征(如“红颜色”的红)的问题,而仅仅将它推到一旁并期盼有个最好的结果。简而言之,为什么“惊人的假说”如此惊人呢?脑的结构和行为是否存在某些方面可以向我们暗示,为什么从神经角度了解觉知如此困难呢?

      我认为是存在的。我已经描述了脑这个复杂机器的一般工作情况。它可以在一个感知时间内迅速地处理总量巨大的信息。脑是个丰富的相互关联的信息的载体,它的许多内容是连续变化的,然而这台机器却能设法保存它刚刚所做的各种运行的记录。我们通过自己内省得到的非常有限的体验,但除此以外并未遇见到任何机器具有这些特性。因而内省的结果显得比较奇特,这也不足为奇了。约翰逊-莱尔德也提出过一个类似的观点(这在第十四章 引述过)。如果我们能构建一台具有这些惊人特性的机器,并能精确地跟踪它的工作,我们会发现掌握人脑的工作原理就容易得多了。就像现在我们了解了DNA、RNA和蛋白质的功能之后关于胚胎学的神秘感已大部分消失了一样,关于意识的神秘特性也将会消失。

      很明显这引出了一个问题:在将来,我们能否造出这样的机器呢?如果能的话,它们看上去是否具有意识呢?我相信,最终这是可以实现的,尽管也可能存在着我们几乎永远不能克服的技术障碍。我猜想,短期之内我们所能构造的机器就其能力而言与人脑相比很可能非常简单,因此,它们只可能具有形式非常有限的意识。或许它们更像是一只青蛙甚至是一只低等的果蝇的脑。在理解产生意识的机制之前,我们不大可能设计一个恰当形式的人造机器,也不能得出关于低等动物意识的正确的结论。

      应当强调的是,“惊人的假说”是一个假说。我们已有的知识已足以使它显得合理,但尚不足以使人们就像信服科学――证实了许多关于世界本质(特别在物理学和化学方面)的新观点――那样信服它。其他关于人类本质的假设,特别是那些以宗教信仰为基础的观点,它们的证据更站不住,只不过这本身并未成为否定这些观点的决定性的论据。只有科学的确定性(及其所有的局限性)才能最终使我们从祖先的迷信中解脱出来。

      有人会批评说,不管科学家们会怎么说,他们确实相信“惊人的假说”。这只在有限的意义上讲是对的。如果没有一些先人之见的思想指导,你不可能成功地解决一个科学难题。因此,泛泛而论,你信奉这些观点。但对一个科学家来说,这仅仅是暂时的信仰。他并不盲从于它们。相反地,他知道,或许某些时候推翻某个他所珍爱的观点会取得实质性的进展。我不否认科学家对于科学解释有一种先人之见的倾向性。这种倾向是有道理的,不仅仅是因为这支撑着他们的(科学)信念,更主要是因为近几个世纪以来科学取得了如此惊人的成功。

      下一件需要强调的事是,意识研究是一个科学问题。科学与意识之间并没有什么不可逾越的鸿沟。如果从本书中能学到些什么的话,那就是我们现在看到了用实验的方法可以探索这个问题。那认为只有哲学家可以解决这个问题(1)观点是没有道理的。过去两千年来哲学家有着如此糟糕的记录,因而他们最好显得谦虚一些,而不要像他们常常表现的那样高高在上。毫无疑问,我们那些关于脑的工作原理的暂时性观点需要澄清和扩展。我希望能有更多的哲学家学习有关脑的足够的知识,以便提出关于脑工作观点,并在与科学证据相抵触时,能放弃自己所钟爱的理论。否则他们只会受到嘲弄。

      历史上,宗教信仰在解释科学现象方面的记录是如此的差,几乎没有理由相信这些传统宗教会在将来能表现得更好。意识的许多方面,如可感知的特性,完全有可能是科学所不能解释的。过去我们已经学会了生活在这种局限当中(例如,量子力学的局限),它们仍将伴随着我们的生活。这并不意味着我们将被迫去信仰宗教。不仅仅大多数流行的宗教信仰是相互矛盾的,而且从科学准则来看,它们是建筑在如此脆弱的证据上,以致于只有那些盲目忠诚的人才会接受它们。如果教徒们真的相信死后会有生命的话,那么他们为什么不设计一些有力的实验去证实这件事呢?或许他们不能成功,但至少可以尝试一下。历史表明,许多神秘现象(如地球的年龄),过去教会认为只有他们才能作出解释的,现在都已被科学的探索所代替。此外,真实的答案通常与传统宗教给出的解答相差甚远。如果宗教曾经揭示了些什么的话,那就是它们通常是错的。这种情况在科学探索意识问题时显得格外强烈。现在,唯一的问题是如何着手去解决它以及何时开始。我极力主张应该现在立刻开始研究。

      当然,有不少受过教育的人士认为“惊人的假说”是如此的合理,并没什么惊人的。我已在第一章 中简要地谈到了这一点。我猜想这些人常常并未理解这一假说的全部实质。我自己有时也发现很难回避头脑中有个小矮人“我”的想法。人们很容易就滑到那个观点当中。“惊人的假说”说的是,脑行为的所有方面都来自神经元的活动。这并不是说,我们用神经术语解释了视觉处理的所有各种复杂阶段以后,就可以因为“看”这一行为确实是“我”所做的而草率地假设它的某些特征不需要解释。例如,除非有一些神经元的发放标志着你脑中的缺陷,否则你就不可能觉察这个缺陷,并不存在一个不依赖于神经发放的独立的“我”去识别缺陷。同样地,你通常不知道某些事情在脑中发生于何处,因为在脑中并没有这样一些神经元,它们的发放标志着它们或其他神经元在脑中的位置。

      读者有道理抱怨本书所讨论的问题极少涉及像他们所理解的人类灵魂。我没有讲述任何关于人类最具特色的能力――语言,也没谈论我们如何求解数学问题,或是问题的一般求解。即使对视觉系统我也几乎没有提到视觉想像,或是我们对绘画、雕塑、建筑等的美学感受。没有一个词讲述我们在同自然界的接触中所得到的真实的愉快。诸如自我觉知、宗教体验(它可能是真实的,尽管通常对它的解释是错误的)等话题则完全被忽略,更不要说坠人情网了。一个教徒可能会断言,对他来说与上帝的关系才是最重要的。科学对此又能说些什么呢?

      现在这种批评是完全有道理的,但倘若将这些内容加入本书中,那就显得对科学方法缺乏正确的理解。科赫和我选择考虑视觉系统是因为我们感觉到,在所有可能的选择当中,在这方面最容易取得实验上的突破。本书清楚地表明,尽管这种突破并不容易,但它确实有取得成功的机会。我们的其他假设是,一旦我们完全理解了视觉系统,将更容易研究“灵魂”的那些更迷人的方面。只

      有时间能够说明这种判断是否正确。新的方法和观点可能会使得其他的探讨途径更有吸引力。科学的宗旨是解释人脑的所有方面的行为,包括了音乐家、神秘主义者以及数学家的脑。我并不认为这能很快实现,但我确实相信,只要我们保持这种探索,我们迟早会到达这种理解。这一天或许在21世纪。我们越早开始,我们就能越早地得到对自然本质的清晰的认识。

      ***

      当然,有些人会说他们并不想了解思维如何工作。他们相信,理解自然便是亵读她,因为这消除了对她的神秘感和本能的敬畏感,这些感觉是我们面对那些知之甚少从而留下深刻印象的事物财产生的;他们更喜爱古代神话,即便它们已经和现代科学有明显矛盾。我并不同意这种观点。对于我来说,现代的宇宙观――它比我们的祖先所想像的要古老得多,也大得多,并且充满了神奇的、难以预料的物体,如快速转动的中子星――使早期以地球为中心的世界显得过于自大和狭隘,这种新的知识并没有减少对其的敬畏感,反而大大地增加了这种效果。我们关于动植物结构(特别是我们的身体)的详细的生物学知识也起到了同样的作用。赞美诗的作者写道:“我是多么神奇和美妙啊!”,但他也只不过是非常间接地瞥了一眼精巧和微妙的分子结构的本质而已。进化过程中包含了许多我们祖先一无所知的奇迹。DNA的复制机制,尽管其本质是那样简单和优美,令人难以置信,但在进化过程中却变得十分复杂和精细。如果一个人看到这些而并不感到很神奇的话,那一定是感觉迟钝。认为我们的行为是以大量相互作用的一群神经元为基础的,这并不会贬低我们对自身的看法,相反大大扩展了我们的观念。

      有报道说,有一位宗教领袖看到一幅很大的单个神经元的示意图后叫道:“脑就是像这样的啊!”虽然单个神经元是一件精密的、设计良好的奇妙的分子机器,但我们的脑并不是由单个神经元构成的。真实脑的情况是:神经元有数十亿个,它们之间的相互作用模式十分复杂且不断发生变化,而这些神经元相互之间的连接方式从细节上说因人而异。我们平常用来描述人类行为的方式是经过删节和近似的,它只不过是我们真实自我的一种模糊的描述。莎士比亚说过,“人是一件多么伟大的艺术品!”如果他生活在现代,定会给我们写出衷心庆贺所有这些伟大发现的诗篇。

      如果“惊人的假说”能最终被证明是正确的话,它也不太可能被广泛接受,除非它的表达方式能迎合大众的想像力,并能满足他们的需要,以他们所容易理解的方式形成对世界和自身的和谐观

      点。具有讽刺意味的是,虽然科学的目标恰恰是形成这样一种统一的观点,但许多人发现目前大多数的科学知识过于没有人性,过于难以理解。

      这并不奇怪,因为大多数科学研究的是诸如物理、化学等领域及其相关学科(如天文学),这些都与大多数人的日常生活多少有些距离。将来这会有所改变。我们可以期望更准确地理解诸如直觉、创造力和美学享受等精神活动的机制,以便能更清楚地掌握它们,并如所希望的那样更好地从中得到乐趣。自由意志(见跋)将不再神秘。这就是为什么如果以一种过于幼稚的方式理解我们的假说就会产生误解而一无所获。深入洞察脑的神奇的复杂性会使我们产生惊奇和赞叹,而这种复杂性我们今天只能隐约地感受到。

      尽管仅从科学事实中我们可能无法推断出人类的价值,但是,如果假装说科学知识(或非科学知识)对我们如何形成价值观没有影响,那是没有说服力的。我们需要灵感和想像来构成一个新的世界体系,但建筑在错误基础上的想像最终是不会成功的。我们可以做梦,但现实已经无情地敲响了大门。即使我们所感知的现实大多是我们脑所构想出来的,它也必须与现实世界相一致,否则最终我们会对它越来越感到不满。

      如果科学事实足够明显,并被很好地确认,而且是支持“惊人的假说”的,那就可以说人具有实体的灵魂的观点就像人具有“生命力”这个古老的观点一样是不必要的。这与当前数以亿计的人的宗教信仰是直接矛盾的。人们又怎样接受这种激进的挑战呢?

      或许有人会自慰地相信大多数人会被实验证据说服而立即改变他们的观点。令人遗憾的是,历史表明恰恰相反。当今关于地球年龄的证据已确凿元疑了,但是在美国有数百万原教旨主义者仍然固执地坚持那种幼稚的观点,按圣经字面推断地球年龄相对比较短。他们也否认在这漫长的时期内动植物出现了进化,发生了剧烈变化,虽然这一点也早已被确认。这很难使人相信他们关于自然选择过程的言论是无偏见的,因为对宗教教条的盲从早已预先决定了他们的观点。

      在我看来,有几种原因导致了人们固执地坚持这些陈旧的观念。在幼年时影响我们的一般观点,特别是道义上的观点,常常在我们脑中根深蒂固。要改变它们是十分困难的。这有助于解释为什么宗教信仰被一代又一代地传下来。但这种观点最初是怎样产生的?为什么它们常常是错误的呢?

      原因之一是我们对全面解释世界和我们自身的本质有着非常本能的需要。各种宗教都用一种一般人所容易理解的方式提供了这样的解释。应当记住,我们的脑正是在人类处于狩猎采集者的时期大大发展起来的。在一小群人的合作当中,在邻近的竞争部落间的敌对行动中,到处都存在着强大的选择压力。甚至在本世纪,在亚马逊丛林中,在厄瓜多尔的偏僻地区,部落人员死亡的主要原因是部落间相互格斗所造成的伤害。在这种环境中,一种共同的信仰能增加部落成员之间的凝聚力。这种需要不太可能是因为进化而在我们脑中建立起来的,毕竟,我们高度发达的脑仅仅能使我们足够机敏地生存和繁衍后代,它不是为了发现科学事实而不断进化的。

      从这种观点来看,这些共同的信仰并不必完全准确,只要人们相信它们就可以了。我们最有特色的能力是能流利地处理复杂的语言。我们不仅能用语言表达外部世界的事物和事件,还能表达更为抽象的概念。这种能力导致了人的另一种突出的特点,即我们具有几乎无限的自我欺骗的能力,但这很少被提及。我们脑发展成为从可用的有限的证据中去猜测最合理的解释,它的本质特征使得在缺乏科学研究训练时,我们几乎不可避免地陷入错误的结论中,对于那些相当抽象的事物尤为如此。

      最终的结果尚有待观察,或许“惊人的假说”被证明是正确的;或许,某些接近于宗教的观点会变得更加合理。当然还有第三种可能,即事实支持一种全新的替代观点,从一种与许多神经科学家如今所支持的唯物主义观点以及宗教观点都显著不同的角度来看待“心-脑”问题。只有时间和更多的科学工作能使我们作出决定。不管答案是什么,要达到它,唯一切实可行的方法是进行详细的科学研究。所有其他的途径都不过是吹口哨给自己壮胆罢了。人类对世界具有无止境的好奇心,不管传统和宗教仪式曾在一段时间内有多大的魅力以消除我们对其合理性的怀疑,我们永远也不会满足于昨日的猜测。我们必须不断地追求,直到形成了关于我们生存的浩瀚宇宙以及我们自身的明了的、合理的图像。

      =================================================

      ①原文为“Dr.Crick’s Sunday Moming service”,在西方,人们在星期天早上到教堂做礼拜。教堂的神职人员负责向教徒讲道,本章为全书正文的最后一章 ,作者在此总括“惊人的假说”的主要思想。故以做礼拜布道作比喻。――译者注

      ①不客气他说,哲学家通常是这样一种人,他们更喜爱想像中的实验而不是真实的实验,并认为解释这样一个现象用日常用语就足够了。

    • 家园 第十七章  振荡和处理单元

      第十七章  振荡和处理单元

      “预言是一件困难的事情,特别是如果它涉及未来的话。”

      到此为止我很少谈及可能解决捆绑问题的方法。一个物体(或事件)的不同特征在脑中对应于不同的神经元发放。捆绑问题即如何将这些神经元捆绑在一起。如果在一个感知时刻察觉到不止一个物体,这个问题就显得尤为突出。捆绑的重要性在于它可能至少对某些类型的觉知是必需的。在第十四章 曾提到捆绑可能通过有关的神经元的相关发放来实现。一种非常简单的相关发放形式是所有牵涉到的神经元同时以一种节律形式发放(虽然节律对相关而言并非本质)。图57是一个理想化的例子,它显示了神经元每100毫秒有一簇发放,频率约为10赫兹。频率在此附近的节律称为“α节律”。在从头皮记录到的脑波(即脑电波图,EEG)是相当杂乱无章的信号,从中可以探测到这种节律以及其他节律。是否有实验证据表明由神经元组成的群体中存在相关发放呢?

      一段时期以来人们已经知道,嗅觉系统中出现了具有振荡形式的相关发放,但直到最近才在视觉皮层中清楚地观察到这种振荡。最令人振奋的结果来自德国的两个研究小组。法兰克福的沃尔夫?辛格(Wolf Singer)、查尔斯?格雷(Charles Gray)和同事们在猫的视皮层观察到了振荡现象。这些振荡在35至75赫兹范围内,常称作“γ振荡”,或不那么精确地称作“40赫兹振荡”。马尔堡的莱因哈德?艾克霍恩(Reinhard Eckhom)和他的同事们独立地观察到了这种振荡。他们使用了一种用于探测“场电位”的电极,能够特别清楚地观察到这种现象。大致说来,场电位所显示的是电极附近的一群神经元的持续变化着的平均活动,它很像是在鸡尾酒会上在一大群人中听到的叽叽喳喳的谈话声。

      这些实验比较新,而更新的实验结果仍不断出现,在这里,我仅给出一个非常简单的描述。

      正如前面已经叙述过的,当视野内出现适当的刺激时,视皮层的一些神经元会变得活跃起来,并以一定的节律形式发放。在它们附近的平均的局部电活动(场电位)常表现为在40赫兹范围内的振荡。这种神经元发出的脉冲并不随机出现,而是和局域的振荡“合拍的”(见图60)。一个神经元会合拍地发放由两、三个脉冲形成的短簇,有时它也可能根本不发放;但当它发放时,经常是与它的一些神经元“同伴”近似同步的。这些振荡并不很规则。它们的波形更像一个随手画出的粗糙的波,而不像具有恒定频率的非常规则的数学上的波。

      辛格和同事们经常发现,当使用两个离得不太远的电极作记录时,如果其中一个电极附近的神经元发放,它们趋向于与另一个电极附近的神经元的发放同步,甚至当两个电极分隔达7毫米远,场电位还可能具有同位相振荡。不过这种情况更多出现在使它们兴奋的运动刺激是属于同一个物体而不是两个物体的时候。只是目前支持最后一个陈述的实验证据还相当少。另外有实验表明,运动光棒能在第一视区和第二视区的相应位置引起同位相的节律发放,这正说明同步可以出现在不同皮层区域的神经元之间。此外也有实验表明同步可以出现在大脑两半球皮层之间。

      德国的这两个研究小组都认为,这些40赫兹振荡可能是脑对捆绑问题的解答。他们提出,标志同一个物体所有不同属性(形状、颜色、运动等)的神经元通过同步发放将这些属性捆绑到一起。科赫和我将这一观点更推广了一步,认为这种与y振荡(在35至75赫兹范围内)合拍(或在此附近)的同步发放可能是视觉觉知的神经关联。这种行为将是其他理论家提出的相关发放的一个特殊情况。

      我们还认为,注意机制的主要功能可能是选择一个被注意的物体,然后帮助把所有神经元同步结合起来,这些神经元对应于脑对这部分视觉输入的最佳解释。我们猜测,丘脑是“注意的器官”,它的某些部分控制注意的“探照灯”在视野中从一个显著目标跳向另一个。

      这些开创性的实验是猫被轻度麻醉时进行的,在猫被非常深度地麻醉(使用巴比妥盐)的情况下没有观察到振荡,但此时神经元的活动性无论怎样都极度降低了,因而这一结果本身并未提供很多信息。最近的实验是在清醒的猫上进行的(查尔斯?格雷在同我的私人通信中提到此事)。这里也存在40赫兹的振荡,因而振荡并不是麻醉引起的伪迹。一些新的实验使用了轻度麻醉的猴,在皮层第六区的也发现了振荡。在清醒的猴子皮层MT区的实验表明,使用运动棒作为视觉输入时能观察到振荡,而当呈现伪随机运动的点组成的图案时则不然。目前尚不能解释这种行为上的差异。这更像是振荡参与了图形/背景的鉴别,而不是视觉觉知。艾伯哈德?菲尔兹(Eberhard Fetz)和同事们在清醒的猴子的运动/躯体感觉皮层的实验中也清楚地观察到了振荡,特别是当猴子完成一项需要注意的复杂的操作任务的时候。

      观察到的振荡通常是相当短暂的。它们持续的时间常常依赖于所用的视觉信号呈现的长短。正如一些理论预测的那样,不同位置的神经元集团间的相关振荡仅持续几百毫秒。总的来说,很难让人们相信外部世界在我们的脑中留下的生动逼真的景象完全依赖于如此杂乱、难以观察到的神经活动。

      现在你或许会感到迷惑,就像警察在侦破一个困难的谋杀案的初期一样。这里线索很多,但没有哪个能令人信服地指出这个谜团的可能的解答。这就是公众最难以体会的那一类警察工作――沿着众多相当弱的线索进行系统的、费力的追踪。对于视觉觉知方面的科学探索也是如此,我们都想知道答案,但若不仔细地检查不同的“痕迹”,我们就不可能找到答案。可能有许多线索最终被证明是误导甚至完全是错误的。

      从所有这些考虑当中我们可以知道,视觉觉知可能有若干种形式;推而广之,一般说来意识甚至可能有更多种形式。我们能否找到某种方法把视觉觉知的这些不同形式同灵长类动物视觉系统的结构和行为联系起来呢?

      回想一下我所描述的视觉处理有三个可能阶段:一个阶段非常短暂,大致对应于马尔的要素图;一个则更为持久和生动,大致相应于他的2.5维图和杰肯道夫的中间层次;还有一个三维的以物体为中心的过程,它并不对应于我们所真实看到的东西,而是对我们所看到的物体的某些推测。我生动地看到一个特定物体的轮廓和可视表面,这些表明它是茶杯,并具有所推断出的三维形状。通常看这个词包括这么两种用法。如果我说“你看见那边的那个杯子了吗?”,我在两种意义上使用了看这个词。我可能仅仅是指杯子呈现在我面前的可视表面,但也可能指所推断的整个杯子的三维形状。注意2.5维图和3维模型是一类问题的两种推断,即它们都具有对这个视觉输入的解释,并且都可能是错的。我们对单词的日常用法可能并不精确地描述脑的真实行为。

      有一种观点认为视觉处理的每个层次都有某个丘脑区域与之对应,(1)我称之为处理假设。从同一个丘脑核团接受输入的皮层区之间有何共同之处?这个关键问题人们很少提及。

      我们都知道在灵长类视觉系统中侧膝体(丘脑的一部分)主要与V1区有关联。灵长类丘脑有一个很大的部分称为“丘脑后节结”,丘脑的其他视觉区都位于这里(见第十五章)。它具有大量不同的亚区,其中一些亚区可能由若干更小的小区域构成。是否每一个区域都与视觉处理的某一个阶段相关呢?这有两种可能性。这些亚区(其中三个是主要的,即前部、侧部和中部丘脑后节结)可能各与戴维?马尔理论中的一个阶段(即要素图、2.5维图和三维模型)或某些类似的东西有较强的关联。另有一种可能,即更小的、数目更多的小亚区各与范?埃森的视觉等级(图52)的一个层次有强相关。当然,这两种可能性都具有一定真实的成分。

      我所说的“强相关”是什么意思呢?丘脑向皮层发出的连接有两种形式:一种连接到第4层(或第3层);另一种则避开了这些中间层,通常有很多向第1层的投射。第一种类型连接可能是驱动性的,而第二种则更像是对已经发生的事件进行调节。我指的强相关是那些到中间层的驱动性连接。在这个简短的考虑中我暂时搁下另一种类型。

      最简单他说,处理假设就是任何一个皮层区域仅仅与丘脑的某一部分密切相关。这种观点并非完全不可置信。皮层Vl区只与侧膝体密切相关,而与丘脑其他部分没有关系。人们发现,形成马尔的要素图(或某些类似的东西)的特征确实在V1区出现。在那里标识的信息对应于相当简单的局部特征,如视野中一小部分图像的朝向。科赫和我设想Vl区可能是十分短暂形式的视觉觉知的所在地。我们认为这并不需要注意机制。实验表明,猴子的注意并不影响Vl区神经元的发放,这可以认为是对此种提法的支持。

      我们对其他部分的丘脑连接的细节尚不够了解,不能判断处理假设是否正确。除了v1区以外,每个皮层区域是否仅仅与丘脑后节结的一个部分有强的连接呢?如若不然,它们又怎样连接呢?要回答这个问题还需要更多的实验。也有可能一些丘脑区域恰好与参与视觉觉知的皮层区有强的连接。

      那么假设的三维模型阶段又怎样呢?这种情况我们几乎不知从何下手,心理学家欧文?比德曼(Irving Biedrman)认为这种表象将基于他称为“几何子(1)”的某些原始的三维形状。一些理论家(如托马索?波吉奥)则认为我们脑中所具有的是一个物体的一系列二维视图,以及在它们之间进行内插的能力。这两种观点很可能都是对的。如果所有这些确实存在的话,它们在猴子脑中究竟发生于何处尚有待确定。由于缺乏这些知识,要评价处理假设是困难的,许多乍看起来很美妙的假设常常由于实验的不确定性而停滞不前。

      不管怎么说,处理假设确有某些吸引人之处。它表明,我们或许将意识和无意识这两个词用于许多有差异的活动中。它们或许应该由某些短语如“处理单元”或者在某些情况下由“觉知单元”代替。每个觉知单元具有它自己的半全局表象,通常覆盖几个皮层区域。它们可能具有各自的特征处理时间,各自对应于极短时记忆的特征时间(如,V1区非常短,而高级皮层区域则较长些),以及,更重要的是,它自己的特殊的表象形式:Vl区的简单特征,下一个更高皮层表达的2.5维物体,等等,每一种形式的处理单元的特性会依赖子那种特殊表象的内容和组织,有可能每个特殊的丘脑区域都使用它自己的注意形式,允许它的皮层区域集团中的神经元发送信息到丘脑的神经元,而丘脑的神经元又将信息反馈回去,如此通过某种方式来协调它们的发放。这里还有一种推测性的观点(在第十六章 描述),即丘脑一皮层一丘脑回路可能是紧密地关系到极短时记忆的回响回路。

      当然,在许多不同皮层区域之间有复杂的、并不通过丘脑的直接连接,如图52所示。处理假设并不意味着神经元活动仅有一种流动方式,即从较低处理单元到较高单元。几乎可以肯定存在多个方向的信息流动。

      这并不意味着丘脑自己能产生觉知的所有的不同形式。除了丘脑以外,形成觉知还需要各个皮层区域的电活动,这就像指挥需要演奏乐曲的管弦乐队一样。①(由此)至少可以说,如果你对视觉觉知或者意识的其他方面感兴趣,那就不能忽略丘脑。有人或许会元视那“微不足道”的侧膝体,说它不过是一个中继站。但是研究视觉系统的学生会间道:“那为什么一定要有丘脑后节结呢?”这并不是脑中一小块不重要的区域;事实上,它在灵长类进化过程中变得越来越大。它可能具有某些重要的功能,但那又是什么呢?尽管在细节上比较含糊,处理假设确实提出了一种可能性。

      丘脑是意识过程的一个关键的参与者。这并非一个新观点。很早以前怀尔德?彭菲尔德(Wilder Penfield)①就提出过这个观点。詹姆斯?纽曼(James NeWman)和伯纳德?巴尔斯(Bemard Baars)在新发表的一篇文章中扩展了后者的观点(这在第二章 有简短的讨论),提出,丘脑区的称为“层内核”的某些核团把信息传播到他们所假想的全局性工作空间。这些核团中有一个称为中央核,与视觉系统密切相关。它们主要投射到脑的一个重要的部分――纹状体,也有较少的一部分投射到许多皮层区域。纹状体与运动系统有很强的连接,但它的某些部分也可能涉及更具有认知特性的问题。它是脑中帕金森氏病侵袭的部位之一。

      每个层内核向外发出何种具体信息,这尚有待探索(2)。纽曼和巴尔斯也很强调丘脑的网状核的作用(在第十章 描述)。就像我曾经考虑过的,他们相信网状核可能参与了对注意的控制。目前还不清楚网状核在丘脑中是否能执行所要求的选择性的程度。它或许只有一个功能,就是当脑处于睡眠或清醒等状态期间全面控制丘脑和皮层的活动。如果丘脑确实是形成意识的关键,网状核很可能参与了意识的某些控制。

      这里还须简述一下另一个脑区,即屏状核。它是靠近“脑岛”(皮层的一部分)附近低级皮层区的由神经元组成的薄片。其输入主要来自皮层,而大部分输出也返回到皮层,因而它犹如皮层中的一颗卫星。它接受来自许多皮层区域的输入,并可能向它们全体发回连接。皮层某些视觉区域(但不是全部)投射到它的一部分,(在猫脑中)在那里形成一个单独的视网膜区域对应图。这些视觉输入与其他屏状核的输入可能有所重叠。近几年似乎很少有关于猴子屏状核的工作,因而上面所说的可能有某些不准确之处。(例如,那里可能有两个视觉投射图。)

      屏状核的功能尚不为人所知。为什么所有这些信息会汇总到一个薄片呢?人们或许会猜测屏状核具有某种形式的全局功能,但没有人知道那是什么。尽管它只是脑中一块相当小的区域,但也不可完全忽视它。

      处理单元很有可能存在一个等级式系统,从某种意义上,有些可能对其他的部分执行某种类型的全局控制。还有一些神经元群(如屏状核和丘脑的层内核)向皮层有很广泛的投射,它们可能就扮演这种角色。

      回顾以上两章可以看出,目前并不缺乏看似合理的观点和实验。令人失望的是,目前看来还没有一些观点能以令人信服的方式组织在一起,以形成一个详尽的、貌似正确的神经假设。如果你觉得我就像在丛林中摸索道路,那你是完全正确的。研究前沿领域时,情况通常会这样。但现在我确实感觉到比十年前对“关键问题是什么”有了更深刻的理解。我甚至常对自己说,我能瞥见某些答案。不过这是人们长久地研究一个问题时产生的一种共同的幻觉。我们已经突破到了较高的层次,因此,即使道路还很漫长和艰难,我们已经看到了探索的最佳方向。

      尽管有所有这些不确定性,在仔细考虑所有这些非常分散的事实和推测之后,是否有可能描绘出一些全局性的示意图(哪怕是尝试性的),用来大致指导我们穿过面前的丛林呢?让我抛弃那些谨慎,勾画一个可能的模型。现实可能比它要复杂得多,而不大可能更简单。

      意识是与某种神经活动相关联的。一个合理的模型认为这些活动发生在皮层的较低层次,如第5、6层。这种活动性表达了主要发生在皮层其他层次上的大部分“计算”的局部的(暂时的)结果。

      并非较低层次上所有的皮层神经元都能表达意识。最主要的种类是位于第5层的大的“成簇”的锥状细胞,例如向皮层系统外投射的那些细胞。

      除非这些特殊的较低层次的活动由某些形式的极短时记忆维持不变,否则它不能到达意识。有理由认为,这可能需要一个有效的回响回路,从皮层第6层到丘脑,再返回到皮层第4、6层。如果缺乏这个回路,或者第4层太小,就不可能维持这些回响。因此仅有一些皮层区域能表达意识。

      处理单元(其中仅有一些与意识有关)是这样一些皮层区域的集合(1),它们处于视觉等级的同一层次上,并彼此向对方的第4层投射。每个这样的皮层区域集合都仅与丘脑的一个小区域有强连接。这样的区域通过同步发放协调与它相关的皮层区的电活动。

      丘脑与注意机制密切相关。在进行物体标识操作(特别是图形/背景分离)时所需的特殊捆绑,通常具有调谐的发放形式,它的节律通常在40赫兹范围内。

      参与意识的区域可能影响(不必是直接的)自主运动系统的一部分。(二者之间可能有某些无意识的操作,如思考。)

      再重复一下,意识主要依赖于丘脑与皮层的连接,仅仅当某些皮层区域具有回响回路(包括皮层第4、6层)并具有足以产生明显的回响的强投射时,意识才可能存在。

      这个似乎合理的模型就讲这么多了。我希望不会有人把它称为克里克(或克里克-科赫)的意识理论。在我写下这个模型时,我内心对于材料的取舍颇为踌躇。如果它是别人提出的,我会毫不犹豫地指责它是一碰就塌的纸房子。这是因为它是拼凑起来的,并没有足够的关键性实验证据支持它的各个部分。它唯一的价值在于可能推动科学家和哲学家们从神经的角度考虑这些问题,从而加速意识方面的实验进展。

      更加哲学性的问题又怎样呢?我确信当我们完全理解了意识的神经机制时,这些知识将回答两个重要问题:意识的一般本质是什么?进而使我们可以有意义地谈论其他动物的意识的本质,以及人造机器(如计算机)的意识。意识给有机体带来了哪些好处,从而我们可以发现为什么会有意识。最终或许会发现,视觉觉知的出现是因为它的详细信息需要发送到脑的若干不同区域。把这些信息彻底明晰化可能比把它们以隐含的方式沿着不同的通道传递更有效。具有一个单独的清晰的表象也可以防止脑的一部分使用对视觉场景的一种解释而同时另一部分使用另一种相当不同的解释。当信息仅需要被送到一个地方时,它会按照经验而不必有意识便可以到达那里。

      真正被证明是困难或不可能建立的是意识的主观本质的细节,因为这将依赖于每个有意识的有机体使用的精确的符号体系。除非我们能够把两个脑以一种足够精确和详细的方式联系到一起,否则我们无法直接地把一个脑中的符号体系传递给另一个脑。即便我们能够做到这一点,它或许还有它自身的问题。但是,如果不了解意识的神经关联,我并不相信这些问题中的有哪个能得到会思考的人们能接受的答案。

      我特别要对那些目前相当活跃地工作在脑(特别是视觉)研究领域的许多科学家说几句话。正是他们所持有的相当保守的态度,阻碍了实验研究的顺利进行。

      他们过于看重那些我含糊略过的许多复杂问题。他们不应该用这些错误和忽略作为他们不面对本书的广阔的信息的借口。在我们观看时,脑中发生了些什么呢?忽略这个全局的问题而只研究视觉的某些特殊问题,这种作法现在是行不通的。一个门外汉会认为这种态度过于狭隘,而事实正是如此,就像我试图表明的那样,目前视觉觉知问题在实验和理论上都是可以进行探索的。此外,如果我们积极地面对这个困难,我们会开始从一个全新的角度考虑问题,寻找先前显得无关或很少有兴趣的信息(如动态参数或者短时记忆)。我希望不久以后每一个研究人类及其他脊椎动物视觉系统的实验室都在墙上张贴有一个醒目的标志,写着:

      意识

      就在现在

      =============================================

      ①最近这种观点被哈佛的数学家戴维?芒福德(David Mumford)所发展。吴泉风(音译)送给我的一篇未发表的文章也涉及此。

      (2)人们认为中央核参与了凝视的控制。

      ①某些集合可能仅有一个成员,如Vl区。

    • 家园 第十六章  种种推测

      第十六章  种种推测

      “无论何时我宁愿犯一个前进中的错误,只要它充满不断自我改正的种子。而你就抱看你的僵化的真理去吧!”

      ――维弗雷多?帕雷托(Vilfredo Pareto)①

      在一个指定时刻,某些神经元的发放与视觉感知的某些特性有关联。到此为止所概述的实验将有助于我们去识别这些神经元。在猴子脑的一侧的视觉皮层区域大约有五亿个神经元。是否存在一些线索能将我们引向所寻找的神经元呢?

      存在这样一种可能性,即虽然在任何特定时刻这些神经元中只有一小部分会成为觉知神经元,但它们全都具有扮演这一角色的潜力。从双眼竞争时神经元的行为来看这似乎不大可能(见上一章 的讨论)。不过也有可能有些非觉知神经元却在某些场合起这种作用。更为可能的是存在若干种形式各异的视觉觉知,对应于简单特征的觉知可能十分短暂,而生动的视觉觉知则维持时间更长一些;或许还有一种更深层的形式,它确实是与视觉有关的,但并不与好像出现在脑中的视觉“影像”相对应。我在概述戴维?马尔的观点(见第六章 )和杰肯道夫的观点(见第十四章 )时已经涉及这个问题。为了把问题简化,让我们把话题集中到生动的视觉觉知上(此时杰肯道夫的观点大致等同于马尔的2.5维图)。

      我们的视觉世界的内部图像有一个显著的特征,那就是它组织得相当好,心理学家会很乐意向我们展示它并不像我们常常想像的那样有规律――即,我们对相对大小和距离的判断并不总像工程师的图纸那样精确。但在一般情况下我们观察周围环境的时候很少会把它们弄混。真实的外部世界永远存在于那里,这是事实,因而脑可以利用这一点来检验它可能做出的任何暂时的判断。但是,即便如此,当我们的脑产生一个关于眼前的视觉世界的符号表象时,该表象在空间上仍组织得非常好。

      如果视觉等级所有层次上的神经元都对它们所响应的特征在视野中的精确位置十分敏感的话,这就不会让人感到十分惊讶了。但我们已经看到这并非事实。有的神经元对复杂物体(如一张脸)的反应特别好,而不管这张脸是直接位于动物的凝视中心,还是稍微偏向一侧,甚至比正常的正上方位置更偏一些,该神经元的反应都几乎一样好。这是合理的。对于所有的高层次特征,几乎不可能在每个可能的位置上都有一个独立的神经元与之相对应。不可能有足够多的神经元来完成这个任务。

      另一方面,V1区的神经元,确实对有关特征(诸如朝向、运动、颜色、视差等)在视野中的准确位置敏感。它们之所以能做到这一点,是因为那些特征相对简单且固定不变。同时,这也得益于V1区中处理出现在凝视中心附近的特征的神经元特别多。

      在1974年,心理学家彼得?米尔纳(Peter Milner)发表了一篇颇具洞察力的文章(1)。在文章中他主张,基于上述原因,初级视皮层(如vi区)也像高层视皮层一样被紧密包括于视觉觉知中。他猜测,其实现机制可能涉及了从视觉等级高层的神经元向低层的大量反馈。目前尚不清楚这些反馈的确切功能。由于它们是皮层之间的连接,它们都来自那些传递兴奋性的神经元。关键问题是它们的强度有多大。对此见解各异。有一种可能是,虽然这些反馈足以调节由其他输入引起的任何发放,但通常仅靠它们的强度尚不能使细胞快速发放。这可能意味着其作用对于后续的几个阶段来说大弱,不足以产生影响,如果区域C反向投射到区域B,而B 同样也反向投射到区域A,人们就可能怀疑,除非从C有直接的反馈到A,否则在C发生的事件能否间接地通过B 而对A产生足够的影响。我们将此图解为:

      A<--------B〈----------C

      (仅显示回传通路)。C能影响A吗?或许我们需要一条附加的通路(显示在另外那两条通路的上方)来做到这一点?

      ㄌ……………<………………ㄉ

      ↓↑

      A〈----------B<----------C

      因此我们会问,猴子脑中的哪些皮层区域直接反向投射到了V1区?

      参照图52的连接示意图我们可以看到,几乎所有不高于V4和MT层次的视觉区域确实有直接返回v1的连接,而大多数等级上更高层次的区域则没有这种连接。这是否意味着仅仅是图52中较低部分的神经元直接与生动的视觉觉知有关呢?

      由于皮层V2区也很大,并具有完全的视网膜区域对应,作为一种替代,或许我们只需考虑那些向Vl或V2有反向投射的区域。这将涉及更多的皮层区域,但不包括颞下区域(那些名字以IT开始的区域)。

      我相信这些观点会包含一定的真实性,但其论据是站不住脚的,无法作为引导我们探索的依据。它有所暗示,但并不令人信服。此外,更新的工作表明向回投射到V1区的皮层区域比最初想像的要多。此时最好是在探索问题的过程中暂且将此事记在心里,但并不过多地相信它。在这一阶段,最重要的是更多地去了解关于这些众多的皮层反馈的解剖学和行为学。

      另一种可行的策略是研究在某种意义上觉知是否需要脑与自身的通讯的参与。用神经学的术语说,这或许意味着像杰拉尔德?埃德尔曼(Gerald Edelman)曾经提出的那样,经过一步或多步之后能回到出发点的再进入通路是必不可少的。然而问题是很难发现一条通路不是再进入的。从该判断规则来看,海马是意识的确切位置(由于它的大部分输入来自内嗅皮层,而它的大部分输出回到那里,故是属于再进入的),但事实并非如此。这个反面的结果表明,我们必须小心地使用再进入规则。

      再进入通路最简单的形式也许就出现在仅仅两个皮层区域之间。例如,区域A投射到区域B,而B 也投射到A;但通常这种情况总会出现,它并不能给我们更多的帮助。我们能否将再进入的观点更加精确,并使之更加有用呢?

      回忆一下,对于许多皮层区域,如果区域A投射到B的第4层,那么B 并不投射到A的第4层。反向投射避开了那一层。我们可以用符号表示为:

      <-------

      A B

      ――――>

      其中实线箭头表示“进入第4层”。这表明我们只需在少得多的情况下寻找两个彼此投射到第4层的皮层区域,用上面的约定即是

      <-----

      A B

      ----->

      在图52的等级中,同层次上的皮层区域之间存在这种情况,但不总是如此。MT、V4和V4t就是明显的例子。

      这个观点对我很有吸引力。很容易得到一些理论上的论据,使它具有一定的学术地位。遗憾的是,这种所谓的第4层的精细的神经相互连接细节尚未得到仔细研究。这种观点确实值得关注。

      让我们来尝试一种相当不同的途径。到目前为止我们主要在谈论皮层区域。我们能否更进一步,试着猜测一下皮层的哪些层可能参与了表征觉知呢?或者更进一步,在这几层中哪些类型的神经元可能参与了呢?现在我们确实有了为数不多的零散的证据。

      有一类引人注意的皮层神经元,它们是第5层的一些锥体细胞。它们是投射到皮层系统之外的唯一的神经元(我指的皮层系统是大脑皮层及丘脑、屏状核等与此紧密相关的区域)。可能有人争辩道,在脑中,从某一部分传到其他部分的应当是神经计算的结果。我已经说过,视觉觉知可能就对应于这些结果的一个子集。这使人们对这些特殊的锥体细胞感到好奇,它们还有其他不寻常的特性吗?(归根结底,科学家所谓的“证明”就是在对一个物体或概念的许多显然不同的方面终究达成一致。)事实上,其中一些神经无能以一种特殊的形式发放。许多神经科学家发现这种神经元①趋向于“成簇”发放。他们将电流注入皮层切片上的许多不同的单个神经元中,发现其发放模式有三种类型。第一种对应于抑制性神经元,第二种是大多数锥体细胞,但第三种神经元看来大部分是第5层较大的锥体细胞,它们在这种环境倾向于成簇发放。这些细胞的顶树突延伸到皮层的顶层(第1层),在那里它们可能接受前面提到的反向投射的输入。

      所有这些证据相当粗糙,仍使人不禁怀疑这些第5层的锥体细胞是否与觉知密切相关。即使第5层的锥体细胞确实表达了皮层计算的“结果”,也不能由此得出在各个皮层区域上所有这样的神经元发放时就产生了某种形式的觉知。形成觉知或许还需要其他一些机制,比如说,某些特殊的短时记忆形式,如本章后面讨论的回响回路。

      虽然这些观点还只是推测,它确实勾画出了一种重要性,即当一个神经科学家报告某些实验结果时,他应当知道他所记录的神经元是在哪一层,如果可能的话,还应知道它是哪种类型的神经元。在研究警觉的动物时,这通常会有技术上的困难,尽管更加精心设计的新方法能使之变得容易些。

      更为一般的观点认为我们应更为密切地注意皮层的各个层次。虽然一个神经元的树突和轴突经常延伸到几个层,但细胞体位于哪一层也许在正常胚胎发育过程中是由遗传确定的。(与之相反,神经元的连接细节则主要受它的经历影响。)如果确实存在某些特殊类型的皮层神经元,其发放与我们所看见的相关,那么我们可以期望这些神经元的细胞体仅仅位于一个或少数几个皮层层次或亚层中。

      脑试图理解进入到眼睛的信息,并以一种紧凑的、组织良好的方式来表达它,其结果就是视觉觉知。但除非它对生物体真的有用,否则没必要这样做。可能有几处不同的区域需要它。这些信息在脑中被送到哪些部位呢?两个明显的部位是海马系统(包括事件记忆的临时贮存或编码)和运动系统(特别是它的较高的规划层次)。我们能否从这两个目的地跟踪回传连接来确定皮层上视觉觉知的位置呢?

      遗憾的是,目前这种方法带来的困难比它所解决的更多。视觉觉知很可能与其他感觉(如听觉和触觉)的信息在某个阶段结合。当你喝一杯咖啡胼,你能感觉杯子的外观及用手摸的感觉,还有咖啡的气味和味道。高级视觉区域确实投射到多重感觉的皮层区。目前尚不清楚的是,2.5维略图的生动的表面视觉觉知,以及三维模型的不那么形象化的信息,哪一个与送到海马及运动系统的视觉觉知的类型关系更密切。或许二者均是需要的。

      目前对皮层视觉区、多重感觉区与海马结构之间的解剖学连接已经了解很透彻了(见图52)。它们清楚地表明,视觉区中如V4和MT区以及颞下皮层,并不直接投射到海马。视觉信息必须通过其他皮层区才能到达那里。遗憾的是,当前我们关于这些区域神经元的行为的了解还相当肤浅,还需要作进一步研究。

      目前对到运动皮层的通路已开展了一些研究,但仍有待深入。此外,还有其他路径更为间接地到达运动皮层。从皮层有大量通路到纹状体,有趣的是这些连结也来自第5层的一些锥体细胞。信息从那里传向丘脑的一部分,再传到皮层的多个运动和前运动区。还有一个通路从皮层到小脑,然后返回到丘脑,再到皮层。这些通路中的一些或许参与了“无意识的”、相当机械的活动。如果我们希望了解各种形式的视觉以及其他感官的觉知,还需要更多地通过实验对脑的这些部位进行研究。

      觉知神经元的发放常常可能就是有关的神经网络决策而得的结果,这是它的特点之一。做出公正的妥协是个线性过程,而做出一个敏锐的决策则是高度非线性的。比如说,选举美国总统是一个非线性过程,而按比例选代表则更接近于线性,至少在每个人投完选票以后是这样。神经元及经扩展而形成的神经网络,其行为是高度非线性的,原则上这是没有困难的。

      对于神经元而言,这个机制很可能像总统选举那样是胜者为王过程――即有许多神经元相互竞争,但仅有一个(或极少数)能获胜,这就是意味着它的发放更为剧烈,或以某些特殊形式发放,同时其他所有神经元则被迫发放更慢,或者根本不发放。

      这在人工神经网络中是很容易实现的,只需使每个神经元具有兴奋性输出,同时抑制其他所有竞争者即可。活动最强的神经元有希望压制所有的对手(就像在选举中那样!)但对于真实神经元而言就不那么简单,因为大多数情况下单个神经元的输出只能是兴奋性的或抑制性的,而不能二者兼有。有许多种策略可能避开这个困难,比如,使得所有兴奋性神经元刺激一个抑制性神经元,而后者反过来又抑制所有的兴奋性神经元,那么对平均抑制优势最大的那个神经元则有可能成为胜者。设计一个能令人满意地执行胜者为王操作的神经网络需要一定技巧,但确实是可以做到的,特别是如果允许有不止一个获胜者的话。

      似乎没理由认为自然界不曾进化出这种机制。问题在于如何发现在脑中正在进行这种操作的准确位置。到目前为止我们对皮层内部及附近的高度复杂的局域回路的了解还不够,不能有很大帮助。当然随着我们的知识的增加这将有所改变。人们也许会发现皮层内的神经相互作用十分复杂,以致其中不包含简单的机制。但也可能这种关键过程使用了一些特殊的神经策略,我们所能做到的只有密切注视种种有希望的迹象。觉知并不总要求在两个或多个选择中作出决定(如同看内克(Necker)立方体),这便问题变得复杂化。在其他情况下,在不同来源的信息间达成妥协或许更为有效,例如利用不同的深度线索判断视野中一个物体的距离。反之,在判断一个物体是否在另一个物体的前面并部分遮挡了它时,决策是必不可少的。

      迄今为止我们寻找觉知神经元可依赖的线索相当少,虽然它也指出了一些有希望的方向。我们是否还有更多可循的途径呢?研究短时记忆的神经机制能否使我们获得关于视觉觉知的一些有用的东西呢?事实上似乎可以肯定没有短时记忆我们便不会有意识,但它应该短到何种程度,它的神经机制又是什么呢?

      回想一下,记忆有两种主要类型。当你主动回忆某件事情时,必定在你的脑中某些地方有神经元发放来表达这个记忆。然而。你能记忆许多事情,诸如自由女神像,或是你的生日,但在某一时刻你并不在回忆它们,一般情况下,这种潜在的记忆并不需要相关的神经发放。在贮存记忆时,许多突触连接的强度(以及其他参数)被改变了,使得在给定合适的线索后,所需要的神经活动能被重新生成。这样记忆就贮存在脑中了。

      活动回忆和潜在记忆,(这两种记忆形式中)哪一种参与了我们所感兴趣的极短时记忆呢?比较可能的是活动形式的记忆,即,你对一个目标或一个事件的立刻的记忆很可能是以神经的主动发放为基础的。这又是怎样发生的呢?我认为至少有两种可能的方式。

      由于神经元具有的某些内在特性,如它的许多离子通道的特点,一旦它被激发之后,可能会持续发放。这种发放会持续一段时间后消退,或者该神经元在接受到某些使它停止发放的外界信号之前一直发放。而第二种机制则有很大差别,它不仅涉及神经元本身,还与其他神经元的连接方式有关。可能存在一些“回响回路”,即由神经元组成的一个闭环,环上的每个神经无要使下一个神经元兴奋,并保持这种活动性不断地循环。这两种机制都可能出现,它们并不互相排斥。

      此外,是否可能具有某些潜在形式的短时记忆呢?这将意味着参与的神经元开始受到刺激而发放,继而停止发放:但如果有一个足够强的线索唤醒潜在记忆而成为活动记忆,这些神经元会迅速再度开始发放。但是,除非第一轮的发放在系统中留下了某些痕迹,否则这又怎能发生呢?或许,有关的突触强度(或其他神经元参数)能瞬间改变,可以在短时间内体现这种短暂的潜在记忆?事实上,是否有实验证据表明存在这种突触的瞬间改变呢?附带提一下,克里斯托夫?冯?德?马尔斯博格(Cristoph von der Malsburg)在前面提到的一篇相当难以理解的理论文章中曾提出这种变化。

      克里斯托夫有所不知,此前已有一些关于瞬间突触改变的实验证据。它们最早是在50年代被发现的,位于神经和肌肉结合的地方(即激发肌肉的神经与该肌肉接触的地方),离脑很远。不久以后,在海马也发现了类似的瞬间突触改变(综述见参考文献6)。当轴突脉冲到达一个突触时,它几乎同时改变了该突触,以使该突触强度增加。一个快速脉冲序列可产生一个较大的增长。这种突触强度的增加随后以一种复杂的方式衰减,有些较快,约50毫秒;而慢者衰减时间在几分之一秒到一分钟左右。这正是短时记忆所涉及的时间。还有一些证据预示这也出现在新皮层的突触上。看来这主要是由突触的输入一侧(突触前侧)的改变引起的,并可能牵涉到附近的钙离子,以及突触结合处附近的突触囊泡的运动。①无论是何原因,几乎可以肯定它是存在的。其大小是可察觉到的。

      遗憾的是,现在关于这些瞬间改变的工作极少,这主要是由于突触强度的长时程改变(一个当前很热门的话题)更容易研究。大多数神经网络的理论工作也没有考虑这种情况。因此我们处于很奇怪的境地:一种对意识(特别是视觉觉知)可能是十分重要的现象,同时被实验学家和理论学者忽略了。

      或许这种突触权重的瞬间改变对短暂维持回响回路也是重要的。有关突触强度的增加有助于回路保持其回响发放。

      如何防止这种持续的发放过度传播井影响其他回路,这个问题更困难。脑中有大量的复杂回路,因此如果回响回路确实存在的话,要限定它的准确位置几乎是不可能的。这种类型的回响(与活动的短时记忆有关)是否可能仅出现在一个或少数特殊的位置呢?是否有迹象表明这种回路在构建时与附近具有相同形式的回路多少有些隔离,从而使记忆不会以一种无控制的方式传播呢?

      有一条回路被认为可能参与了极短时记忆。它从丘脑投射到皮层第6层的一类锥体细胞,而这些细胞又有信号返回丘脑的同样部位。这些丘脑神经元和皮层神经元都只有极少的向侧边伸展的轴突侧枝,这样它们可能极少与其近邻有相互作用。这使它们具有刚才提到的部分隔离性质。

      对通路的研究主要集中在皮层V1区及其到侧膝体的连接。其中从侧膝体到第6层的锥体细胞的前向通路,看上去很弱。回传通路从第6层到侧膝体,具有极大量的轴突,可能是从侧膝体到第4层这一主要的前向连接的5至10倍。这本身很令人吃惊,特别是很难发现它们具有什么功能。然而,有关这一通路的大多数实验是在动物被麻醉情况下进行的;此时极短时记忆可能很弱甚至不存在,因而动物是无意识的。利文斯通和休伯在数页前提到的文章中,指出他们发现侧膝体神经元的活动在慢波睡眠时降低了。这可能产生影响。虽然信号能从侧膝体传到皮层V1区(如他们发现的那样),但这些信号不够大,无法维持任何回响活动。现在已经知道有来自脑干的通路可以在慢波睡眠期改变侧膝体的活动(同时,通过延伸也可改变丘脑其他部分的活动)。

      那么可以假设这些第6层的神经元与意识的一个关键因素――维持体现极短胼记忆的回响回路――紧密相关。这与早期的一般观点是一致的,即主要是皮层较低层次的活动一般与意识有关,特别是与视觉觉知有关。

      是否可能存在与所有皮层区域关联的这种回响回路呢?换句话说,是否所有的皮层区域都在第6层具有锥体细胞投射到丘脑的某些部位并从那里向回投射到同样那些第6层的锥体细胞呢?很遗憾,我们对此尚不完全清楚。或许只有感觉处理(它们具有可察觉的第4层)的低层及中间层次具有这种短时记忆形式所需要的第6层的回响回路。这也是杰肯道夫提出的有意识的觉知所需要的。或许一个到第4层的较强的输入能使第6层的回响回路激起更大的活力。如果所有这些都被证明是真的,这把脑结构和杰肯道夫的假设有意义地联系在一起。这种可能性令人振奋。

      让我们先把这些推测放到一边。是否有证据表明神经元的持续发放与短点记忆的某些形式有关联呢?在前人工作的基础上,那鲁大学的帕特丽夏?戈德曼-拉基克(PatriciaGoldman一Rakic)和她的同事们做了这样的实验。他们训练一只猴子凝视电视屏幕中央的一个点,同时在屏幕其他地方随机地呈现一个目标刺激。当目标不再呈现,经过一段延迟后,要求猴子把眼睛移到刚才目标所在的位置。实验者研究了动物脑前额叶区视觉神经元的反应。通常当目标在屏幕的一个特定地方呈现时,有一个特定的神经元会对它作出响应,而其他的神经元则会对屏上不同地方的目标作出响应。引人注目的是,这种神经元通常在刺激被撤掉后许多秒仍能维持发放,直到猴子做出反应。此外,如果这种活动不再保持下去(这偶尔也会发生),猴子很可能会出错误。简而言之,看来这些神经元像是对应视觉特定的空间位置的工作记忆系统的一部分。①或许在脑中其他地方还有这种系统对应于其他类型的工作记忆。这样我们至少有一个例子是神经元的持续发放参与了短时记忆,②虽然其他情况下的证据还有怀疑。

      注意到这是一个单一的任务,因此猴子可能在延迟中在脑中重复这个任务,如果猴子必须执行两种迎然不同的任务的话,神经元的活动情况又会如何,尚不得而知。我们也不了解维持这种持续发放的神经机制。就像对注意的研究一样,我们可以说对短时记忆的神经机制的研究已经开始,但要揭示其奥秘还需大量的实验工作。

      ============================

      ①维弗雷多?帕雷托(1848一1923),意大利经济学家和社会学家,他在华莱士之后将数学应用于经济学,他的关于社会的精英理论对后来的墨索里尼的法西斯党有很大影响。――译者注

      ①这篇文章是他在休假时写的,并不太为人所知。克里斯托弗.科赫和我都没听说过。幸运的是,1991年我们和彼得在亚利桑那州参加一次会议,他向我们谈到了这篇几乎被忘记的文章。在这篇文章中他还提出了解决捆绑问题的相关发放观点。这些年来斯蒂芬?格罗斯伯格、安东尼奥?达马西欧、西蒙,厄尔曼等人对这些回传通路的功能提出了类似的观点。

      ①这些神经元产生的轴突脉冲并不完全很规则,但时间间隔并不随机;相反地,它们倾向于在一个时刻产生一短簇几个脉冲,而不同簇之间具有较长的间隔,并只有极少的脉冲,甚至没有脉冲。

      ①如果它们仅仅是突触前的――它们并不依赖于突触后侧发生的一切――它们就不可能像冯?德?马尔斯博格所要求的那样是赫布型的。是否存在赫布型的瞬间改变尚在研究中。非赫布型的瞬间改变尚在研究中。非赫布尔型的瞬间变化则长时期被理论家所忽略。

      ①他们也使用2-脱氧葡萄糖技术,显示与前额皮层连接的区域,诸如海马结构,后顶皮层,以及丘脑的中背核,在这样的任务时活动更加剧烈。

      ②遗憾的是,这些神经元的发放方式并不能证明回响回路的存在。

    • 家园 第十五章  一些实验

      第十五章  一些实验

      “仅仅通过纯粹的逻辑思考,我们不能获得关于经验世界的任何知识。”

      ――阿尔伯特?爱因斯坦

      猴子脑中的一个特定神经元也许会对视野中某块特定区域的颜色敏感。但是我们又如何确定它直接参与了对该颜色的知觉呢?比如说,也许它只是脑把注意引向视野中那块区域的系统的一部分。倘若如此,一个人由于脑部损伤而失去了感知真实颜色的神经元,那么他所看到的世界只有黑白两色,但他的注意仍可能被引向一个色块。

      这不只是一个抽象的可能性。牛津的阿兰.考维(Alan Cowey)及其同事详细地研究了一个由于脑部损伤而失去了颜色知觉的人(通俗他讲,他看不见颜色、只能看到黑色、白色及不同浓淡的灰色)。他们指出,实验中只要把两个小的颜色方块(被调节成等亮度)紧挨在一起,被试者就能说出两个方块的颜色是否相同。而事实上该被试者坚决否认他能感知两个方块的颜色。如果两个方块不挨着,他便无法完成这个任务,他的判断完全是一种猜测。这相当清楚地表明,脑在不感知颜色时仍能利用关于颜色的部分信息。

      *****

      为了发现猴子脑中某些神经元的反应是否与它所见到的事物有关,斯但福大学的威廉?纽瑟姆(wiiliam Newsome)做了一系列卓越的实验。实验中选择的皮层区域是MT区(有时称为“V5”)。这里的神经元对运动响应良好,但对颜色没有直接反应,或者根本不响应(见第十一章 )。已经有实验表明,该区域受损伤后猴子对视觉运动的响应变得困难。不过这种障碍常常在几周后逐渐减弱,这或许是脑学会了使用其他通路的缘故。

      继其他人的早期工作,纽瑟姆和同事们首先研究MT区的单个神经元对选定的运动信号怎样作出反应。这些信号是由显示在电视屏幕上的快速变化的随机点图组成的。一种极端情况是所有这些瞬变的点都朝一个方向运动。这种运动很容易被识别。另一种极端是使这些点的平均运动为零,这就像更换在电视频道时,屏幕上有时会看到“雪花”一样。观察者必须报告运动是沿给定的方向还是相反方向,当平均运动为零时,结果是随机的。

      纽瑟姆和同事们使用了这些闪烁图案的各种组合。如果所有的运动是朝一个方向,猴子(或人)总能正确地发出信号报告该运动方向,如果只有部分点朝一个方向运动而其他各点作随机运动,则观察者有时会犯错误。沿该特定方向运动的点所占的比例越小,犯错误就越多。通过改变这个比例,就有可能画出一条观察者的准确度与具有相同运动方向的点所占的百分比的变化关系的曲线。①使用一种特殊的数学手段,找出那些正以最有效的方式判断运动方向。

      他们总共研究了二百多个不同的神经元。其中大约三分之一的神经元判断的准确度与猴子相当。有些判断很差,但另一些对运动的判断比猴子要好得多。那么,既然猴子脑中有这些皮层神经元,为什么它不能更成功地做出判断呢?最可能的回答是,猴子不能仅仅选择一个神经元(即判断最有效的那个)来控制它的反应。它的脑必定使用了一群神经元。现在还不清楚它是如何做到这一点的。

      这个实验的确说明了做出选择所需的视觉信息存在于MT区的神经元的行为之中,因此我们不能说那些神经元不能完成这个任务。遗憾的是,这并不能证明它们确实执行了这个任务。

      纽瑟姆的下一个实验则更深入一步。他和同事们提出了这样一个问题:当猴子进行较难的鉴别任务时,如果我们能适当地刺激MT区的神经元并便它们发放,猴子的判断能否得到改进呢?

      从技术上讲要仅仅刺激一个神经元并不容易。幸亏在皮层MT区,具有相似反应形式(即对视野中一个特定部位的一个特定运动方向反应)的神经元通常彼此形成一簇。这样用电刺激靠近目标神经元的那一小块区域,很有可能使这些具有相似特征的神经元一起受到刺激。

      他们一共做了62次实验。其中大约半数情况下电流刺激明显改善了猴子对运动的鉴别,这是一个相当惊人的结果。它意味着通过使视皮层中适当位置的神经元兴奋,我们可以改变猴子对特定视觉刺激的反应方式。电流必须加在这一特定位置。如果电流刺激皮层MT区其他位置则对猴子完成这种特殊任务几乎没有影响。

      这是否意味着MT区的一小块区域包含在识别那种运动的神经相互关联之中呢?这当然是可能的,但要肯定这个结论还有不少困难。

      可能有一种反对意见是,虽然猴子表现出了恰当的(鉴别)行为,但实际上它并没有看见任何东西。它仅仅像个自动机器那样做出反应,而并没有视觉觉知,要确切地回答这种反对意见必须完全了解猴子和人的视觉系统;因此,在目前,我们只能假设猴子具有视觉觉知,直到有证据表明并非如此。

      人们还可能争论说,即便猴子具有视觉觉知,但它在完成这个特殊任务上并未形成视觉觉知。看来这不大可能,因为在这一任务中猴子和人做出的选择是类似的,也就是说,他们的心理测量曲线是相当一致的。猴子的表现并不比人差很多。很可能是二者的脑运用了相似的机制;不过,还有一个困难。

      如果一个人重复进行这项任务,他的行为差不多常会变成机械了,他会报告说他几乎没有瞥见这个运动,尽管如此,他的选择却比随机情况要好得多。由于不能用语言向猴子描述这个任务,故它比人更难训练。纽瑟姆的猴子可能经受了过度的训练,因此它们的行为或多或少变得机械了,而几乎没有什么视觉觉知参与。

      我怀疑这种反对意见是否很重要。因为当所有的闪烁光点向一个方向运动时,我们很清晰地看到了这个运动,几乎可以肯定猴子也看到了。遗憾的是,由于猴子已能近乎很好地完成任务,在这种情况下刺激电流引起的差异微乎其微。或许可以进行这样一种实验,先让猴子学习鉴别另一种运动刺激(如一个有朝向的棒)的运动方向,并在它被过度训练之前进行这种运动光点的测试。这种实验具有一定的风险,因而并不容易做,但或许值得一试。

      一种更激烈的反对意见是,虽然皮层MT区的神经元的行为看上去与猴子的鉴别有关联,因而也可能与视觉觉知有关,但这并不意味着这些特定的神经元就是产生觉知的地方。它们可能通过发放影响其他的神经元(或许是视觉等级的其他部位)。而那些神经元才是真正与觉知相关的。

      要回答这个问题,唯一方法是研究其他皮层区域。如果我们在其他地方不能发现具有相似的鉴别能力的神经元,则MT区的神经元与觉知相关的可能性便增加了。从长远考虑,在我们更多地了解全部视觉区域,特别是它们如何相互连接之前,我们不可能寄希望于能将视觉觉知的区域限定下来。无论如何,纽瑟姆的一些实验在这一研究方向上迈出了非常重要的第一步。

      如果视野中的某些刺激引起有关神经元发放,我们自然会猜测该神经元可能是与那些刺激相关的神经对应物。不过,正如刚才解释的那样,这种结论并非必然。是否有某些更有效的方法可以缩小搜索觉知神经元的范围呢?我们能否找到这样一种情况,其中视觉输入保持恒定,而知觉却在变化?那样我们便可尝试去寻找猴子脑中哪些神经元的发放随输入的变化;更重要的是,哪些神经元是随知觉而变的。

      一个显著的情况是观察内克立方体(见图4)。此时图形保持不变,但当我们把它看作三维时,开始时知觉是一种形式,然后又变成另一种形式,如此下去。目前并不清楚脑中什么部位具有关于三维立方体的知觉。我们应该研究某些容易在猴子视觉系统中定位的情况。

      一种很值得注意的可行性是基于已知的双眼竞争现象。当两只眼睛接收与视野中同一部分有关的不同视觉输入时,这种情况就会出现。头部左侧的初级视觉系统接收视野中双眼凝视点右侧的输入信息(右侧则与此相反)。如果两侧的输入不能融合,而是先看到一个输入,再看到另一个,如此不断交替,则这两种互相冲突的输入称为是“竞争的”。

      你可以在旧金山的博览会看到一个颇具戏剧性的双眼竞争的例子。它是由萨莉?杜宁(Sal1y Duensing)和鲍勃?米勒(Bob Mlller)设计的。在博览会的演示中,观察者把头放在一个固定的位置上并要保持凝视点不动。通过一面适当放置的镜子,观察者的一只眼睛能看到他面前的另一个人的脸,而另一只眼睛看到的则是侧面的一个空白的屏幕。如果观察者在这个屏幕前晃动他的手,则在他的视觉中,脸从原来的位置上被抹掉了!手的运动在视觉上非常显著,从某种意义上吸引了脑的注意。若不注意的话,是看不见脸的。如果观察者移动他的眼睛,脸又会重新出现。

      在某些情况下消失的只是脸的一部分。例如,有时还会留下一只或两只眼睛。如果观察者看的是一个人脸上的笑容,此时会出现脸消失了而只留下微笑的情况。由于这个原因,这种效应被称为“柴郡猫效应”(Cbeshire Cat effect,是以《爱丽丝漫游奇境记》中的猫命名的)。你可以自己用一个简单的袖珍镜子做试验。结果非常有趣。如果被观察者和观察者的手后面都是均匀的白色背景的话,实验效果会更好。

      到目前为止尚未对猴子进行这种实验。在麻省理工学院进行过一种简单得多的实验。尼科斯?罗格赛西斯(Nikos Logothetis)和杰弗里.萨尔(Jeffrey Schall)训练猕猴对看到的向上或向下运动的水平光栅作出判断。为了产生双眼竞争,向上运动的光栅被投射到猴子的一只眼睛,而向下运动的则投射到另一只眼睛,并使两个影像在猴子的视野中重叠。结果猴子交替发出信号表示它看到了向上和向下的运动,这和我们所会作出的反应是一样的。请注意,到达猴子眼中的运动刺激总是一样的,而猴子的感受大约每秒钟改变一次。①

      皮层MT区主要检测运动而对颜色不感兴趣。当猴子对运动的感觉有时向上有时向下时,短时间内MT区的神经元的行为是怎样的呢?回答是,有些神经元的发放与感觉有关,而其余的神经元的平均发放率则相对地保持不变,与猴子当时看到的运动方向无关。(实际数据要比这简单的描述杂乱得多。)

      这一结果表明,在某一时刻,不可能所有的视皮层神经元的发放都与我们的视觉感受有关。当然,如果有更多这样的例子,情况就会更好些。遗憾的是,这并不能准确地限定出觉知神经元的位置。如同对纽瑟姆的实验的解释一样,真正的关联或许是视觉等级系统其他地方的神经元的发放,而它们受到了MT区的那些神经元发放的影响(至少是部分受影响)。拉马参准曾经提出,这种竞争可能不是一种真实运动的竞争,而是一种形状的竞争,其真正的位置或许在于视觉等级系统较低的层次,或许是皮层V1区或V2区。同样,即使某些觉知神经元确实位于MT区,目前的结果并不能证实它们是哪些神经元。它们在哪些皮层区呢?哪些类①时间间隔遵从r 分布。型的神经元趋向于随知觉而不是视觉输入而改变呢?正如对纽瑟姆的结果的讨论一样,这里同样存在着猴子被过度训练的可能。尽管这种可能性不大,因为训练对竞争的影响很小,但仍引起忧虑。再说,即使有所保留,这些也是很重要的实验。进一步的研究将会把我们引向用神经术语来解释视觉觉知。

      在其他条件下,是否还会出现视觉输入不变而知觉却由于某种原因发生变化的情况呢?当然,有时观察者会突然“看见”一个原来并未发现的物体,如图9中的隐藏着的达尔马提亚狗一样。但要在猴子身上进行这种研究并不容易。人们会说:“瞧,我现在看见一只狗。但我以前却没看见过。”而让猴子告诉我们这些则困难得多。此外,一旦观察者从图中辨认出那只狗,在随后的实验中他通常能直接认出它。因而要多次重复同样的实验是困难的。而这种重复正是取得科学的可靠结果所必需的。

      一种可能性就是研究从觉知中逐渐消失的图像在脑中产生的影响。这些影像是稳定在视网膜上的。(回想一下,我们通常通过各种各样小的眼动来防止这种消退。)初通过在眼球上放置一个小的装置来将图像稳定在视网膜上,这使眼睛感到很不舒服。它能将选定的光学图案投射到视网膜上。不管眼睛如何运动,图案一直保留在视网膜上的同样位置,因而会逐步褪去。50年代时曾进行过多次这类实验,但此后,虽然产生稳定的影像的装置更精密也更舒服,但这类实验似乎却不再进行了。

      人们或许认为这种消退过程主要发生在视网膜,因而对我们来说兴趣不大。但看来这不大可能是真的。这些早期的研究表明复杂的图像并不总是以一个整体消退。一条直线常被作为一个整体,但是构成一个方块或三角形的几条边却可能独立地消失。锯齿形的图形不如弧形稳定。格式塔心理学家所谓的“好的图形”比“差的图形”的活动更具整体性。如果有一个图案是一个大写字母B,并有粗糙的弯曲线穿过,弯曲线通常比字母日更早褪去。这表明消退主要发生在脑中,而不是在眼睛里。因此我们值得去做一些尝试,比如去训练一只猕猴,使它能在清醒状态下用信号表示它所见到的东西。将各种不同的图案固定在它的视网膜上,观察当部分影像从觉知中褪去时哪些神经元受到了影响。

      另一种可能性是对拉马参准的引人注目的实验报导(见图19)进行进一步研究。人为地损坏猴子皮层V1区的一小部分可造成一个局部盲区(称为“盲点”)。该实验涉及到由静止的两条未排成一线的平行线段在触及这个盲区时产生的表观运动。如果我们能训练猴子用信号报告,区分运动和静止、对准和错开、中断和连续等各种情况,那么这项研究就有可能在猴子身上进行。据我所知,迄今为止还没有人做这种尝试。

      已经有人在猴子的真正盲点做了一项简单的实验。(关于我们盲点的心理学描述,请见第三章 。)V1区有一个区域与盲点相对应,在这里皮层仅接受来自一只眼睛的直接输入,而另一只眼的光感受器不能覆盖视野中的这一部分。(回想一下,脑中一侧的V1区的大部分神经元均接受来自双眼的输入,虽然它只处理视野对侧一半的信息。)人们或许认为育点区域内的神经元仅对来自一只眼的信号有反应。令人吃惊的是,这并非事实。里约热内卢联邦大学的里卡多?伽塔斯(Rlcardo Gattass)和同事们已经证实,猕猴的盲点区中有些神经元确实对来自双眼的输入有反应。这种令人意想不到的、来自在该区域是局部上盲的眼的输入,或许直接或间接地来自邻近的接受双眼输入的皮层组织。不管它来自何处,实验表明,V1区盲点上的神经元按第三章 所述的方式发放脉冲对讯号作出反应,对外界图形实现填充。同时,这决定性地否定了丹尼特(Dennett)的观点(在第四章 作过概述)。这样简洁的例子却说明了一个普遍原理:无论何时你清楚地看见视觉场景的某个特征,那么一定有一些神经元在发放,它们的活动显而易见地象征那个特征。(另一个关于这个原理的例子是第十一章 描述的对主观轮廓的神经反应。)

      与通常的视觉输入引起的神经反应的例子相比,这个特殊的盲点现象没给我们提供多少关于觉知神经元定位的信息。如果它能像早期建议的那样扩展一下,研究对于不变视觉输入下的感觉的变化情况(如图19),那对我们的探索是有所帮助的。

      另一个途径是研究在哪些情况下不同的视觉输入会产生相同的知觉,或者至少是产生了这种知觉的某些组成单元。一个例子是索尔克研究所的汤姆?奥尔布莱特(Tom Albright)和合作者在猕猴皮层MT区做的实验。结果表明,即使所研究的运动物体有相当大的差异,MT区的某些神经元的发放也具有非常一致的特性。比如,一块波纹穿过视野运动,它们在MT区引起某些神经元的发放,与一根直棒在相同位置朝相同方向运动的效果大致相同。尽管图案不同,但它们的运动却很相似。(他们把这称为“形状一线索不变性”。)

      到目前为止他们尚未证实这种神经元在类型、定位或发放行为上是否存在特别之处。如果它们是觉知神经元,我们也许希望,不管输入信号是什么,它们的发放(或是其中某些特性)总与视觉知觉相关。

      由于至今证据仍不充分,因而有理由提出这样一个问题:人们能否精确地研究在动物警觉及处于无意识状态下同一个神经元的行为呢?由于技术上的原因,当动物被麻醉而处于无意识状态时做这样的实验是很困难的。不过有实验比较猫在警觉状态和慢波睡眠的情况。①

      1981年神经科学家玛格丽特?利文斯通(Margaret Livingstone)和戴维。休伯发表了这样一个实验。他们研究的神经元大多在皮层V1区。②动物的眼睛是睁开的,因而即便在慢波睡眠时V1区的神经元也对放置在动物面前的屏上由计算机产生的视觉信号作出反应。当他们记录到某个特定神经元的反应时,他们把动物唤醒,并用它刚看到的同样刺激再次测试。

      当动物清醒时,他们研究的每个神经元的反应形式与睡眠时大致相同,也就是说,如果它对视野中某个位置的具有一定朝向的直线敏感,那么无论动物是处于清醒状态还是睡眠状态,它的最佳刺激都是一样的,只是清醒时通常信噪比要好一些。①不管怎样,有相当数目的细胞的发放率在动物清醒后比睡眠时要高。或许这没什么可惊讶的,而令人感兴趣的结果是,皮层较低层次(第5、6层)的反应的改变比高层更为显著。

      他们使用一种化学物质(有放射性的2-脱氧葡萄糖)来证实这个一般性结果。这种物质可以显示在这些皮层层次由视觉刺激产生的平均行为。这些行为是在大约半小时内的平均结果。一种情况下动物处于清醒状态,而在动物睡眠时则使用一种不同的放射性同位素作为对比。结果大致是相同的。当动物有意识时,皮层较低层次的行为有显著改变,而较高层次的变化却很小。

      这促使人们得出这样一个广泛的推论,它远超过目前的证据。这就是,皮层较高层次的活动主要是无意识的,而至少有部分低层神经元与意识有关。我必须承认我过分地喜爱这个假设。如果确实如此的话,那将会是十分美妙的。但我不能全身心地接受它,或许有其他原因使得慢波睡眠时较低层次的活动变弱。

      通过研究注意机制,我们能够得到对有关觉知的任何知识吗?关于注意的神经机制的实验研究已经进行了一段时间。一些实验是在清醒的猴子身上做的。他们记录了当猴子在完成特定视觉任务时脑多个部位神经元的发放,也有一些实验对人使用如第八章 所描述的PET扫描。我不打算重复所有这些实验;相反地,我将只简述其中一个实验及其结果。

      马里兰州贝塞斯塔(Bethesda)的国立精神卫生研究所的罗伯特?德西蒙(RobertDesimone)和同事们曾经训练猴子凝视视觉显示一侧的一个点并(目不转睛地)注意该显示的某个特征卜。随后闪现各种信号。实验者研究了在皮层V4区的一个特定神经元对该位置上的视觉显示的响应,V4区的神经元对颜色更敏感。假设研究的神经元对具有一定朝向的红色棒有反应,而绿色的棒对它没有影响。(当然,此时V4区中未被研究的其他神经元,有些也会对绿色棒而不是红色棒有反应。)每次显示均包括两种颜色棒,一根红色的(对该神经元为有效刺激),而另一根为绿色(无效刺激)。二者均在神经元的感受野内。当猴子注意红色棒占据的位置时,神经元的发放与猴子不注意时相同,或者更高些。①然而,在那些猴子注意绿色棒的实验中,这个对红色敏感的神经元的发放降低了。因此,注意不仅仅是个心理学的概念。它的影响可以在神经元水平上观察到。当猴子注意某处时,对被注意刺激敏感的神经元发放会增强,而当猴子注意其他位置时,尽管眼睛的位置以及输入的视觉信息与上次完全相同,那个神经元的发放也会减弱。

      他们这样描述所得的结果:

      V4区的神经元……具有如此大的感受野,以致许多刺激都落入其中。人们也许期望这样的细胞的行为就反映了其感受野内所有刺激的特征。然而已经发现,当猴子将其注意局限在一个V4区……细胞的感受野的一个位置时,该细胞的反应首先由被注意位置上的刺激决定,就好像感受野围绕着注意到的刺激渐渐“收缩”一样。

      由于理解它们并不容易,我就不详细描述他们的结果了。他们指出,关于注意的探照灯的简单理论似乎并不正确。要解释它们需要更复杂的机制,而这种机制尚未建立。丘脑是否参与了注意呢?作为“皮层的入口”,丘脑具有许多相当不同的区域,其中有些与视觉有关。从眼睛到皮层的主要通路需要经过侧膝体(the LateraI Genicu1ate Nucleus,缩写为LGN)。侧膝体是丘脑的一部分(见第十章 的描述)。(灵长类)其他丘脑视觉区位于称为“丘脑后结节”的区域。①它是一个大的丘脑核,比侧膝体显然要大得多。

      贝塞斯塔的国立眼科研究所的戴维?李?罗宾逊(David LeeRobinson)和同事们在猴子的丘脑后结节的一部分做了大量实验。看来,引起丘脑后结节反应的特征依赖于它们来自视皮层的输入。而不是来自上丘。②

      如果通过化学手段使丘脑后结节的一小块区域的抑制增强,猴子转移注意会更困难;相反,降低抑制将使转移变得容易。其他人进行的一些实验表明,丘脑后结节扮演的角色是抑制来自无关事件的输入。对三名丘脑损伤患者的研究表明他们形成注意有一定困难。对正常人的PET扫描显示,当视觉任务分散注意力时,丘脑后结节的活动增强。这些干扰物使得被试用更多的注意来完成任务。所有这些结果(综述文章见参考文献13)有力地表明丘脑的这些部分与在视觉注意的多个方面密切相关。①

      这里尚有广阔的领域可以从事进一步的工作。需要进一步更细致地研究上面提到的每个丘脑后结节区的准确连接。比如说,几个视网膜区域对应区的连接方式有何不同?我们能否更准确地了解丘脑后结节的每个特定部位如何影响注意,以及它如何与和它相关的各个皮层区域的神经元相互作用呢?进一步的实验工作应当能回答这些问题。(我在第十六章 对关于丘脑后结节不同区域的一些推测性想法进行了讨论。)

      我们从对丘脑的研究中得到了多少关于视觉觉知的神经机制的知识呢?既然注意对觉知是重要的,忽略它将是愚蠢的。为了揭示视觉的奥秘,我们不仅需要了解新皮层如何工作,而且还需要了解侧膝体和丘脑后结节。

      有关的实验能否在人而不是猴子上做呢?这种实验的优点在于被试者可以口头报告他们的体验,而猴子则做不到。然而,出于伦理学原因,不太可能将电极插入一个人的脑中,不过有时为了医学治疗必须这样做,从头颅外面研究脑波也是可能的,但这些结果通常更难以解释。

      这个方法最初是由在加利福尼亚州立大学旧金山分校工作的本杰明.里贝特(nenjaminLibet )开展的。他喜欢在人体上做实验,因为他有理由相信别人是有意识的。(他对猴子是否也有意识则并不那么有信心。)在过去,不仅仅是心理学家和神经科学家,还包括职业医生,都对关于意识的任何实验工作持严肃的怀疑态度。对于外科医生和麻醉师而言,他们几乎唯一的兴趣是如何在手术过程中对病人麻醉,以使他察觉不出所发生的事情。这样做,部分是为了减轻病人的痛苦,部分是为了防止病人控告他们。(里贝特告诉我,在他获得终身教授职位以前,他很明智地不在清醒的人身上做意识实验。)

      里贝特的主要工作涉及自发运动前的某些脑波,以及脑中这些事件与被试者出现试图或希望运动的觉知出现的时间有怎样的关系。①他的结果表明,对于这种形式的有意识的觉知,必定存在某个最短时间(大约100毫秒左右)的神经活动。这个时间的精确值或许依赖于信号的强度以及环境。

      他的其他一些更新的工作是关于刺激丘脑的一部分――腹基复合体的效果。腹基复合体主要与触觉和痛觉等感觉有关,这种实验是在一些病人身上做的,在丘脑的这一部分安插电极可以减轻他们难以控制的疼痛。虽然这些实验并不涉及视觉,但可能与盲视(如第十二章 所讨论的)的解释有关。因此我将对它们进行描述。

      被试者的丘脑接受了一定数量的刺激。然后,他(或她)需要判断刺激在何时出现(如果必要的话可以猜)。更精确他说,判断刺激是出现在一种特殊的光点亮的1秒时间内,还是随后另一种不同的光点亮的1秒以内。被试者按下提供的两个按钮中的一个来表明他的选择。如果他不知道刺激何时出现,他就必须猜测,因而平均来说有50%的正确性,当刺激及反应结束以后,他需要按下三个按钮中的一个来表示他是否曾经察觉到刺激。如果被试者在通常的位置上曾察觉到刺激,即便非常短暂,他也应按第一个按钮。如果他无法确定,或者认为他可能感受到什么,就按第二个按钮。如果他只是觉得什么也没感觉到,则按第三个钮。

      里贝特及同事们设计的实验十分复杂,因而我将只叙述其大致结果。刺激是由每秒72次的电脉冲组成;在不同次实验中会传递不同数目的脉冲,其幅度保持不变。结果表明,即便脉冲序列过于短暂而不足以引起觉知,被试者的成绩也比随机选择要好。而要察觉刺激(即便这种觉知有不确定性)需要相当长时间的序列。

      里贝特和同事们解释说,这暗示着形成觉知需要一定时间的脉冲刺激,遗憾的是,在这些实验中他们并没有系统地改变刺激的强度。但这些及较早的工作已表明,提高一个固定时程的序列的强度可以改变被试者的反应,即从无觉知状态到有觉知状态。简而言之,在躯体感觉系统中,一个弱的或短暂的信号能影响行为但不引起觉知,而较强或较长时间的同样形式的刺激则能使觉知出现。由较强或较长时间刺激引起的精确的神经行为尚有待确定。

      这一结果意味着,当试图解释盲视时,我们不能忽视一种类似的解释,即,从侧膝体到诸如V4区的通路太弱,不足以产生视觉觉知,但足以对人的行为产生影响。

      虽然本章描述的实验尚不能得出任何关于视觉觉知的精确的神经关联的强有力的结论,但它们确实表明通过实验途径来研究意识是可能的。只要我们热情而执着地追求,这样的实验最终一定能导致问题的解决。

      另一个平行的途径是试图猜测答案的一般本质,并把它仅仅作为进一步实验的指导。没有这种指导,实验便无法进行,其中一些猜测性的观点将在下一章 概述。它们至今尚未形成一个和谐的观点集合,而更像是尝试性建议的大杂烩。不过我们将看到,它们当中的一些可以合理地组织在一起。

      ============================

      ①这样一条曲线称为“心理测量曲线”。

      ①在快速眼动(REM)睡眠上,脑波与清醒时很相似,表明这时脑至少是部分有意识的,如同我们做梦时好像是有意识的。而慢波睡眠(非快速眼动)的脑波与警觉时相差很大,此时很少做梦。因而有理由假设慢波睡眠时我们通常是无意识的。

      ②他们也测试了一些侧膝体的神经元。

      ①即,神经元对刺激的发放卒与背景发放率之比更高。

      ①如果任务是简单的,那么发放大致相同。如果颜色的鉴别变得更为困难,注意会提高发放率。

      ①丘脑后结节包括三个主要部分和一个较小的部分。其中两部分前区和侧区是与视网膜区域相对应的,每个均有一个或更多的关于视野的投射。它们与大多数初级视觉区域有双向连接,并接受来自上丘的很强的、非双向连接。第三部分称为中丘脑后结节,并不具有与视网膜区域的对应,而主要与顶叶及额叶有双向连接。它可能对其他感觉反应,而不仅仅是视觉它可能更多参与认知过程,而很少参与形成生动的视觉觉知。

      ②回想一下,上丘与眼动控制有密切联系,而眼动控制是视觉注意的另一种形式。另一方面,从上丘到丘脑后结节的输入,看来更多的与视野不同部位中显著特征有关。

      ①安德森(Jim Anderson)和范?埃森(David van Essen)也提出了这种观点,作为他们的移动回路理论的一部分。

      ①由于两个原因我将不描述这些实验:它们并不直接与视觉系统有关而这是我涉及的主要方面,而且很难解释并引起了争论。这样,如果要全面讨论它们,要用一定的篇幅来描述。这作为一个旁证来说大长了。它们更多的与自由意志问题有关,将在跋中作简要讨论。

    • 家园 第十四章  视觉觉知(1)

      第十四章  视觉觉知(1)

      “宇宙就像一部展现在我们眼前的伟大的著作。哲学就记载在这上面。但是如果我们不首先学习并掌握书写它们所用的语言和符号,我们就无法理解它们。”

      ――伽利略

      现在让我们总瞰一下到目前为止我们所涉及到的领域。本书的主题是“惊人的假说”――即我们每个人的行为都不过是一个拥有大量相互作用的神经元群体活动的体现。克里斯托弗?科赫

      (Christof Koch)和我认为探索意识问题的最佳途径是研究视觉觉知,这包括研究人类及其近亲,然而,人们观看事物并不是一件直截了当的事情,它是一个建设性的、复杂的处理过程。心理学研究表明,它具有高度的并行性,又按照一定的顺序加工,而“注意”机制则处于这些并行处理的顶端。心理学家们提出过若干种理论试图来解释视觉过程的一般规律,但没有一种更多地涉及脑中神经元的行为。

      脑本身是由神经元及大量支持细胞构成的。从分子角度考虑每个神经元都是一个复杂的对象,常具有无规则的、异乎寻常的形状。神经元是电子信号装置。它们对输入的电学和化学信号快速地作出反应,并将它们的高速电化学脉冲沿轴突发送出去,其传送距离通常比细胞体直径还要大许多倍。脑中的这些神经元数目巨大,它们有许多不同的类型。这些神经元彼此具有复杂的连接。

      与大多数现代计算机不同,脑不是一种通用机。在完全发育好以后,脑的每一部分完成某些不同的专门任务。而另一方面,在几乎所有的反应中,都有许多部分相互作用。这种一般性观念得到了人脑研究的支持,这些研究包括对脑损伤者的研究以及使用现代扫描方法从头颅外进行的对人脑的研究。

      视觉系统的不同的皮层区的数目比人们所预料的要多得多。它们按一种近似等级的方式连接而成。在较低级的皮层区,神经元到眼睛的连接最短,它们主要对视野中一小块区域中的相对简单的特征敏感,尽管如此,这些神经无也受该区域所处的视觉环境影响。而较高级皮层区的神经元则对复杂得多的视觉目标(如脸或手)有反应,对该物体在视野中的位置并不敏感。(目前看来)似乎并不存在单独的皮层区域与视觉觉知全部内容相对应。

      为了理解脑如何工作,我们必须发展出描述神经元集团间如何相互作用的理论模型。目前这些模型对神经元进行了过分的简化。尽管现代计算机比其上一代在运算速度上快得多,也只能对数目很少的一群这类简化神经元及其相互作用进行模拟。尽管如此,虽然这些不同类型的简化模型仍显原始:却经常表现出一些令人吃惊的行为。这些行为与脑的某些行为有相似之处。它们为我们研究脑所可能采取的工作方式提供了新的途径。

      以上是背景知识。在此基础上,我们着手解决视觉觉知问题,即:如何从神经元活动的角度来解释我们所看见的事物。换句话说,视觉觉知的“神经关联”是什么?这些“觉知神经元”究竟位于何处呢?它们是集中在一小块地方还是分散在整个脑中?它们的行为是否有什么特别之处?

      作为开始,让我们首先回顾一下第二章 曾概述的各种观点。视觉觉知究竟包括哪种心理学处理过程呢?如果我们能够找出这些不同的处理过程在脑中的确切位置,那或许会对定位我们所寻找的觉知神经元有所帮助。

      菲力普?约翰逊-莱尔德认为,脑和现代计算机一样,具有一个操作系统。该操作系统的行为与意识相对应。他在著作《心理模型》(Mental Medels)一书中,从更加广阔的背景下提出了这一思想。他认为,有意识和无意识过程的区别在于后者是脑中高度的并行处理的结果。正如我已在视觉系统中所描述的那样,这种并行处理就是大量的神经元能够同时工作,而不是序列式地一个接一个地处理信息。这才能使有机体有可能进化成具有特殊的、运转快速的感觉、认知及运动系统。而更为序列式的操作系统对所有这些活动进行全局控制,这样才能够快速、灵活地作出决定。粗略地打个比方,这就好像一个管弦乐队的指挥(相当于操作系统)控制着乐队所有成员同时演奏一样。

      约翰逊-莱尔德假定,虽然这个操作系统可以监视它所控制的神经系统的输出,它能利用的只是它们传递给它的结果,而不是它们工作的细节。我们通过内省只能感觉到我们脑中所发生的情形的很少的一部分。我们无法介人能产生信息并传给脑的操作系统的许多运作中。因为他将操作系统视为主要是序列式的,所以他认为,“在内省时,我们倾向于迫使本来是并行的概念进入序列式的狭窄束缚中。”这是使用内省法会出现错误的原因。

      约翰逊-莱尔德的观点表达得很清楚,又很有说服力。但是,如果我们希望从神经的角度理解脑,还必须要识别该操作系统的位置和本质。它不一定与现代计算机的许多特性相一致。脑的操作系统可能并不是清晰地定位于某一特殊位置上。从两种意义上说,它更像是分布式的:它可能涉及脑中相互作用的若干分离的部分,而其中某一部分的活动信息又会分散到许多神经元。约翰逊-莱尔德对脑的操作系统的描述使人多少想起丘脑,但是丘脑的神经元太少了,以致于无法表达视觉觉知的全部内容(虽然这是可以验证的)。似乎更有可能的是,在丘脑的影响下新皮层的部分神经元(而不是全部神经元)可以表达视觉觉知。

      我们寻找的觉知的神经关联会处于脑功能等级的哪个阶段呢?约翰逊-莱尔德认为,操作系统处在处理等级的最高层次,而雷?杰肯道夫认为觉知与中间层次有更多联系。究竟哪种观点更合理呢?

      杰肯道夫关于视觉觉知的观点①是基于戴维?马尔(Davidmarr)的2.5维图而不是三维模型的思想的(大致说是第六章 所描述的以观察者为中心的可见表面的表象)。这是由于人们直接感受到的只是视野中物体呈现的那一侧;物体后面存在看不见的部分则仅仅是推测。另一方面,他相信对视觉输入的理解(即我们感觉到的是什么)是由三维模型和“概念结构”(conceptua1structure,是思维的另一种堂皇的说法)决定的。以上就是他的意识的中间层次理论。

      下面的例子会有助于理解这个理论。如果你看见一个背对着你的人,你只能看见他的后脑勺,而看不见他的脸。然而,你的脑会推断出他有一张脸。我们会这样进行推理,因为如果他转过身来,表明他的头的正面并没有脸,你会感到十分惊讶的。以观察者为中心的表象是与你所看见的他的头的后部相对应的。这是你所真实感觉到的。你的脑所做出的关于其正面的推断是从某种三维模型表象得到的。杰肯道夫认为你并不直接察觉这个三维模型(就此而言,同样你也没有直接察觉你自己的思想)。正如一句古诗所说:未闻吾所言,安知吾所思?

      由于初读杰肯道夫的著作①时不容易理解他的语言,我把他的理论的倒数第二种说法放在脚注中。②如果我对他的理论的理解是正确的话,他的观点应用于视觉即是“形态上的差异”(包括一个视觉目标的位置、形状、颜色、运动等)是与一种短时记忆有关(或由它引起/支持/投射)的表象,这种表象是一种“胜者为王”机制(一种选择机制)的结果,而注意机制的作用则使它更加丰富。

      杰肯道夫的观点的价值在于,它提醒我们不要假设脑的最高层次必定是视觉觉知中涉及的唯一层次。我们面前的场景在脑中的栩栩如生的表象可能涉及了许多中间层次,其他层次可能不够生动,或者如他所推测,我们可能根本不能察觉它们(的活动)。

      这并不意味着信息仅仅是从表面表象流向三维表象;几乎可以肯定双向流动是存在的。在上面的例子中,当你想像一张脸孔的正面时,你所感觉到的正是由无法感知的三维模型产生的可感知的表面表象。随着这一主题的发展,两种表象之间的区别或许还需进一步明确,但它对我们试图解释的问题给出了一种最初的、粗略的看法。

      目前尚不清楚这些层次在皮层中的准确位置。就视觉而言,它们更可能对应于脑的中部(如下颞叶及某些顶区),而不是脑的额区,但是杰肯道夫所指的究竟是视觉等级系统(见图52)中哪个部分,这仍有待于探索(第十六章 将就此作更详细的讨论)。

      在看了一些心理学家对这个问题的观点之后,我们现在再从那些了解神经元、它们的连接以及发放方式的神经科学家的角度来看这个难题。与意识有关(或无关)的神经元的行为的一般特征是什么?换句话说,意识的“神经关联”是什么?从某种意义上说,神经元的活动对意识是必不可少的,这看起来是合理的。意识可能与皮层中某些神经元的一种特殊类型的活动有关。毫无疑问它会具有不同的形式,这取决于皮层的哪些部分参与活动。科赫和我假设其中仅有一种(或少数几种)基本机制。我们认为,在任意时刻意识将会与瞬间的神经元集合的特定活动类型相对应。这些神经元正是具有相当潜力的候选者的集合中的一部分。因此,在神经水平上,这个问题即为:

      ?这些神经元在脑中位于何处?

      ?它们是否属于某些特殊的神经元类型呢?

      ?如果它们的连接具有特殊性,那是什么?

      ?如果它们的发放存在某些特殊方式,那是什么?

      怎样去寻找那些与视觉觉知有关的神经元呢?是否存在某些线索暗示了与这种觉知相关的神经发放的模式呢?

      正如我们已经看到的,心理学理论对我们有若干提示。某些形式的注意很有可能参与了觉知过程,因而我们应当研究脑选择性注意视觉目标的机制。觉知过程很有可能包括某些形式的极短时记忆,因而我们还应探索神经元贮存和使用这种记忆时的行为。最后,我们似乎可以一次注意多个目标,这对觉知的某些神经理论提出了问题,因此我们从论述这个问题开始。

      当我们看见一个物体时,脑子里究竟发生了些什么呢?我们会看到的可能存在的、不同的物体几乎是无限的。不可能对每个物体都存在一个相应的响应细胞(这种细胞常被称为“祖母细胞”)。表达如此多具有不同深度、运动、颜色、朝向及空间位置的物体,其可能的组合大得惊人。不过这并不排除可能存在某些特异化的神经元集团,它们对相当特定的、生态上有重要意义的目标(如脸的外貌)有响应。

      似乎有可能的是,在任意时刻,视野中每个特定的物体均由一个神经元集团的发放来表达。①由于每个物体具有不同的特征,如形状、颜色、运动等,这些特征由若干不同的视觉区域处理,因而有理由假设看每一个物体经常有许多不同视觉区域的神经元参与。这些神经元如何暂时地变成一个整体同时兴奋呢?这个问题常被称为“捆绑问题”(bindingproblem)。由于视觉过程常伴随听觉、嗅觉或触觉,这种捆绑必然也出现在不同感觉模块之间。②

      我们都有这种体验,即对物体有整体知觉。这使我们认为,对于已看见的物体的不同特征,所有神经元都产生积极的响应,而脑则通过某种方式相互协调地把它们捆绑在一起。换句话说,如果你把注意力正集中在与你讨论某个观点的朋友上,那么,你脑中有些神经元对他的脸部运动反应,有些对脸的颜色反应,听觉皮层中的神经元则对他的讲的话有反应,还可能有贮存的关于这张脸属于哪个人的那些记忆痕迹,所有这些神经元都将捆绑在一起,以便携带相同的标记以表明它们共同生成了对那张特定的脸的认知。(有时候脑也会受骗而做出错误的捆绑,比如把听到的口技表演者的声音当作是被模仿物发出的。)

      捆绑有若干种形式。一个对短线响应的神经元可以认为把组成该直线的各点捆绑在一起。这种神经元的输入和行为最初可能是由基因(及发育过程)确定的,这些基因是我们远古的祖先的经验进化的结果。另一种形式的捆绑,如对熟悉物体的识别,又如熟悉的字母表中的字母,可能从频繁的、重复性的体验中获得,也就是说,是通过反复学习得到的。这或许意味着参与某个过程的大量神经元最终彼此有紧密的连接。①这两种形式的相当永久的捆绑可以产生一些神经元群体,它们作为整体可以对许多物体(如字母、数字及其他熟悉的符号)作出反应。但脑中不可能有足够多的神经元去编码几乎无穷数目的可感知的物体。对语言也是如此。每种语言都有大量但却是数目有限的单词,而形式正确的句子的数目却几乎是无限的。

      我们最为关心的是第三种形式的捆绑。它既不是由早期发育确定的,也不是由反复学习得到的。它特别适用于那些对我们而言比较新奇的物体,比如说我们在动物园里看见的一只新来的动物。在多数情况下,积极地参与该过程的神经元之间未必有较强的连接。这种捆绑必须能够快速实现。因此它主要是短暂的,并必须能够将视觉特征捆绑在一起构成几乎无限多种可能的组合,只不过也许在某一时刻它只能形成不多的几种组合。如果一种特定的刺激频繁地出现,这种第三种形式的瞬间的捆绑终将会建立起第二种形式的捆绑即反复学习获得的捆绑。

      遗憾的是,我们并不了解脑如何表达第三种形式的捆绑。特别不清楚的是,在集中注意的觉知时,我们究竟每次仅仅感知一个物体,还是可以同时感知多个物体。表面上看,我们每次能感觉的绝不只一个物体,但这是否可能是错觉呢?脑真的能如此快速一个接一个地处理多个物体的信息,以致它们好像同时出现在我们脑海中吗?也许我们每次只能注意一个物体,但在注意之后,我们可以大致记住其中几个。因为我们并不确切知道,所以我们必须考虑所有这些可能性。让我们先假设脑每次只能处理一个物体。

      究竟哪种类型的神经活动可能与捆绑有关呢?当然,意识的神经关联可能仅仅包含一种特殊类型的神经元,比如说,某个特殊皮层上的一种锥体细胞。一种最为简单的观点是,当这个特殊神经元集团的某些成员以一个相当高的频率发放(比如大约4oo或500Hz),或维持一段适当长时期的发放,此时觉知便出现了。这样,捆绑仅仅对应于皮层神经元中相当小的一部分,它们在皮层中若干不同的区域同时高频发放(或都发放很长一段时间)。看起来这会有两个结果:这种快速或持续性的发放将增强这个兴奋的神经元集团对所投射到的神经元的影响,而这些被影响的神经元则对应于此时脑所觉知的物体的“意义”。同时,这种快速的(或持续的)发放将激活某种形式的极短时记忆。

      然而如果脑能同时精确地觉知不只一个物体,那么这种观点就不能成立。即便脑每次只处理一个物体,它也必须区分目标和背景。为了理解这一点,不妨想像在一个视野中靠近视觉中央的地方,恰好有一个红色的圆和一个蓝色的方块。那么,对应于觉知的某些神经元将会快速发放(或持续发放一段时间),有些标识红色,有些标识蓝色,其他一些标识圆,当然还有一些标识方块。脑又怎样知道哪种颜色与哪种形状相互搭配呢?换句话说,如果觉知仅仅对应于快速(或持续)的发放,脑多半会将不同物体的属性混在一起。

      有许多方法可以解决这个困难。或许只有当脑注意某个物体时才会形成对它的生动的觉知。或许注意机制使对被注意的物体反应的神经元的活动增强,同时削弱对其他物体反应的神经元的活动。倘若如此,脑只能随着注意机制从一个物体跳跃到另一个物体,一个接一个地进行处理,毕竟,当我们转动眼睛时,情形是这样的。我们先注意视野中的一部分区域,然后转而注意另一区域,如此下去。由于我们不动眼睛就能同时看见多个物体,故注意机制的速度必须比上述情况要快,并能在眼的两次转动之间工作。

      第二种替代的解释是,注意机制以某种方式使不同的神经元以多少不同的方式发放,此时的关键在于相关发放。①它基于这样一种观点,即重要的不仅仅在于神经元的平均发放率,更是每个神经元发放的精确时间,为简单起见,让我们仅仅考虑两个物体。

      对第一个物体的特征反应的神经元都在同一时刻以某种模式发放,相应于第二个物体的神经元也都同时发放,但发放的时间与第一个神经元集团不同。

      举个理想化的例子可以把这个问题讲得更清楚。假设第上集团中的神经元发放很快。或许它们还会再次发放,比如说是在l00毫秒以后。同样,在第二簇发放后过100毫秒又再次发放,如此下去。假设第二群神经元也同样每隔大约100毫秒发放一簇高速脉冲,但是只在第一群神经元处于静息状态的时候才发放。这样,脑中的其他部分不会把这两群神经元的发放混在一起,因为它们从不会同时发放①。

      此处的基本观点是:同时到达一个神经元的许多脉冲将比不同时刻到达的同样数目的脉冲产生更大的效果。②其理论要求是同一群神经元的发放有较强的关联,同时不同群的神经元之间关联较弱,甚至根本没有关联。③

      *****

      让我们回到我们的主要问题上。这就是定位“觉知”神经元并揭示使它们的发放象征着我们所看见的东西的机制是什么。这就像试图侦破一个神秘的谋杀案。我们了解受害者(觉知的本质)的一些线索,还知道可能与犯罪有关的许多杂乱的事实。哪方面进

      展看来最有希望呢?由此下一步又该怎么做呢?

      最直接的线索将是在现场捉住嫌疑犯。我们能否发现那些行为一直与视觉觉知有关的神经元呢?一种可能的办法是设置一种环境(第三章 描述过的观看内克(Necker)立方体)使进入眼睛的视觉信息保持不变,但知觉却会发生变化。当知觉改变时,哪些神经元会改变其发放,或改变发放的方式,而哪些神经元却不会改变?如果一个特定神经元的发放不随知觉改变,这就提供了一个“它不在现场”的证据。另一方面,如果它的发放确实与知觉有关,我们还需确定它是“真凶”还是“从犯”。

      让我们换一种策略。我们能否将案发地点限定在某个特定的城镇、一个区或建筑物中的单元呢?这将使我们的搜索变得更有效,在我们的问题中,即我们能否大致说出视觉觉知神经元在脑中可能的定位呢?显然,我们推测它在新皮层。虽然我们不能完全忽略新皮层的紧密的近邻,如丘脑和屏状核,以及在进化上比较古老的视觉系统(older visua1system)和上丘,更不能忽略纹状体和小脑。视觉觉知不太可能存在于诸如听皮层等区域,因此我们可以将注意力主要集中在图48所示的许多视觉皮层区域。或许我们能发现证据表明某些区域比其他区域被更紧密地牵涉到视觉觉知。

      这尚不足以找到凶手,但可能将我们引向正确的方向。罪犯可能是某种特殊类型的人。比如说,一名强壮的男子,一名心理失常的青少年,或者一群匪徒?在此处,可能涉及到哪些类型的神经元呢?是兴奋性神经元?还是抑制性神经元?是星形细胞,还是锥体细胞?如果它们是在皮层上,那么在皮层中哪一层或哪些层才能找到它们呢?

      另一种策略将是寻找他们之间是否有某些形式的通讯联系,从而使之露出马脚。如果这是一帮匪徒所为,他们是否在汽车里使用了移动电话?用神经学的术语说,觉知是否依赖于仅仅出现在脑中特定位置上的某些特别形式的神经回路呢?

      或许有人会寻找犯罪的动机。凶手犯罪能得到某种利益吗?他是否能得到经济上的好处呢?倘若如此,赃款被运到哪里去了呢?如果我们能在那里找到的话,我们或许就能跟踪追查到凶手。用神经的术语讲,视觉信息被发送到脑中的哪些部位?这些部位又是如何与皮层视觉区域连接的呢?

      此外,有人会问是否有某些特殊的行为将我们引至嫌疑犯。这或许是神经元群之间的相关发放,或许是这种或那种形式的节律或模式发放。如果我们怀疑是一群匪徒,谁最可能是头目呢?谁决定匪徒们的行动?我们相信,觉知过程中经常涉及到脑对哪种解释最为合理进行判断。这可能是一种包含某些神经元集团的一种“胜者为王”机制,如果我们能发现这种机制,那么胜者的神经本质也许能将我们指向觉知神经元。作案时是否用过什么特殊的武器呢?正如前面所述,我们很有把握地猜测极短时记忆是觉知的本质特征。同时某些形式的注意机制或许协助产生生动的觉知,因此,我们所知道的关于这些在神经水平的工作的任何知识都将把我们引向正确的方向。

      简单他说,通过大量的实验手段能从观念上将我们引导到所寻找的神经元及它们的行为。现阶段,因为我们要解决的问题十分困难,我们不能忽略任何哪怕看起来只有很少希望的线索,现在让我们更仔细地检查这些不同的途径的本质。

      =================================

      ①视觉觉知(visua1aWareness)。在本书中,consciousness和awareness的意思都是意识,只是前者作为范围更广的、比较书面化的词,而后者则更多用于感觉系统(特别是视觉系统),是比较口语化的词(见第一章 脚注),在本书的第一和第二部分,它们均译作“意识”,并不引起歧义。但在第三部分当中,作者以visual awareness作为consciousness研究的突破口,需区分这两个词。故在第三部分(第十四至十八章 )中特将awareness按心理学中译为觉知。――译者注

      ①将杰肯道夫的观点归纳起来而不曲解他的意思,这并不容易。如果读者希望进一步理解,可以查阅他的书。我并不打算叙述他对音韵学、句法、语义等方面的论点以及他在音乐认知方面的见解。相反地,我将试图精炼他的基本观点,特别是它们在视觉上的应用。

      ①希望精确理解杰肯道夫的话的读者可以查阅他的著作。(他的理论的最终版本,即理论八.还谈到了情感。)

      ②他的原话是:“每种觉知形式所表达的形态上的差异是由对应该形式的中间层次的结构引起/支持/投射的。该结构是短时记忆表象的匹配集的一部分,而这种表象则是由选择机制指派的,并为注意处理所丰富。特别地,语言觉知是由音韵结构引起/支持/投射的,音乐觉知则对应于音乐表面,视觉感知来自2.5维图。”

      ①如果一个集团中的神经无空间上离得很近(意味着它们可能有某种相互连接),接受有些相似的输入,并投射到多少有些相似的区域,那便不会引起任何特别的困难。在这种情况下它们就像是单个神经网络中的神经元。令人遗憾的是,通常这种简单的神经网络每次只能处理一个目标。

      ②现在还不能完全肯定捆绑问题如我所说的那样真的存在,还是脑通过某种未知的技巧绕了过去。

      ①回忆一下,大多数皮层神经元具有成千上万的连接,其中很多在开始时很弱,这意味着只有当脑已经大致按正确方法构造好,才可能容易地、正确地进行学习。

      ①这一观点是克里斯托夫?冯。德?马尔斯博格(christoph von der malsburg)在1981年的一篇相当难懂的文章中提出的。此前,彼得?米尔纳(Peter Milner)及其他人也曾叙述过。

      ①当然,一个群内轴突的脉冲并不必彼此精确同步。当电位变化沿接受脉冲的神经元的树突传向细胞体时,从时间上看它们的效果会有所扩散。此外,当脉冲沿许多不同轴突传播的时间延迟也有不同。这样,一群神经元的发放时间只需在大约几毫秒范围内是同时的。

      ②一种稍微详尽的理论引人了轴突传递过程中这种必然发生的时间延迟,使得离细胞体较远的突触比较近的略早地接受到输入,这样,由于树突延迟时间上的小的差异,两个信号的最大效应将同时达到细胞体。更为详细的理论还考虑局部的抑制性神经无产生的抑制性效果的调节。所有这种定性的考虑应可通过小心的模拟定量化,如在计算机上模拟单个神经元在这种环境下的行为方式,并引人时间延迟等因素。

      ③这种发放下太可能像图57表示的那样有规则。

    • 家园 第十三章  神经网络

      第十三章  神经网络

      “……我相信,对一个模型的最好的检验是它的设计者能否回答这些问题:‘现在你知道哪些原本不知道的东西?’以及‘你如何证明它是否是对的?’”

      ――詹姆斯?鲍尔(James M.Bower)

      神经网络是由具有各种相互联系的单元组成的集合。每个单元具有极为简化的神经元的特性。神经网络常常被用来模拟神经系统中某些部分的行为,生产有用的商业化装置以及检验脑是如何工作的一般理论。

      神经科学家们究竟为什么那么需要理论呢?如果他们能了解单个神经元的确切行为,他们就有可能预测出具有相互作用的神经元群体的特性。令人遗憾的是,事情并非如此轻而易举。事实上,单个神经元的行为通常远不那么简单,而且神经元几乎总是以一种复杂的方式连接在一起。此外,整个系统通常是高度非线性的。线性系统,就其最简单形式而言,当输入加倍时,它的输出也严格加倍――即输出与输入呈比例关系。①例如,在池塘的表面,当两股行进中的小湍流彼此相遇时,它们会彼此穿过而互不干扰。为了计算两股小水波联合产生的效果,人们只需把第一列波与第二列波的效果在空间和时间的每一点上相加即可。这样,每一列波都独立于另一列的行为。对于大振幅的波则通常不是这样。物理定律表明,大振幅情况下均衡性被打破。冲破一列波的过程是高度非线性的:一旦振幅超过某个阈值,波的行为完全以全新的方式出现。那不仅仅是“更多同样的东西”,而是某些新的特性。非线性行为在日常生活中很普遍,特别是在爱情和战争当中。正如歌中唱的:“吻她一次远不及吻她两次的一半那么美妙。”

      如果一个系统是非线性的,从数学上理解它通常比线性系统要困难得多。它的行为可能更为复杂。因此对相互作用的神经元群体进行预测变得十分困难,特别是最终的结果往往与直觉相反。

      高速数字计算机是近50年来最重要的技术发展之一。它时常被称作冯.诺依曼计算机,以纪念这位杰出的科学家、计算机的缔造者。由于计算机能像人脑一样对符号和数字进行操作,人们自然地想像脑是某种形式相当复杂的冯?诺依曼计算机。这种比较,如果陷入极端的话,将导致不切实际的理论。

      计算机是构建在固有的高速组件之上的。即便是个人计算机,其基本周期,或称时钟频率,也高于每秒1000万次操作。相反地,一个神经元的典型发放率仅仅在每秒100个脉冲的范围内。计算机要快上百万倍。而像克雷型机那样的高速超级计算机速度甚至更高。大致说来,计算机的操作是序列式的,即一条操作接着一条操作。与此相反,脑的工作方式则通常是大规模并行的,例如,从每只眼睛到达脑的轴突大约有100万个,它们全都同时工作。在系统中这种高度的并行情况几乎重复出现在每个阶段。这种连线方式在某种程度上弥补了神经元行为上的相对缓慢性。它也意味着即使失去少数分散的神经元也不大可能明显地改变脑的行为。用专业术语讲,脑被称作“故障弱化”(degrade gracefully)。而计算机则是脆弱的,哪怕是对它极小的损伤,或是程序中的一个小错误,也会引起大的灾难。计算机中出现错误则是灾难性的(degrade catastrophically)。

      计算机在工作中是高度稳定的。因为其单个组件是很可靠的,当给定相同的输入时通常产生完全同样的输出。反之,单个神经元则具有更多的变化。它们受可以调节其行为的信号所支配,有些特性边“计算”边改变。

      一个典型的神经元可能具有来自各处的上百乃至数万个输入,其轴突又有大量投射。而计算机的一个基本元件――晶体管,则只有极少数的输入和输出。

      在计算机中,信息被编码成由0和1组成的脉冲序列。计算机通过这种形式高度精确地将信息从一个特定的地方传送到另一个地方。信息可以到达特定的地址,提取或者改变那里所贮存的内容。这样就能够将信息存入记忆体的某个特殊位置,并在以后的某些时刻进一步加以利用。这种精确性在脑中是不会出现的。尽管一个神经元沿它的轴突发送的脉冲的模式(而不仅仅是其平均发放率)可能携带某些信息,但并不存在精确的由脉冲编码的信息。①这样,记忆必然将以不同的形式“存贮”。

      脑看起来一点也不像通用计算机。脑的不同部分,甚至是新皮层的不同部分,都是专门用来处理不同类型的信息的(至少在某种程度上是这样的)。看来大多数记忆存贮在进行当前操作的那个地方。所有这些与传统的冯?诺依曼计算机完全不同,因为执行计算机的基本操作(如加法.乘法等等)仅在一个或少数几个地方,而它的记忆却存贮在许多很不同的地方。

      最后,计算机是由工程师精心设计出来的,而脑则是动物经自然选择一代又一代进化而来的。这就产生了如第一章 所述的本质上不同的设计形式。

      人们习惯于从硬件和软件的角度来谈论计算机。由于人们编写软件(计算机程序)时几乎不必了解硬件(回路等)的细节,所以人们――特别是心理学家――争论说没必要了解有关脑的“硬件”的任何知识。实际上想把这种理论强加到脑的操作过程中是不恰当的,脑的硬件与软件之间并没有明显的差异。对于这种探讨的一种合理的解释是,虽然脑的活动是高度并行的,在所有这些平行操作的顶端有某些形式的(由注意控制的)序列机制,因而,在脑的操作的较高层次,在那些远离感觉输入的地方,可以肤浅地说脑与计算机有某种相似之处。

      人们可以从一个理论途径的成果来对它作判断。计算机按编写的程序执行,因而擅长解决诸如大规模数字处理、严格的逻辑推理以及下棋等某些类型的问题。这些事情大多数人都没有它们完成得那么快、那么好。但是,面对常人能快速、不费气力就能完成的任务,如观察物体并理解其意义,即便是最现代的计算机也显得无能为力。

      近几年在设计新一代的、以更加并行方式工作的计算机方面取得了重要进展。大多数设计使用了许多小型计算机,或是小型计算机的某些部件。它们被连接在一起,并同时运行。由一些相当复杂的设备来处理小计算机之间的信息交换并对计算进行全局控制。像天气预测等类似问题,其基本要素在多处出现。此时超级计算机特别有用。

      人工智能界也采取了行动设计更具有脑的特点的程序。他们用一种模糊逻辑取代通常计算中使用的严格的逻辑。命题不再一定是真的或假的,而只需是具有更大或更小的可能性。程序试图在一组命题中发现具有最大可能性的那种组合,并以之作为结论,而不是那些它认为可能性较小的结论。

      在概念的设置上,这种方法确实比早期的人工智能方法与脑更为相像,但在其他方面,特别是在记忆的存贮上,则不那么像脑。因此,要检查它与真实的脑在所有层次上行为的相似性可能会有困难。

      一群原先很不知名的理论工作者发展了一种更具有脑的特性的方法。如今它被称为PDP方法(即平行分布式处理)。这个话题有很长的历史,我只能概述一二。在1943年沃仑?麦卡洛克(Warrenc McCulloch)和沃尔特?皮兹(Walter Pitts)的工作是这方面最早的尝试之一。他们表明,在原则上由非常简单的单元连接在一起组成的“网络”可以对任何逻辑和算术函数进行计算。因为网络的单元有些像大大简化的神经元,它现在常被称作“神经网络”。

      这个成就非常令人鼓舞,以致它使许多人受到误导,相信脑就是这样工作的。或许它对现代计算机的设计有所帮助,但它的最引人注目的结论就脑而言则是极端错误的。

      下一个重要的进展是弗兰克?罗森布拉特(Frank Rosenblatt)发明的一种非常简单的单层装置,他称之为感知机(Perceptron)。意义在于,虽然它的连接最初是随机的,它能使用一种简单而明确的规则改变这些连接,因而可以教会它执行某些简单的任务,如识别固定位置的印刷字母。感知机的工作方式是,它对任务只有两种反应:正确或是错误。你只需告诉它它所作出的(暂时的)回答是否正确。然后它根据一种感知机学习规则来改变其连接。罗森布拉特证明,对于某一类简单的问题――“线性可分”的问题――感知机通过有限次训练就能学会正确的行为。

      由于这个结果在数学上很优美,从而吸引了众人的注目。只可惜它时运不济,它的影响很快就消退了。马文?明斯基(MarVinMinsky)和西摩?佩伯特(Segmour Papert)证明感知机的结构及学习规则无法执行“异或问题”(如,判断这是苹果还是桔子,但不是二者皆是),因而也不可能学会它。他们写了一本书,通篇详述了感知机的局限性。这在许多年内扼杀了人们对感知机的兴趣(明斯基后来承认做得过分了)。此问大部分工作将注意力转向人工智能方法。①

      用简单单元构建一个多层网络,使之完成简单的单层网络所无法完成的异或问题(或类似任务),这是可能的。这种网络必定具有许多不同层次上的连接,问题在于,对哪些最初是随机的连接进行修改才能使网络完成所要求的操作。如果明斯基和佩伯特为这个问题提供了解答,而不是把感知机打入死路的话,他们的贡献会更大些。

      下一个引起广泛注意的发展来自约翰?霍普菲尔德(John Hop-field),一位加利福尼亚州理工学院的物理学家,后来成为分子生物学家和脑理论家。1982年他提出了一种网络,现在被称为霍普菲尔德网络(见图53)。这是一个具有自反馈的简单网络。每个单元只能有两种输出:一1(表示抑制)或十1(表示兴奋)。但每个单元具有多个输入。每个连接均被指派一个特定的强度。在每个时刻单元把来自它的全部连接的效果(2)总和起来。如果这个总和大于0则置输出状态为十1(平均而言,当单元兴奋性输入大于抑制性输人时,则输出为正),否则就输出一1。有些时候这意味着一个单元的输出会因为来自其他单元的输入发生了改变而改变。

      尽管如此,仍有不少理论工作者默默无闻地继续工作。这其中包括斯蒂芬.格罗斯伯格(stephen Grossberg),吉姆?安德森(Jim Anderson),托伊沃.科霍宁(TeuvoKohonen)和戴维?威尔肖(Devid Willshaw)。(2)每个输入对单元的影响是将当前的输入信号(+1或-1)与其相应的权值相乘而得到的。(如果当前信号是-1,权重是+2,则影响为-2。)

      计算将被一遍遍地反复进行,直到所有单元的输出都稳定为止。①在霍普菲尔德网络中,所有单元的状态并不是同时改变的,而是按随机次序一个接一个进行,霍普菲尔德从理论上证明了,给定一组权重(连接强度)以及任何输入,网络将不会无限制地处于漫游状态,也不会进入振荡,而是迅速达到一个稳态。①

      霍普菲尔德的论证令人信服,表达也清晰有力。他的网络对数学家和物理学家有巨大的吸引力,他们认为终于找到了一种他们可以涉足脑研究的方法(正如我们在加利福尼亚州所说的)。虽然这个网络在许多细节上严重违背生物学,但他们并不对此感到忧虑。

      如何调节所有这些连接的强度呢?194年,加拿大心理学家唐纳德?赫布(DonaldHebb)出版了《行为的组织》一书。当时人们就像现在一样普遍相信,在学习过程中,一个关键因素是神经元的连接(突触)强度的调节。赫布意识到,仅仅因为一个突触是活动的,就增加其强度,这是不够的。他期望一种只在两个神经元的活动相关时才起作用的机制。他的书中有一个后来被广泛引用的段落:“当细胞A的一个轴突和细胞B 很近,足以对它产生影响,并且持久地、不断地参与了对细胞B 的兴奋,那么在这两个细胞或其中之一会发生某种生长过程或新陈代谢变化,以致于A作为能使B 兴奋的细胞之一,它的影响加强了。”这个机制以及某些类似规则,现在称为“赫布律”。

      霍普菲尔德在他的网络中使用了一种形式的赫布规则来调节连接权重。对于问题中的一种模式,如果两个单元具有相同的输出,则它们之间的相互连接权重都设为+1。如果它们具有相反的输出,则两个权重均设为-1。大致他说,每个单元激励它的“朋友”并试图削弱它的“敌人”。

      霍普菲尔德网络是如何工作的呢?如果网络输入的是正确的单元活动模式,它将停留在该状态。这并没有什么特别的,因为此时给予它的就是答案。值得注意的是,如果仅仅给出模式的一小部分作为“线索”,它在经过短暂的演化后,会稳定在正确的输出即整个模式上,在不断地调节各个单元的输出之后,网络所揭示的是单元活动的稳定联系。最终它将有效地从某些仅仅与其存贮的“记忆”接近的东西中恢复出该记忆,此外,这种记忆也被称作是按“内容寻址”的――即它没有通常计算机中具有的分离的、唯一用于作为“地址”的信号。输入模式的任何可察觉的部分都将作为地址。这开始与人的记忆略微有些相似了。

      请注意记忆并不必存贮在活动状态中,它也可以完全是被动的,因为它是镶嵌在权重的模式之中的即在所有各个单元之间的连接强度之中。网络可以完全不活动(所有输出置为0),但只要有信号输入,网络突然活动起来并在很短时间内进入与其应当记住的模式相对应的稳定的活动状态。据推测,人类长期记忆的回忆具有这种一般性质(只是活动模式不能永久保持)。你能记住大量现在一时想不起来的事情。

      神经网络(特别是霍普菲尔德网络)能“记住”一个模式,但是除此以外它还能再记住第二个模式吗?如果几个模式彼此不太相似,一个网络是能够全部记住这几个不同模式,即给出其中一个模式的足够大的一部分,网络经过少数几个周期后将输出该模式。因为任何一个记忆都是分布在许多连接当中的,所以整个系统中记忆是分布式的。因为任何一个连接都可能包含在多个记忆中,因而记忆是可以叠加的。此外,记忆具有鲁棒性,改变少数连接通常不会显著改变网络的行为。

      为了实现这些特性就需要付出代价,这不足为奇。如果将过多的记忆加到网络之中则很容易使它陷入混乱。即使给出线索,甚至以完整的模式作为输入,网络也会产生毫无意义的输出。①

      有人提出这是我们做梦时出现的现象(弗洛伊德称之为“凝聚”――condensation),但这是题外话。值得注意的是,所有这些特性是“自然发生”的。它们并不是网络设计者精心设置的,而是由单元的本性、它们连接的模式以及权重调节规则所决定的。

      霍普菲尔德网络还有另一个性质,即当几个输人事实上彼此大致相似时,在适当计算网络的连接权重后,它“记住”的将是训练的模式的某种平均。这是另一个与脑有些类似的性质。对我们人类而言,当我们听某个特定的声调时,即便它在一定范围内发生变化,我们也会觉得它是一样的。输入是相似但不同的,而输出――我们所听到的――则是一样的。

      这些简单网络是不能和脑的复杂性相提并论的,但这种简化确实使我们可能对它们的行为有所了解,即使是简单网络中出现的特点也可能出现在具有相同普遍特性的更复杂的网络中,此外,它们向我们提供了多种观点,表明特定的脑回路所可能具有的功能。例如,海马中有一个称为CA3的区域,它的连接事实上很像一个按内容寻址的网络。当然,这是否正确尚需实验检验。

      有趣的是,这些简单的神经网络具有全息图的某些特点。在全息图中,几个影像可以彼此重叠地存贮在一起;全息图的任何一部分都能用来恢复整个图像,只不过清晰度会下降;全息图对于小的缺陷是鲁棒的。对脑和全息图两者均知之甚少的人经常会热情地支持这种类比。几乎可以肯定这种比较是没有价值的。原因有两个。详细的数学分析表明神经网络和全息图在数学上是不同的。更重要的是,虽然神经网络是由那些与真实神经元有些相似的单元构建的,没有证据表明脑中具有全息图所需的装置或处理过程。(1)

      一本更新的书产生了巨大的冲击力,这就是戴维?鲁梅尔哈特(David Rumelhart)、詹姆斯?麦克莱兰(James McClelland)和PDP小组所编的一套很厚的两卷著作《平行分布式处理》(1)。该书于1986年问世,并很快至少在学术界成为最畅销书。名义上我也是PDP小组的成员,并和浅沼智行(Chiko Asanuma)合写了其中的一个章节。不过我起的作用很小。我几乎只有一个贡献,就是坚持要求他们停止使用神经元一词作为他们网络的单元。

      加利福尼亚州立大学圣迭戈分校心理系离索尔克研究所仅有大约一英里。在70年代末80年代初我经常步行去参加他们的讨论小组举行的小型非正式会议。那时我时常漫步的地方如今已变成了巨大的停车场。生活的步伐越来越快,我现在已改为驱车飞驰于两地之间了。

      研究小组当时是由鲁梅尔哈特和麦克莱兰领导的,但是不久麦克莱兰就离开前往东海岸了。他们俩最初都是心理学家,但他们对符号处理器感到失望并共同研制了处理单词的“相互作用激励器”的模型。在克里斯托夫?朗格特-希金斯(Christopher Longuet-Higgins)的另一位学生杰弗里?希尔顿(Geoffrey Hinton)的鼓励下,他们着手研究一个更加雄心勃勃的“联结主义”方案。他们采纳了平行分布式处理这个术语,因为它比以前的术语――联想记忆②――的覆盖面更广。

      在人们发明网络的初期,一些理论家勇敢地开始了尝试。他们把一些仍显笨拙的小型电子回路(其中常包括有老式继电器)连接在一起来模拟他们的非常简单的网络。现在已发展出了复杂得多的神经网络,这得益于现代计算机的运算速度得到了极大的提高,也很便宜。现在可以在计算机(这主要是数字计算机)上模拟检验关于网络的新思想,而不必像早期的研究那样仅靠粗糙的模拟线路或是用相当困难的数学论证。

      1986年出版的《平行分布式处理》一书从1981年底开始经过了很长时间的酝酿。这很幸运,因为它是一个特殊算法的最新发展(或者说是它的复兴或应用),在其早期工作基础上,很快给人留下了深刻的印象。该书的热情读者不仅包括脑理论家和心理学家,还有数学家、物理学家和工程师,甚至有人工智能领域的工作者。不过后者最初的反应是相当敌视的。最终神经科学家和分子生物学家也对它的消息有所耳闻。

      该书的副标题是“认知微结构的探索”。它是某种大杂烩,但是其中一个的特殊的算法产生了惊人的效果。该算法现在称作“误差反传算法”,通常简称为“反传法”。为了理解这个算法,你需要知道一些关于学习算法的一般性知识。

      在神经网络有些学习形式被称作是“无教师的”。这意味着没有外界输入的指导信息。对任何连接的改变只依赖于网络内部的局部状态。简单的赫布规则具有这种特点。与之相反,在有教师学习中,从外部向网络提供关于网络执行状况的指导信号。

      无教师学习具有很诱人的性质,因为从某种意义上说网络是在自己指导自己。理论家们设计了一种更有效的学习规则,但它需要一位“教师”来告诉网络它对某些输入的反应是好、是差还是很糟。这种规则中有一个称作“δ律”。

      训练一个网络需要有供训练用的输入集合,称作“训练集”。很快我们在讨论网络发音器(NETtalk)时将看到一个这样的例子。这有用的训练集必须是网络在训练后可能遇到的输入的合适的样本。通常需要将训练集的信号多次输入,因而在网络学会很好地执行之前需要进行大量的训练。其部分原因是这种网络的连接通常是随机的。而从某种意义上讲,脑的初始连接是由遗传机制控制的,通常不完全是随机的。

      网络是如何进行训练的呢?当训练集的一个信号被输入到网络中,网络就会产生一个输出。这意味着每个输出神经元都处在一个特殊的活动状态。教师则用信号告诉每个输出神经元它的误差,即它的状态与正确之间的差异,δ这个名称便来源于这个真实活动与要求之间的差异(数学上δ常用来表示小而有限的差异)。网络的学习规则利用这个信息计算如何调整权重以改进网络的性能。

      Adaline网络是使用有教师学习的一个较早的例子。它是1960年由伯纳德?威德罗(Bernard widrow)和霍夫(M.E.Hoff)设计的,因此δ律又称作威德罗-霍夫规则。他们设计规则使得在每一步修正中总误差总是下降的。①这意味着随着训练过程网络最终会达到一个误差的极小值。这是毫无疑问的,但还不能确定它是真正的全局极小还是仅仅是个局域极小值。用自然地理的术语说就是,我们达到的是一个火山口中的湖,还是较低的池塘。海洋,还是像死海那样的凹下去的海(低于海平面的海)?

      训练算法是可以调节的,因而趋近局域极小的步长可大可小。如果步长过大,算法会使网络在极小值附近跳来跳去(开始时它会沿下坡走,但走得太远以致又上坡了)。如果步子小,算法就需要极长的时间才能达到极小值的底端。人们也可以使用更精细的调节方案。

      反传算法是有教师学习算法中的一个特殊例子。为了让它工作,网络的单元需要具有一些特殊性质。它们的输出不必是二值的(即,或0,或者+1或-1),而是分成若干级。它通常在0到+1之间取值。理论家们盲目地相信这对应于神经元的平均发放率(取最大发放率为+1),但他们常常说不清应该在什么时候取这种平均。

      如何确定这种“分级”输出的大小呢?像以前一样,每个单元对输入加权求和,但此时不再有一个真实的阈值。如果总和很小,输出几乎是0。总和稍大一些时,输出便增加。当总和很大时,输出接近于最大值。图54所示的S形函数(sigmoid函数)体现了这种输入总和与输出间的典型关系。如果将一个真实神经元的平均发放率视为它的输出,那么它的行为与此相差不大。

      这条看似平滑的曲线有两个重要性质。它在数学上是“可微的”,即任意一处的斜率都是有限的;反传算法正依赖于这个特性。更重要的是,这条曲线是非线性的,而真实神经元即是如此。当(内部)输入加倍时输出并不总是加倍。这种非线性使得它能处理的问题比严格的线性系统更加广泛。

      现在让我们看一个典型的反传网络。它通常具有三个不同的单元层(见图55)。最底层是输入层。下一层被称作“隐单元”层,因为这些单元并不直接与网络外部的世界连接。最顶层是输出层。最底层的每个单元都与上一层的所有单元连接。中间层也是如此。网络只有前向连接,而没有侧向连接,除了训练以外也没有反向的投射。它的结构几乎不能被简化。

      训练开始的时候,所有的权重都被随机赋值,因而网络最初对所有信号的反应是无意义的。此后给定一个训练输入,产生输出并按反传训练规则调节权重。过程如下:在网络对训练产生输出以后,告诉高层的每个单元它的输出与“正确”输出之间的差。单元利用该信息来对每个从低层单元达到它的突触的权重进行小的调整。然后它将该信息反传到隐层的每个单元。每个隐层单元则收集所有高层单元传未的误差信息,并以此调节来自最底层的所有突触。

      从整体上看具体的算法使得网络总是不断调节以减小误差。这个过程被多次重复。(该算法是普适的,可以用于多于三层的前向网络。)

      经过了足够数量的训练之后网络就可以使用了。此时有一个输入的测试集来检验网络。测试集是经过选择的,它的一般(统计)特性与训练集相似,但其他方面则不同。(权重在这个阶段保持不变,以便考察训练后网络的行为。)如果结果不能令人满意,设计者会从头开始,修改网络的结构、输入和输出的编码方式、训练规则中的参数或是训练总数。

      所有这些看上去显得很抽象。举个例子或许能让读者清楚一些。特里?塞吉诺斯基和查尔斯?罗森堡(Charles Rosenberg)在1987年提供了一个著名的演示。他们把他们的网络称为网络发音器(NETtalk)。它的任务是把书写的英文转化成英文发音。英文的拼法不规则,这使它成为一门发音特别困难的语言,因而这个任务并不那么简单易行。当然,事先并不把英语的发音规则清楚地告诉网络。在训练过程中,网络每次尝试后将得到修正信号,网络则从中学习。输入是通过一种特殊的方式一个字母接一个字母地传到网络中。NETtalk的全部输出是与口头发音相对应的一串符号,为了让演示更生动,网络的输出与一个独立的以前就有的机器(一种数字发音合成器)耦合。它能将NETtallk的输出变为发音,这样就可以听到机器“朗读”英语了。

      由于一个英语字母的发音在很大程度上依赖于它前后的字母搭配,输入层每次读入一串7个字母。①输出层中的单元与音素所要求的21个发音特征②相对应,还有5个单元处理音节分界和重音。图56给出了它的一般结构。③

      他们使用了两段文字的摘录来训练网络,每段文字都附有训练机器所需的标音法。第一段文字摘自梅里亚姆-韦伯斯特袖珍词典。第二段摘录则多少有些令人奇怪,是一个小孩的连续说话。初始权重具有小的随机值,并在训练期内每处理一个词更新一次。他们编写程序使得计算机能根据提供的输入和(正确的)输出信息自动地完成这一步。在对真实的输出进行判断时,程序会采纳一个与真实发音最接近的音素作为最佳猜测,通常有好几个“发音”输出单元对此有关系。

      聆听机器学着“读”英语是一件令人着迷的事情。①最初,由于初始连接是随机的,只能听到一串令人困惑的声音。NETtalk很快就学会了区分元音和辅音。但开始时它只知道一个元音和一个辅音,因此像在咿呀学语。后来它能识别词的边界,并能发出像词那样的一串声音。在对训练集进行了大约十次操作之后,单词变得清楚,读的声音也和幼儿说话很像了。

      实际结果并不完美,在某种情况下英语发音依赖于词意,而NETtalk对此一无所知。一些相似的发音通常引起混淆,如论文(thesis)和投掷(throw)的“th”音。把同一个小孩的另一段例文作为检测,机器完成得很好,表明它能把从相当小的训练集(1024个单词)中学到的推广到它从未遇到的新词上。②这称为“泛化”。

      显然网络不仅仅是它所训练过的每一个单词的查询表。它的泛化能力取决于英语发音的冗余度。并不是每一个英语单词都按自己唯一的方式发音,虽然首次接触英语的外国人容易这样想。(这个问题是由于英语具有两个起源造成的,即拉丁语系和日尔曼语系,这使得英语的词汇十分丰富。)

      相对于大多数从真实神经元上收集的资料而言,神经网络的一个优点在于在训练后很容易检查它的每一个隐单元的感受野。一个字母仅会激发少数几个隐单元,还是像全息图那样它的活动在许多隐单元中传播呢?答案更接近于前者。虽然在每个字母一发音对应中并没有特殊的隐单元,但是每个这种对应并不传播到所有的隐单元。

      因此便有可能检查隐单元的行为如何成簇的(即具有相同的特性)。塞吉诺斯基和罗森堡发现“……最重要的区别是元音与辅音完全分离,然而在这两类之中隐单元簇具有不同的模式,对于元音而言,下一个重要的变量是字母,而辅音成簇则按照了一种混合的策略,更多地依赖于它们声音的相似性。”

      这种相当杂乱的布置在神经网络中是典型现象,其重要性在于它与许多真实皮层神经元(如视觉系统中的神经元)的反应惊人地相似,而与工程师强加给系统的那种巧妙的设计截然不同。

      他们的结论是:

      NETtalk是一个演示,是学习的许多方面的缩影。首先,网络在开始时具有一些合理的“先天”的知识,体现为由实验者选择的输入输出的表达形式,但没有关于英语的特别知识――网络可以对任何具有相同的字母和音素集的语言进行训练。其次,网络通过学习获得了它的能力,其间经历了几个不同的训练阶段,并达到了一种显著的水平。最后,信息分布在网络之中,因而没有一个单元或连接是必不可少的,作为结果,网络具有容错能力,对增长的损害是故障弱化的。此外,网络从损伤中恢复的速度比重新学习要快得多。

      尽管这些与人类的学习和记忆很相似,但NETtalk过于简单,还不能作为人类获得阅读能力的一个好的模型。网络试图用一个阶段完成人类发育中两个阶段出现的过程,即首先是儿童学会说话;只有在单词及其含义的表达已经建立好以后,他们才学习阅读。同时,我们不仅具有使用字母-发音对应的能力,似乎还能达到整个单词的发音表达,但在网络中并没有单词水平的表达。注意到网络上并没有什么地方清楚地表达英语的发音规则,这与标准的计算机程序不同。它们内在地镶嵌在习得的权重模式当中。这正是小孩学习语言的方式。它能正确他说话,但对它的脑所默认的规则一无所知。①

      NETtalk有几条特性是与生物学大为抵触的。网络的单元违背了一条规律,即一个神经元只能产生兴奋性或抑制性输出,而不会二者皆有。更为严重的是,照字面上说,反传算法要求教师信息快速地沿传递向前的操作信息的同一个突触发送回去。这在脑中是完全不可能发生的。试验中用了独立的回路来完成这一步,但对我而言它们显得过于勉强,并不符合生物原型。

      尽管有这些局限性,NETtalk展示了一个相对简单的神经网络所能完成的功能,给人印象非常深刻。别忘了那里只有不足500个神经元和2万个连接。如果包括(在前面的脚注中列出的)某些限制和忽略,这个数目将会大一些,但恐怕不会大10倍。而在每一侧新皮层边长大约四分之一毫米的一小块表面(比针尖还小)有大约5000个神经元。因而与脑相比,NETtalk仅是极小的一部分。②所以它能学会这样相对复杂的任务给人印象格外深刻。

      另一个神经网络是由西德尼?莱基(Sidney Lehky)和特里?塞吉诺斯基设计的。他们的网络所要解决的问题是在不知道光源方向的情况下试图从某些物体的阴影中推断出其三维形状(第四章 描述的所谓从阴影到形状问题)。对隐层单元的感受野进行检查时发现了令人吃惊的结果。其中一些感受野与实验中在脑视觉第一区(V1区)发现的一些神经元非常相似。它们总是成为边缘检测器或棒检测器,但在训练过程中,并未向网络呈现过边或棒,设计者也未强行规定感受野的形状。它们的出现是训练的结果。此外,当用一根棒来测试网络时,其输出层单元的反应类似于V1区具有端点抑制(end-stopping)的复杂细胞。

      网络和反传算法二者都在多处与生物学违背,但这个例子提出了这样一个回想起来应该很明显的问题:仅仅从观察脑中一个神经元的感受野并不能推断出它的功能,正如第十一章 描述的那样,了解它的投射野,即它将轴突传向哪些神经元,也同样重要。

      我们已经关注了神经网络中“学习”的两种极端情况:由赫布规则说明的无教师学习和反传算法那样的有教师学习。此外还有若干种常见的类型。一种同样重要的类型是“竞争学习”。①其基本思想是网络操作中存在一种胜者为王机制,使得能够最好地表达了输入的含义的那个单元(或更实际他说是少数单元)抑制了其他所有单元。学习过程中,每一步中只修正与胜者密切相关的那些连接,而不是系统的全部连接。这通常用一个三层网络进行模拟,如同标准的反传网络,但又有显著差异,即它的中间层单元之间具有强的相互连接。这些连接的强度通常是固定的,并不改变。通常短程连接是兴奋性的,而长程的则是抑制性的,一个单元倾向于与其近邻友好而与远处的相对抗。这种设置意味着中间层的神经元为整个网络的活动而竞争。在一个精心设计的网络中,在任何一次试验中通常只有一个胜者。

      这种网络并没有外部教师。网络自己寻找最佳反应。这种学习算法使得只有胜者及其近邻单元调节输入权重。这种方式使得当前的那种特殊反应在将来出现可能性更大。由于学习算法自动将权重推向所要求的方向,每个隐单元将学会与一种特定种类的输入相联系。①

      到此为止我们考虑的网络处理的是静态的输入,并在一个时间间隔后产生一个静态的输出。很显然在脑中有一些操作能表达一个时间序列,如口哨吹出一段曲调或理解一种语言并用之交谈。人们初步设计了一些网络来着手解决这个问题,但目前尚不深入。(NETtalk确实产生了一个时间序列,但这只是数据传入和传出网络的一种方法,而不是它的一种特性。)

      语言学家曾经强调,目前在语言处理方面(如句法规则)根据人工智能理论编写的程序处理更为有效。其本质原因是网络擅长于高度并行的处理,而这种语言学任务要求一定程度的序列式处理。脑中具有注意系统,它具有某种序列式的本性,对低层的并行处理进行操作,迄今为止神经网络并未达到要求的这种序列处理的复杂程度,虽然它应当出现。

      真实神经元(其轴突、突触和树突)都存在不可避免的时间延迟和处理过程中的不断变化。神经网络的大多数设计者认为这些特性很讨厌,因而回避它们。这种态度也许是错的。几乎可以肯定进化就建立在这些改变和时间延迟上,并从中获益。

      对这些神经网络的一种可能的批评是,由于它们使用这样一种大体上说不真实的学习算法,事实上它们并不能揭示很多关于脑的情况。对此有两种答案。一种是尝试在生物学看来更容易接受的算法,另一种方法更有效且更具有普遍性。加利福尼亚州立大学圣迭戈分校的戴维?齐帕泽(David Zipser),一个由分子生物学家转为神经理论学家,曾经指出,对于鉴别研究中的系统的本质而言,反传算法是非常好的方法。他称之为“神经系统的身份证明”。他的观点是,如果一个网络的结构至少近似于真实物体,并了解了系统足够多的限制,那么反传算法作为一种最小化误差的方法,通常能达到一个一般性质相似于真实生物系统的解。这样便在朝着了解生物系统行为的正确方向上迈出了第一步。

      如果神经元及其连接的结构还算逼真,并已有足够的限制被加入到系统中,那么产生的模型可能是有用的,它与现实情况足够相似。这样便允许仔细地研究模型各组成部分的行为。与在动物上做相同的实验相比,这更加快速也更彻底。

      我们必须明白科学目标并非到此为止,这很重要。例如,模型可能会显示,在该模型中某一类突触需要按反传法确定的某种方式改变。但在真实系统中反传法并不出现。因此模拟者必须为这一类突触找到合适的真实的学习规则。例如,那些特定的突触或许只需要某一种形式的赫布规则。这些现实性的学习规则可能是局部的,在模型的各个部分不尽相同。如果需要的话,可能会引入一些全局信号,然后必须重新运行该模型。

      如果模型仍能工作,那么实验者必须表明这种学习方式确实在预测的地方出现,并揭示这种学习所包含的细胞和分子机制以支持这个观点。只有如此我们才能从这些“有趣”的演示上升为真正科学的有说服力的结果。

      所有这些意味着需要对大量的模型及其变体进行测试。幸运的是,随着极高速而又廉价的计算机的发展,现在可以对许多模型进行模拟。这样人们就可以检测某种设置的实际行为是否与原先所希望的相同,但即便使用最先进的计算机也很难检验那些人们所希望的巨大而复杂的模型。

      “坚持要求所有的模型应当经过模拟检验,这令人遗憾地带来了两个副产品。如果一个的假设模型的行为相当成功,其设计者很难相信它是不正确的。然而经验告诉我们,若干差异很大的模型也会产生相同的行为。为了证明这些模型哪个更接近于事实,看来还需要其他证据,诸如真实神经元及脑中该部分的分子的准确特性。

      另一种危害是,对成功的模型过分强调会抑制对问题的更为自由的想像,从而会阻碍理论的产生。自然界是以一种特殊的方式运行的。对问题过于狭隘的讨论会使人们由于某种特殊的困难而放弃极有价值的想法。但是进化或许使用了某些额外的小花招来回避这些困难。尽管有这些保留,模拟一个理论,即便仅仅为了体会一下它事实上如何工作,也是有用的。

      我们对神经网络能总结出些什么呢?它们的基础设计更像脑,而不是标准计算机的结构,然而,它们的单元并没有真实神经元那样复杂,大多数网络的结构与新皮层的回路相比也过于简单。目前,如果一个网络要在普通计算机上在合理的时间内进行模拟,它的规模只能很小。随着计算机变得越来越快,以及像网络那样高度并行的计算机的生产商业化,这会有所改善,但仍将一直是严重的障碍。

      尽管神经网络有这些局限性,它现在仍然显示出了惊人的完成任务的能力。整个领域内充满了新观点。虽然其中许多网络会被人们遗忘,但通过了解它们,抓住其局限性并设计改进它们的新方法,肯定会有坚实的发展。这些网络有可能具有重要的商业应用。尽管有时它会导致理论家远离生物事实,但最终会产生有用的观点和发明。也许所有这些神经网络方面的工作的最重要的结果是它提出了关于脑可能的工作方式的新观点。

      在过去,脑的许多方面看上去是完全不可理解的。得益于所有这些新的观念,人们现在至少瞥见了将来按生物现实设计脑模型的可能性,而不是用一些毫无生物依据的模型仅仅去捕捉脑行为的某些有限方面。即便现在这些新观念已经使我们对实验的讨论更为敏锐,我们现在更多地了解了关于个体神经元所必须掌握的知识。我们可以指出回路的哪些方面我们尚不足够了解(如新皮层的向回的通路),我们从新的角度看待单个神经元的行为,并意识到在实验日程上下一个重要的任务是它们整个群体的行为。神经网络还有很长的路要走,但它们终于有了好的开端。

      ============================

      ①查尔斯?安德森(charles Anderson)和戴维?范?埃森提出脑中有些装置将信息按规定路线从一处传至另一处。不过这个观点尚有争议。

      ①该网络以一个早期网络为基础。那个网络被称为“自旋玻璃”,是物理学家受一种理论概念的启发而提出的。

      ①这对应于一个适定的数学函数(称为“能量函数”,来自自旋玻璃)的(局域)极小值。霍普菲尔德还给出了一个确定权重的简单规则以使网络的每个特定的活动模式对应于能量函数的一个极小值。

      ①对于霍普菲尔德网络而言,输出可视为网络存贮的记忆中与输出(似为“输入”之误――译者注)紧密相关的那些记忆的加权和。

      ①在1968年,克里斯托夫?朗格特-希金斯(Christopher Longuet-Higgins)从全息图出发发明了一种称为“声音全息记录器”(holophone)的装置。此后他又发明了另一种装置称为“相关图”,并最终形成了一种特殊的神经网络形式。他的学生戴维?威尔肖在完成博士论文期间对其进行了详细的研究。

      (2)他们和其他一些想法接近的理论家合作,在1981年完成了《联想记忆的并行模式》,由杰弗里?希尔顿(Geoffrey Hinton)和吉姆?安德森编著。这本书的读者主要是神经网络方面的工作者,它的影响并不像后一本书那样广泛。

      (1)PDP即平行分布式处理(Parallel Distributed Processing)的缩写。

      ①更准确他说是误差的平方的平均值在下降,因此该规则有时又叫做最小均方(LMS)规则。

      ①29个“字母”各有一个相应的单元;这包括字母表中的26个字母,还有三个表示标点和边界。因而输入层需要29x7=203个单元。

      ②例如,因为辅音p和b发音时都是以拢起嘴唇开始的,所以都称作“唇止音”。

      ③中间层(隐层)最初有80个隐单元,后来改为120个,结果能完成得更好。机器总共需要调节大约2万个突触。权重可正可负。他们并没有构造一个真正的平行的网络来做这件事,而是在一台中型高速计算机上(一台VAX 11//780FPA)模拟这个网络。

      ①计算机的工作通常不够快,不能实时地发音,因而需要先把输出录下来,再加速播放,这样人们才能听明白。

      ②塞吉诺斯基和罗森堡还表明,网络对于他们设置的连接上的随机损伤具有相当的抵抗力。在这种环境下它的行为是”故障弱化”。他们还试验以11个字母(而不是7个字母)为一组输入。这显著改善了网络的成绩。加上第二个隐单元层并不能改善它的成绩,但有助于网络更好地进行泛化。

      ①除了上面列出的以外,NEttalk还有许多简化。虽然作者们信奉分布式表达,在输入输出均有“祖母细胞”即,例如有一个单元代表“窗口中第三个位置上的字母a”。这样做是为了降低计算所需要的时间,是一种合理的简化形式。虽然数据顺序传入7个字母的方式在人工智能程序是完全可以接受的,却显得与生物事实相违背。输出的“胜者为王”这一步并不是由“单元”完成的,也不存在一组单元去表达预计输出与实际输出之间的差异(即教师信号)。这些运算都是由程序执行的。

      ②这种比较不太公平,因为神经网络的一个单元更好的考虑是等价于脑中一小群相神经元。因而更合适的数字大约是8万个神经元(相当于一平方毫米皮层下神经元的数目)。

      ①它是由斯蒂芬?格罗斯伯格、托伊沃?科霍宁等人发展的。

      ①我不打算讨论竞争网络的局限性。显然必须有足够多的隐单元来容纳网络试图从提供的输入中所学的所有东西,训练不能太快,也不能太慢,等等。这种网络要正确工作需要仔细设计。毫无疑问,不久的将来会发明出基于竞争学习基本思想的更加复杂的应用。

    • 家园 第十二章  脑损伤

      第十二章  脑损伤

      “巴比伦所有的废墟看上去远不如人类的思想的毁灭那样可怕”

      ――斯克罗普?戴维斯(Scrope Davies)

      近些年来,神经病学家对脑部受到损伤的病人进行了研究。可能造成这些损伤的方式有多种,如中风、头部受到打击、枪伤、感染等,许多损伤改变了病人的视觉意识的某些方面,但病人的其他一些机能(如语言或运动行为)则基本未受影响,这些证据表明皮层具有显著的功能分化,而这种分化的方式通常是相当令人吃惊的。

      在许多情况下,脑受到的损伤并不是单一的、专门化的。一粒高速射人的子弹对各皮层区域一视同仁。(活的皮层组织是相当柔软的胶体,用移液管吸吮能很容易地移去其中一小部分。)通常情况下,损伤可能包括几个皮层区域,对头部两侧对应区域同时造成伤害的后果最为严重,不过这种情况非常罕见。

      许多神经病学家仅有时间对病人做简短的检查――仅够作出一个关于损伤的可能部位的合理猜测。后来,甚至连这种形式的检查工作也大部分被脑扫描所取代。近来,描述一个单独的、隔离的脑损伤被认为是不科学的,因此习惯上同时报告许多相似的病症。遗憾的是,这导致了将一些实际不同的损伤形式混为一谈。

      当前的趋势在某种程度上纠正了这种做法。有少数病例中病人的感觉或行为的某个特定方面发生了改变,而其他大部分方面却未受伤害,现在往往特别注意这些病例。这些病人受到的伤害很可能比较有限,因而更加专门化。人们还努力通过脑扫描来定位这些损伤。如果病人合作的话,他将在清醒状态下进行完整的一组心理学及其他一些测试,用来发现哪些是他所能或不能看到或做到的。在某些情况下,这种测试会进行好几年。由于关于视觉处理的理论变得越来越深奥,检验这些观点的实验也变得更加广泛和精细。现在,它们可以和脑扫描技术相结合。该技术可以记录脑在完成这些不同任务时的行为。这些结果可以在具有相似损伤或相似病症(或者二者皆有的)病人之间进行比较和对照。

      对V1区(条纹皮层)的损伤是一个明显的例子,现就以此作为开始。如果脑一侧的V1区被完全破坏,病人的表现是看不见对侧的半个视野,在本章的结尾我将详细讨论一个被称作“盲视”的奇怪现象。在这里让我们先看一下对视觉等级最高层部分损伤的结果,并将损伤局限在头的右手侧。这是人们所知的单侧忽略。损伤区域大致对应于猕猴的7a区(见图48)。这通常由大脑动脉血管疾病(如中风)引起的。

      在早期阶段,症状可能非常严重―――病人的眼睛和头会转向右侧。在最严重的病例中,损伤的范围可能很大,以致病人失去了左侧的控制和感觉,他会否认他自己的左腿是属于他的。有一个人对于别人的腿出现在他的床上感到极度愤怒,于是他把它扔到了床外。结果他惊讶地发现他自己躺在了地板上。

      大多数情况并没有这么严重。通常几天以后严重的病症就会减轻或消失。例如,这时病人可能无法拿起盘中左侧的食物。如果让他画一个钟,或者一张脸,他通常只画其中的右侧。在几周以后,随着脑得到部分恢复,他对半边的忽略程度进一步下降,但他对左侧的注意仍显得比右侧弱。如果让他平分一条直线,他会将中点画到右边。不过他对左侧并不完全是盲的。如果那里有一个孤立的物体,他会看见它。但如果在右侧也有某个明显的物体,他就无法注意到左侧的物体。此外,他经常否认有什么东西是斜的,而且不承认看到了视野左侧的没有物体的空间。

      单侧忽略并不限于视觉感知。它也会出现在视觉想像中。意大利的埃德瓦尔多?比西阿奇(Edoardo Bisiach)和同事们报告了一个典型的例子[1]。他们要求病人想像自己站在米兰市的一个主要广场的一端,面对教堂,并叙述他们所回忆起的景象。他们描述的主要是从该视点看到的右侧的建筑的细节。随后病人被要求想像站在广场的对侧,而教堂则在他们身后,再重复上述过程。则他们讲述的主要是先前他们叙述时忽略的那一侧的细节,此时仍是视野的右侧。

      另一种显著的脑损伤形式造成了颜色视觉部分或全部丧失。患者看到的所有物体仅具有不同浓淡的灰色,这是众所周知的“全色盲”――早在1688年,被称为“化学之父”的罗伯特?波义耳(Robert Boyle)就曾经报告过。1987年,奥立佛?萨克斯(Oliver5acks)和罗伯特?瓦赛曼(Robert Wasserman)在《纽约书评》中讲述了这样一个病例,病人是纽约的抽象派画家乔纳森?艾(Jonathan I.)。他对颜色有特殊的兴趣,以致他听音乐时会产生“丰富的内部颜色的一阵激发”。这被称作是联觉。在一次事故后他的这种联觉消失了,因而音乐对他的感染力也大大地消失了。

      损伤是一次相当轻微的车祸造成的。乔纳森?艾可能受到了撞击,但除此以外他好像并未受伤。他能够向警察清楚地叙述事故的原因。但后来他感到头疼得很厉害,并经常忘记这次事故。昏睡之后,次日清晨他发现自己不能阅读了。不过这种障碍在五天后消失了。虽然他对颜色的主观感觉并未改变,但他却很难区别颜色了。

      这种情况在第二天又进一步发展。尽管他知道那是一个阳光灿烂的早晨,在他驱车前往工作室时,整个世界看上去像是在雾中一样。只有当他到达那里并看见自己的那些色彩绚丽的绘画现在变得“完全是灰色而缺乏色彩”时,他才被自己有这样缺陷所惊呆了。

      这种缺陷是残酷的。萨克斯和瓦赛曼形象而具体地解释了这种心理效应。虽然可以判断他的问题并不比看老式的黑白电影更糟,但是艾先生并不这样认为。大多数食物让他感到厌恶――例如,土豆看上去是黑的。在他看来他妻子的皮肤就像白鼠的颜色,他无法忍受同她做爱。即使他闭上眼睛也无济于事。他那高度发达的视觉想像力也变得色盲了。连他的梦也失去了往日的色彩。

      艾先生所感受的灰度尺度被压缩了,特别在强光下更严重。因此他不能辨别细微的色调等级。他对所有波长的光的反应是一样的,只在光谱的短波区(“蓝色”)有一个额外的敏感峰。这可以解释他为什么看不见蓝天上的白云。他在识别面孔时也遇到了困难,除非他们离得很近他才能认出来。但由于突出来的物体具有显著的对比,十分清晰,几乎像剪影一样,因此他的视觉显得更敏锐了。他对运动异常敏感。他报告说:“我可以看到一条街区外的一条虫在蠕动。”在夜间他声称自己能看得非常清楚,能读出四条街区外的车牌。因此,用他自己的话说,他成了一个“夜行者”。在夜间徘徊时,他的视觉并不比别人差。

      艾先生失去的颜色意识对视觉的其他方面影响极小,这种丧失只改变了他对灰度浓淡的敏感性并使他对运动更敏锐。这种损伤显然是双侧的,因为两侧视野都受到了影响(有些情况下全色盲仅对一侧有影响)。这种损伤还是一种延迟过程,因为对颜色意识的完全丧失是在两天内发展起来的。如果不是他对短波长的光(蓝光)有增强反应的话,这很像是P系统有缺陷(P系统对形状和颜色更敏感),而大部分视觉任务由未受损伤的M系统(对运动更敏感,见第十章 )来完成。

      艾先生的脑也进行了MRl扫描和CAT扫描(尽管后者尺度较粗糙),但未发现任何损伤,因而尚不清楚损伤的部位是否在皮层上。不管怎样,上述情况表明全色盲通常包括了人视觉系统中相当高层次皮层的损伤(枕叶的腹侧正中部分)。

      另一种损伤造成的缺陷非常惊人,这就是面容失认症(prosopagnosia)。上个世纪的一位英国首相就遇到了这种困难。他甚至认不出自己的长子的脸。面容失认症有多种不同的形式,这可能是因为不同病人的脑损伤的实质各有不同,问题通常不是他们认不出那是一张脸,而是识别不出那是谁的脸,不知那是他的妻子的、孩子的还是一个老朋友的脸。病人常常认不出照片上他自己的脸。他甚至不能认出镜子中的自己,尽管他知道那肯定是他的脸,因为当他眨眼时镜中的像也在眨眼。他常常能从妻子的声音或走路的样子中认出她来,但只看她的脸却不能。

      除非损伤很严重,否则他能描述一张脸的特性(如眼睛、鼻子、嘴等等)以及它们的相对位置。此外,他的目视扫描机制也正常。在一些情况下,让他辨认某些在不同光照下拍摄的不熟悉的照片时,他能区分这些不同的面孔。但即便他和他们早就很熟悉,他也不能说出哪张照片是谁的脸。

      双侧全色盲患者常常同时患有面容失认症。但应当记住,没理由认为损伤(通常由中风引起)只影响单个皮层区。事实上,面容失认症可以和其他几种缺陷一同出现。

      神经病学家安东尼奥?达马西欧(Antonio Damasio)对面容失认症的研究作出了不少重要的贡献。情况并不仅局限于面孔识别困难,在一个病例中,一个农夫再也不能识别他的牛,虽然原先他能叫出其中每一头牛的名字。但达马西欧的研究更深入一步。他和同事们表明,许多病例中病人不能在一组相类似的物体中识别出单个成员,例如,病人可能很容易认出一辆小汽车,但无法说出它是福特牌轿车还是罗尔斯?罗依斯轿车;不过他能识别救护车或救火车,可能是因为它们与典型的汽车有显著差异。他能认出一件衬衫,但不知道那是不是礼服衬衫。

      达马西欧和同事们还发现,尽管有些病人不能分辨面孔,他们却能识别面部表情的含义并能估计年龄和性别。其他面容失认症患者则没有这种能力,这些结果表明面孔不同方面特征的识别是在脑的不同部位完成的。

      目前对如何准确描述面容失认症及其内在机制尚有争议。达马西欧强调这不是一种普通的记忆疾病,因为这种记忆可以通过其他感觉通道(如听觉)激发出来。每种情况下的准确机理尚有待发现。

      心理学家约瑟夫.齐尔(Joseph Zihl)和同事们报告了一个令人吃惊的病例[5],病人对大多数形式的运动没有意识。病人所受的损伤是双侧的,位于皮层的多个区域。第一次接受检查时,病人处于非常惊恐的状态,这并不令人奇怪,因为她看见在一个地方的人和物体突然出现在另一个地方,而她并未感觉到他们的运动。当她想过马路时就特别感到沮丧,因为原先在很远处的汽车会突然离她很近。当她试图把茶倒入杯子时,她只看到了一道凝固的液体弧的反光。因为她注意不到杯子中茶的上升,茶经常溢出来。她所体验的世界与我们某些人在迪斯科夜总会中看到的频闪灯光下的舞池的地板很相似。

      在极慢的时间尺度上我们也遇到过这个问题。钟的时针看上去并不动,但是过一段时间后我们再看时,它已在另一个位置上。我们对这样一种观念很熟悉,一个物体可能是动的,即便我们并不能直接感受到它的运动。但在日常生活的一般时间尺度上我们通常没有这种困难。显然我们必定有一个特殊的系统自行来检测运动,而不必由时间分隔的两次不同的观察中从逻辑上推断它。

      仔细的测试表明病人可以检测某些形式的运动,可能一种严重受损后残存的短时机制的作用的结果,而形成关于运动的更为全局的联系机制则已被破坏。她的视觉还有其他一些缺陷,大多数都与运动有关。但她能看见颜色并能识别面孔,也未表现出有本章前面描述的各种类型的忽视的征兆。

      还有许多其他种类的脑损伤所引起的视觉缺陷。报导中有两个病例,患者失去了深度感知,看到世间万物和人都完全是平的,因而“由于人的身体仅由轮廓线表示,最胖的人看上去也只是运动的纸板人形而已”。其他病人仅从通常的正对方向看物体时才能识别出它来,而从非常规角度观看,如从正上方看一个平底锅,则无法识别。

      英国的两位心理学家格林?汉弗莱斯(Glyn Humphreys)和简.里多克(JaneRiddoch)用了五年时间研究一个病人。他有多种视觉缺陷,如,他失去了颜色视觉,也不能识别面孔[7]。他们表明他的主要的视觉问题在于,当他看见一个物体的局部特征时,他不能把它们组合在一起。因此,尽管他能很好地复制一幅地图,能清晰地发音,并流利地口头描述他中风前所知道的事情,他却不能认出物体是什么。这些病例很重要,它表明一个人失去了部分高层视觉后仍会有低层次上的视觉意识。它支持这样一种主张:没有一个单独的皮层区标记了我们能看到的所有事物。

      有一种视觉缺陷是那么令人惊异,以致知道此事的人都怀疑它是否可能存在。这就是安通综合症(Anton's syndrome),或称“失明否认症”。病人显然看不见东西,但并不知道这个事实[8]。当让他描述医生的领带时,病人会说那是一条有红色斑点的蓝色领带,而事实上医生根本没戴领带,进一步追问病人,他会主动告诉你房间的灯显得有些暗。

      最初,这种情况显得不可能是真的。医学诊断是歇斯底里症,但这并没多大帮助。不过考虑如下的可能性。我经常发现,当我与从未见过面的人通过电话交谈时,我会在脑海里自然而然地形成他(或她)的外貌的粗略影像。我曾经和一个男子进行过多次电话长谈,我想像他有五十来岁,相当瘦,戴着度数很深的眼镜。当他终于来看我时我发现他只有三十多岁,明显发胖。我对他的外貌感到很惊讶,这才使我意识到我原来把他想像成别的样子了。

      我猜想那些失明否认症患者产生了这种影像。或许是由于脑损伤导致这些影像不必与来自眼睛的正常视觉输入竞争。此外,在正常人脑中可能有某些重要机能可以提醒它们某些影像是错的,而这些患者由于其他部位的损伤而丧失了这些机能。这种解释是否正确尚有待研究,但它至少使得这种情况显得并不完全难以理解。

      在不同的皮层区域对损伤的反应中是否有某些趋势呢?达马西欧指出,在人的颞区(头的两侧)靠近头后部的脑损伤与更靠近前部损伤的特点不同[9]。靠近颞叶后部(或是其后的枕叶,见图27)的损伤与概念性东西有关。如果损伤靠近前部,对概念的影响逐渐变小,直到海马附近,主要丧失的是与特定事件有关。这样,概念与事件记忆间的区别①非常显著。可能在处理一般物体和事件的区域与仅仅处理其中一种的区域问有一种逐渐的转变。

      达马西欧的建议与我对单个皮层区的功能的描述是一致的。对于每个皮层区而言,其他区域(通常是等级更低的)有输入到达它的中间各层;该皮层区把这些区域提取的特征组合构造成新的特征。

      例如,当你沿视觉等级向上走时,你会从皮层v1区出发。v1区处理相当简单的视觉特征(如有朝向的直线)。这些特征无时不出现。然后你到达处理诸如脸这类不那么频繁出现的复杂目标的区域,直到与海马相联系的皮层(图52的顶端),这里检测的组合信号(包括视觉及其他信号)大多对应于唯一的事件。

      至此,我们之前的讨论足以建立两个普适要点:这些受损坏的视觉系统以一种奇怪而神秘的方式工作,它的行为与科学家所发现的关于猕猴和我们自己的视觉系统的连接方式和行为并不矛盾。

      然而我们的任务是理解视觉意识。它是构建视觉影像所必需的许多复杂处理的结果。是否有某些形式的脑损伤对意识本身有更直接的影响呢?现已发现确实有一些。

      第一种通常被称为“裂脑”。其最彻底的形式是胼胝体(连接大脑两侧皮层区的一大束神经纤维)以及称作“前连合”的一小束纤维被完全切除。在对癫痈病人的一般治疗失败后,为减轻其病症,会进行这种外科手术。其他形式的脑损伤也会导致病人失去胼胝体,但此时通常在脑其他部位也有额外损伤,因而无法像这样直截了当地解释结果。也有些人生来就没有胼胝体,但脑在发育过程中常能在某种程度上补偿早期的缺陷,因而结果并不如手术情况那样明显。

      这个主题的历史十分奇特,因而值得作一简要叙述。一位著名的美国神经外科医生在1936年报告说,胼胝体被切除后并无症状。50年代中期,另一位专家在回顾实验结果时写道:“胼胝体几乎不能与心理学功能联系到一起。”卡尔?拉什利(Karl Lashley,一位聪明而有影响的美国神经科学家。奇怪的是,他几乎总是错的)则走得更远,曾开玩笑他说,胼胝体的唯一功能是防止两个半球坍塌到一起。(胼胝体显得有些硬,因此得名。胼胝有硬皮的意思。)我们现在知道这些观点是完全错误的。造成这种错误部分是由于胼胝体并不总被完全切除,但主要是因为检测手段不敏感或不恰当。

      罗杰?斯佩里(Roger Sperry)和同事们在五六十年代的工作使得情况明显改善。由于此项工作斯佩里获得了1981年诺贝尔奖。通过仔细设计的实验,他们清楚地表明,当一只猫或猴子的脑被分成两半时,可以教它的一侧半球学会一种反应,而另一半球则学会另一种、甚至是对相同情况的完全矛盾的反应。正如斯佩里所说,“这就好像动物有两个独立的脑。”①

      为什么会这样呢?对大多数习惯于用右手的人而言,只有左半球能说话或通过写字进行交流。对于与语言相关的大多数能力也是如此,尽管右半球能在很有限的程度上理解口语,或许还能处理说话的音韵。当胼胝体被切除后,左半球只能看到视野右边的一半,而右半球则只能看到左边的一半。每只手主要是由对侧半球控制,但同侧半球能控制手或手臂做某些比较粗糙的运动。除了特殊情况,每个半球都能听到说话。

      刚进行完手术的病人可能经历各种瞬时效应。例如,他的两只手所做的目的正好相反,一只手扣上衬衣的扣子,而另一只手则随后将其解开。这种行为通常会减弱,病人显得比较正常。但更细致的检查揭示了更多的东西。

      在实验中,病人被要求把凝视点固定在一个屏幕上。屏幕上会有一个图像在他的凝视点的左侧或右侧闪烁。这样可以保证视觉信息仅到达两个半球中的一个。现在有更加精心设计的方法可以做到这一点。

      当一个闪烁的图片到达能使用语言的左半球,他就能像正常人一样描述它。这种功能并不仅限于语言表达。病人也能按要求不说话而用右手指向目标(右手主要由左半球控制)。他还能不看一个物体而用右手识别它。

      然而,如果闪烁图片到达了不能使用语言的右半球,结果则大不一样。左手主要由这个不能用语言的半球控制,它能指向物体,也能通过触摸识别没看见的物体,这和右手所能做的是一样的。但当病人被问及为什么他的左手有这种特殊方式的行为时,他会依照能用语言表达的左半球所看见的场景虚构一个解释,但这并不是右半球所看见的。实验者知道真正闪烁进入那个不能使用语言的半球以产生行为的物体是什么,因而可以看出这些解释是错误的。这是一个“虚构症”的很好的例子。

      简单他说,看来脑的一半几乎完全忽略另一半所看见的。只有极少的信息有时会漏到对侧。在给一位妇女的右半球闪现一系列照片时,迈克尔?伽扎尼加(MichaeI Gazzaniga)加入了一张裸体照片。这使得病人有些脸红。她的左半球并不能察觉那些照片的内容,但知道它使她脸红,因此她说:“医生,你是不是给我显示了一些很有趣的照片?”过了一会病人学会了向另一侧半球提供一些交叉线索;例如,用左手以某种方式发信号从而使能用语言的半球能够识别该信号。对于正常人而言,右半球的详细的视觉意识能够很容易地传到左半球,因而能用语言描述它,胼胝体被完全切除后,这些信息无法传到能用语言的半球。该信息无法通过脑中的各种低层次的连接传到对侧。

      请注意,除了提到语言通常在左脑外,我并未涉及脑的两半有什么差异。我不必关心右侧脑是否有某些特殊能力,例如它十分擅长识别面孔。我也不必考虑某些人的一种极端的观点,他们认为左侧具有“人”的特性,而右侧则仅仅是自动机。显然右侧缺乏发展完善的语言系统,因而从某种意义上说不那么具有“人类”的特点――因为语言是唯一标志人类的能力。事实上我们需要回答右侧是否高于自动机这个问题,但我觉得应该稍作等待,直到我们更好地理解意识的神经机制,否则我们不能很好地作出回答,更不必说自由意志问题了。折衷的职业观点强调,除了语言外,两侧的感知和运动能力虽不完全相同,但一般特征是一致的。

      大多数切开脑的手术并不切断两侧上丘的顶盖间连合(在第十章 叙述)。脑无法利用这个未触及的通路从一侧向另一侧传递视觉意识信息。因此尽管上丘参与了视觉注意过程,它似乎不像是意识的位置。

      另一个引人注目的现象被称为“盲视”。牛津的心理学家拉里?威斯克兰兹(LarryWriskrantz)在这方面作了广泛的研究。盲视病人能指出并区分某些非常简单的物体,但同时又否认能看见它们。①

      盲视通常是由于初级视觉V1区(纹状皮层)受到大面积损伤而引起的,在许多病例中损伤仅出现在头部的一侧。在实验中,一行小灯呈水平排列,使得病人在凝视这些灯光的一端时,它们全部落在视野的盲区。在一声警告的蜂鸣声之后有一盏灯会短时间点亮,而此时病人不能转动眼睛或头。要求病人指出哪盏灯被点亮了。病人通常对此表示异议,说既然他看不见那里的东西,没必要做这个实验。经过短暂的劝说之后,他会打算试一下并作“猜测”。实验会重复多次,有时这盏灯被点亮,有时则是另一盏。结果病人大感惊讶,尽管他否认看见了任何东西,却能相当准确地指出亮的那盏灯,误差一般不超过5到10度。②

      有些病人还能区分简单的形状,比如X和O,只要它们足够大。有些人还能鉴别直线的朝向和闪烁。有人声称有两个病人能调节手的形状,使之与即将触摸到的目标的形状和大小相匹配,同时却否认看到了这个物体。某些情况下病人的眼睛能跟踪运动条纹,但这个任务或许是由脑的其他部分(如上丘)完成的。病人的瞳孔也能对光强作出反应,因为瞳孔的大小不是随意的,而是由另一个小的脑区控制的。

      因此,尽管V1区受到严重损坏,病人会坚决否认察觉到了这些刺激,但脑仍能探测到某些相当简单的视觉刺激,并能采取相应的行动。

      目前还不清楚这其中涉及的神经通路。最初猜测信息是通过“古脑”(Old brain)的一部分即上丘传递的,现在看来远不止如此,因为最新的实验表明眼视锥细胞参与了盲视对光波长的反应。他们对不同波长的反应与正常人相似,只是所需的光更亮些。在上丘没发现对颜色敏感的神经元,因此它不会是唯一的通道。

      这个问题很复杂,因为皮层Vl区的损伤最终会导致侧膝体(丘脑的中继站)对应部位的细胞大量死亡,继而这又将杀死大量的视网膜P型神经节细胞,因为就像隐士一样,它们没有可以交谈的对象①。然而,某些P型神经元保留下来,就像侧膝体相关区域的一些神经元一样,可能是因为它们投射到了某些未受损害的部位。从侧膝体有直接但弱的通路到达Vl区以上的皮层区,诸如V4区。这些通路可能保留足够完好,足以产生运动输出(例如,能够指出目标),但尚不足以产生视觉意识(参见第十五章 讨论的里贝特的工作)。有些启发性的证据表明在V1区损伤的部位中有一些未被触及的组织形成的小岛,因而V1区在这些区域仍能起一定作用,虽然这种作用可能比较小,或者最终发现由于别的原因,一个完整的V1区对意识是必需的,而不仅仅是因为通常它产生了到高级视觉区域的输入。不管这个理由是什么,病人在否认看见任何东西的同时确实能利用一些视觉信息。

      另一种让人感兴趣的行为形式是在一些面容失认症患者身上发现的。当病人与测谎器连起来并面对一组熟悉的和不熟悉的面孔时,他们无法说出哪些面孔是他们熟悉的,但是测谎器清晰地显示出脑正在作出这种鉴别,只是病人不知道罢了。这里我们再次遇到了这种情况,脑可以不觉察一个视觉特征却能作出反应。

      海马是脑的一部分,实际上它并不仅限于视觉,而与一种记忆类型有关。它在图52的顶端,标志为HC①。图中还画出了它与皮层的一部分称作“内嗅皮层”(图中标为ER)的连接。它的层数比大多数新皮层少。因为它的位置靠近感觉处理等级的顶端,人们禁不住猜测这里终于是视觉(及其他)意识的真正位置。它从许多更高的皮层区接受输入并投射回去。这种复杂的单向通路是再进入的――即,它返回到离出发点很近的地方――这或许也暗示着它是意识的所在之处,因为脑可能使用这条通路去反映它自己。

      这种假设看来很吸引人,但是遭到了实验证据的强烈反对。海马损伤可能由一种病毒性疤疹脑炎感染造成,这种病会造成相当严重、但有时很有限的损坏。看来病毒易于攻击海马及与其相联系的皮层。损伤的边界会很清晰。由于损伤可用删扫描定位且不再发展,病人在感染严重期过后数年均可进行复查。

      如果你碰巧遇到一个失去两侧海马以及邻近皮层区域的人,你并不会马上意识到他有何异常。看了这样一盘录像带你一定会感到吃惊。其中讲述了一个人,他能谈话,微笑,喝咖啡,下棋,等等。他几乎只有一个问题,那就是他不能记住大约一分钟以前发生的任何事件。在相互介绍时他会和你握手,复述你的名字,并进行交谈。但如果你暂时离开房间,过几分钟后再返回,他会否认曾经见过你。他的运动技巧均被保留,还能学习新技术,并通常能保持数年甚至更长,只是他记不起来是什么时候学会这些技艺的。他对分类的记忆是完好的,但他对新事物的记忆仅能维持极短的时间,随后就几乎完全丧失了。他在回忆脑损伤前发生的事情时也有障碍。简而言之,他知道早餐一词的含义,也懂得如何吃早餐,但他对吃过什么东西几乎没任何印象。如果你问他,他或许会告诉你他不记得了,或者会瞎聊,并描述他认为他可能吃了些什么。

      虽然从某种意义上说他失去了全部人类“意识”,但看来他的短时视觉意识并未改变。如果它受到了损伤,也只会是一种实验尚未揭示的细微方式。因此海马及其紧密相关的皮层区域并不是形成视觉意识所必需的。然而,流入和流出的信息通常有可能到达意识状态,因而有理由留意一下其中的神经区域和通路。这或许对找出脑中意识的位置有所帮助。

      对脑损伤的研究能得到一些其他方式无法得到的结果。遗憾的是,由于大多数情况下损伤是极复杂的,这些知识时常很模糊,令人着急。尽管有这些局限性,在顺利的情况下信息是明确的。脑损伤的结果至少能对脑的工作提供暗示,而这些可以用其他方法在人或动物身上探测到。在某些情况下,它证实了某些在猴子身上进行的实验所得到的结果在人身上也适用。

      =============================

      ①这些在动物身上取得的结果导致人们对脑分裂的病人进行更加仔细的检查。这些工作特别是由斯佩里、约瑟夫?伯根(Joseph Bogen).迈克尔?伽扎尼加(MichaelGazzaniga)、欧兰(Eran)、戴利亚?蔡德尔(Dahlia Zaldel)和他们的同事们开展的。

      ①在猴子身上进行了大量的平行工作,但在这里我并不打算叙述它们。

      ②实际上这个结果遇到了怀疑。例如,一种反对意见是,引起这种行为的原因是:眼睛把光散射到视网膜的其他位置,对应于病人可见的视野。但似乎并非如此,特别是现在表明照射到盲点的光不能产生这种效应。(回想一下,在盲点没有光感受器,因此不会对光反应。另一方面,盲视病人的光感受器是完好的,并能检测信号。最初损伤的是视皮层。)进一步的实验已经回答了所有这些反对意见,目前对于盲视是个真实的现象已没什么可怀疑的了。

      ①如果一个神经元的所有输出只到达死亡的神经元,它本身往往也会死去。

    • 家园 第十一章  灵长类的视皮层

      第十一章  灵长类的视皮层

      “我们应当尽可能把事情简化,但又不能过分。”

      ――阿尔伯特.爱因斯坦

      灵长类的大脑皮层由左右两片薄板构成,而每片薄板又可分成许多各异的皮层区域。如何确定皮层上一块特定的区域是否同属于一个皮层区呢?可能有效的判断标准有很多种。第一种方法是在显微镜下观察其剖面的结构形状――比如说,它是否具有延伸的第4层。我们已经观察到明确限定17区的条纹。这种简单的差异只在少数情况下是有用的,尽管可使用的分子探针更多时情况会有所改变。另一种方法是通过检测一个视觉区域的视觉映射的细节来寻找它的边界。但这种方法通常不太适用,尤其是在高层视觉区域,那里大多数几乎没有视网膜区域对应组织――即它们没有简单的视觉投射。目前最有效的手段是寻找每个假定区域的连接(包括输入和输出)的特征模式。应用现代生物化学方法可使这种方法得到相当可靠的结果。不过正如我们在第九章 所看到的,这些方法大多不适用于人脑。

      许多科学家对大脑皮层(特别是猫和猕猴)的功能划分作出了贡献。即便如此,我们的知识仍然是不全面的,只能看作是一种初步的结果。

      让我们从纹状皮层(17区)开始,它现在称作V1区(即第一视区)。V1区相当大,每平方毫米表面下有将近25万个神经元。在大脑皮层该数目通常大约是10万,V1区则是个例外。猕猴脑一侧的V1区总共有大约2亿个神经元。这可与来自侧膝体的大约上百万个轴突相比。从这些数字中我们马上能看出对从侧膝体到v1的输入必定有大量的处理。V1区并不比邻近的V2区更厚,而V2区的表面密度要低。这意味着,平均而言V1区神经元的体积相当小。这让人们产生一种印象,进化过程在合理的范围内尽可能多地将神经元塞进了V1区。

      来自侧膝体的兴奋性输入主要进入第4层,同时也有一些传到第6层。第4层有若干子区。来自侧膝体P层和M层的输入大多分别进入第4层的不同亚层,所有输入的轴突都广泛分叉,因此一个轴突可能与上千个不同的神经元接触。与之相应,第4层的每个神经元从许多不同传人的轴突接受输入。尽管如此,一个典型的棘状星形细胞只有部分突触(可能是20%)直接接受来自侧膝体的输入。其他突触接受来自其他地方的输入,这主要来自邻近的其他神经元的突触。这样,第4层神经元不仅仅聆听侧膝体的诉说,彼此也进行广泛的交谈。

      就像视网膜的输入映射到侧膝体一样,侧膝体的输入也映射到V1区。当然,这是一种对侧视野的映射。但这种映射并不是均匀的(图45)。对应于凝视中心附近的空间比视野外周要大得多。它使我回想起几年前流行的一幅幽默地图,描述的是一个纽约人眼中的美国。其中大部分是曼哈顿地区。新泽西被大大地缩小了,而加利福尼亚和夏威夷则仅在远处被附带标记上。

      此外,在小尺度上,皮层的映射极其杂乱无章。在双眼除了盲点及远离外周的所有地方,具有通过侧膝体向皮层的投射,这两条到达第4层的连接通路分离成指纹一样的无规则条纹(图46)。①在第4层以上和以下各层中,沿条纹中央有一系列“斑点”(用细胞色素氧化酶染色可显示出来)。这里的神经元对颜色和亮度特别敏感。

      一般而言,皮层V1区的不同神经元对不同的物体敏感。回想一下,侧膝体向皮层投射的神经元具有中心一外周拮抗的小感受野,猕猴第4层的一些神经元仍保持着这种特性,只是感受野稍大一些。在60年代,戴维?休伯(David Hubel)和托斯滕?威塞尔(TorestenWiesel)(他们后来都在哈佛医学院工作)发现,对于V1区第4层以外其他层的大部分神经元而言,最佳刺激是细的亮棒(或暗棒)或者边缘:而不是一个光点,(因为这项发现以及其他一些工作,休伯和威塞尔获得了1981年诺贝尔奖。)它们对运动棒的反应比亮暗闪烁的棒更好。对于任何特定神经元而言,它对具有某一特定朝向的线或棒状剌激的发放最剧烈。如果棒的朝向仅偏了15。,通常细胞的发放率也会变得很低。不同的神经元具有不同的最佳朝向,然而除了第4层某些部位以外,在垂直于皮层表面方向上直接相邻的神经元趋向于对同一朝向反应。这常被称作“柱状”排列。此外,如果沿水平方向穿过皮层,可以发现最佳朝向的变化相当平缓,仅偶尔会有突变。在皮层任意一个直径大约1毫米的小区域内,所有的各类神经元的感受野常常具有某种程度的重叠,并具有所有可能的朝向。这种排列被描述成“超柱”和“皮层模块”,不过不要过分地从字面上理解这种观点。遗憾的是,这种提法对于理论家来说过于流行。他们当中有些人应当理解得更好些。

      休伯和威塞尔发现了两大类朝向选择细胞,他们称之为“简单细胞”和“复杂细胞”,简单细胞的感受野的兴奋区和抑制区很容易定义,这种布局使它对棒或边缘的反应最佳。一些感受野的尺度比其他的更为精细,因而能反映更细微的特征。①

      复杂细胞与简单细胞的区别在于它们的感受野并不能简单地分成兴奋区和抑制区。要让它们发放,同样需要位于其感受野内的具有其最优朝向的一根棒或边缘,但它们对刺激在感受野内的位置并不敏感。其感受野常比邻近的简单细胞稍大些,此外,一些复杂细胞可对更复杂的刺激(如沿相同方向运动的一个光点图案)有反应。

      简单细胞或复杂细胞是如何设置输入连接从而产生了所观察到的行为的呢?应当清醒地认识到,在经过近三十年的研究之后。我们仍然不能确切地知道答案。从逻辑学的角度看问题显得很简单。对于简单细胞而言,只有当刺激点集的大多数总和起来形成最佳反应的棒,足以产生一个反应,它才会发放。它们进行一种“与”操作,但需要超过某个输入阈值才能引起发放,与之相反,当这根或那根直线(它们具有相似的朝向)在一个复杂细胞感受野内某处呈现时,细胞会发放。这好像复杂细胞接受来自一个由相似的简单细胞构成的完整集合的输入,并对其执行“或”操作。看来复杂细胞在处理上确实比简单细胞做了进一步加工,但深入的研究表明这种简单的观点导致了困难,因为许多复杂细胞具有直接来自侧膝体的输入。此外还有一个问题,就是最佳反应通常是对运动直线作出的。有时一个神经元对(垂直于直线的)一个方向的运动的反应比相反方向要大得多。

      特别遗憾的是这个问题尚未解决。至少有这样一种可能,即简单细胞执行“与”型操作,随后再由复杂细胞执行“或”型操作,这是大脑皮层的所有区域所使用的一般策略。倘若真是如此的话,那么了解它就是非常重要的。

      皮层V1区的神经元的反应形式有多种。正如我们已经看到的那样,第4层的许多神经元是中心-周边型的。斑点中的神经元也同样如此。其他大多数神经元具有朝向选择性,只不过有些神经元对不太长的直线(常指端点抑制)反应最佳(1),而其他的神经元,如第6层的许多神经元,对非常长的直线反应最佳。

      另一种类型的神经先从双眼接受输入,只有这种输入来自视网膜上位置不完全对应的神经元时,它的发放最强。这在提取视野中目标的距离信息时是必要的,因为不同距离上的物体产生的视差不同(这在第四章 解释过),我们已经看到,某些神经元对特定方向的运动敏感,而对相反方向的运动则没有反应。许多这样的细胞位于一个称作4B的薄层内。许多神经元对所有波长的可见光具有相同的反应,而其他有些神经元,特别是在斑点中的神经元,其感受野中央和外周的反应可对波长有选择敏感性。简而言之,它们对颜色敏感。所有这些都表明了V1区的不同神经元按不同的方式处理输入的视觉信息。

      感受野是视野的一部分,在其内部光的变化会引起细胞发放。然而,感受野外有大得多的周边区域,在该区域内光的变化本身不会引起细胞发放,但能调节由感受野产生的原有的效果。这个区域现在称作“非传统”感受野,它引人了一种关于局部环境背景的重要观点。这个环境可以具有特定的特征。一个细胞不仅仅对一个特定的特征敏感,同时也受邻近的相似特征的影响。这种神经行为的重要特性有可能出现在视觉等级的所有层次。它可能具有重要的心理学含义,因为心理学家发现在许多条件下环境是重要的。

      为什么皮层V1区具有视野的映射(尽管这种映射比较粗糙并有扭曲)?这并不是因为有一个小矮人观看它――我们的惊人的假说反对这种观点。最可能的原因是这样能保持脑的连线更短些。V1区的神经元主要关心的只是视野内一个小区域中发生的事情,它需要与其他一些神经元相互作用以提取它们表达的信息,一种大致的映射使得它们彼此保持相当近。理论家们指出,这种最短接线要求也可以解释在皮层发现的各种类型的分块现象,因为它允许在一个整体的主要映射中存在多个子映射。一个子映射中的一小块可能在内部有强相互作用,同时与同一子映射内的邻近部分有稍长一些的连接。这样的小块还可能与邻近的其他类型的子映射的部分有较弱的局部连接。按照同样的方式,有时把一座城市考虑成由许多具有共同利益的相互作用的地方社团组成,这是有好处的。如何布置这些团体,部分是为了使交流更便利,因此整个城市散布有许多超级市场,而每个居民都离其中某一家不太远。

      最终需要在所有层次上确定这个连接线的经济学问题。将该问题与新皮层神经元总数保持在一个合适的最小值的需要联系在一起,可以很好地解释皮层(特别是视觉系统)组织的一般规律。

      V1区以及其他各区的映射的构造形式是这样的:看来它的大尺度特性(比如,V1区中哪个区域对应于黄斑)可能是在有关基因的指导下随着脑的发育过程中固定下来的。映射的具体细节则是由来自眼睛的输入的调节产生的,它仿佛依赖于大量输入突触的发放是否相关。其中某些发育甚至可能在出生以前就开始了。在动物幼年早期有一个临界期,在此期间可能很容易实现这种接线的改变,但映射的某些改变则可在此后的生活中发生。

      ***

      有些习惯用语表征了神经元的反应特性(如V1区许多神经元对朝向的反应),它们是有用的。一个常用词是“特征检测器”,它确实抓住了事实,即有些神经元对朝向敏感,有些则对视差或波长敏感,等等。但它却有两个缺点。首先,它暗示神经元仅对它名字前的“特征”反应。(有些人或许认为它是唯一对该特征反应的神经元,但这远非事实。)这忽视了该神经元也可能对其他特征(通常是相关的特征)反应这个事实。例如,一个对朝向敏感、具有端点抑制反应的细胞对(适当位置适当朝向的)短线有很好的反应;但由于感受野的子结构,它也会对部分在其感受野内部的长得多的直线的曲率敏感。

      对特征检测器的第二种误解是它暗示神经元被脑用于产生那种特定特征的觉知。这不一定是事实,例如,一个对不同波长有不同反应的神经元并不一定是使你看到颜色的系统的一个核心部分。它可能属于另一个系统,仅仅将脑的注意引向颜色差异,而并不产生关于该颜色的觉知。

      另一个方面,由特征检测器编码的特征很少像工程师们设计的那样分成精巧的类型。现在很少提及这一点。例如,人们会认为一种“简单”类型的朝向选择细胞有两种方式设置其兴奋区及抑制区,一种沿感受野长轴方向是对称的,而另一种则是反对称的。①这些类型确实存在,同时还有许多其他相关但混乱的设置形式。我们在第十三章 将会看到,人们可以预料,这种结果恰恰是使用固有学习算法的神经网络演化发展而来的,而并非严格地由设计者事先设置的。

      为了理解一个神经元在脑的操作中所起的作用,我们至少需要知道它的感受野以及它的输出投射到何处,即与其轴突有突触接触的所有神经元。索尔克研究所的特里?塞吉诺斯基(Terry Sejnowsh)称之为“投射野”,与“感受野”这个术语相对应,在讨论(神经元在脑中的)“含义”时投射野可能扮演了重要角色。如果一个神经元的轴突被切断,那么它的活动对脑来说不会有多大意义。

      皮层V2区(视觉第2区)也很大。它也像V1区那样具有对侧视野的映射,从黄斑到周边V1区的映射的局部尺度(称为“放大因子”)有所变化,如果因此说它显得有些不寻常的话,那么仔细检查图45可以看出,V2区的映射甚至更为奇特,映射基本上分为两部分,大致对应于对侧半个视野的上、下部分。①同样,专用于黄斑附近部分的区域比视野外周部分更大。

      整体而言,V2区的神经无所敏感的一般特征与V1区大致相同,如朝向、运动、视差和颜色等,但也有差异。几乎所有V2区神经元接受双眼输入。它们的感受野常比V1区的神经元大,并能以更精细的方式作出反应。例如,有的神经元对某些主观轮廓②有反应。虽然在V1区也发现了有些神经元对线段端点型主观轮廓(图15)有发放,但对其他类型(如直线连续型,见图2)敏感的神经元确实只出现在V2区,而在V1区则没能发现。不只一位哲学家在得知存在这种对主观轮廓反应的神经元后感到吃惊,但我们并不以为奇。当我们清清楚楚地看到了一些视觉特征(而不仅仅是推断出它)时,在我们脑中确有某些区域的神经元对它们发放。这或许是一个好的普适规律。果真如此的话,它将是一个很重要的规律。

      皮层V2区也是分块的。使用可以显示V1区斑点的酶,可以看到相当粗糙的条纹,走向大致垂直于V1/V2的边界。每类条纹所敏感的一般视觉特征并不相同。看来有若干条不同的信息流通过V2区。有一条处理的主要是颜色信息,另一条则主要是视差,等等。科学家们对所有这些细节很感兴趣,因为这些问题正与不同亚区的各种神经元精确的分类方式以及它们如何使我们能够看见物体密切相关。即便在单个区域内,神经元的行为也被分成部分分离的类别,这对我们来说是重要的,尽管对于这种分离的清晰程度尚有争议。

      到此为止我只谈论了V1区具有向V2区投射的神经元。V2区是否有神经元反向投射①到V1区呢?答案是,具有反向投射的V2区神经元与有前向投射的V1区神经元几乎一样多,但有一个重要的差异。前向投射多集中在V2区第4层,而到V1区的反馈完全避开了第4层。

      以前曾经认为只存在三个视觉皮层区域,即17、18和19区。我已经详细地描述了其中的两个区域,V1区(等价于17区)和V2区(早先定义的18区的一部分)。此外到底还有多少区域呢?令人吃惊的是,现在至少已经识别出二十个不同的视觉区,另外还有七个区域部分与视觉有关。这个事实本身清楚地体现了视觉处理的复杂性。由于各个区的神经元具有不同的输入输出集合,因此它们的行为极为不同。图47是戴维?范?埃森(David VanEssen,

      现在西雅图的华盛顿大学)构建的猕猴展平的皮层的模型。由于皮层是弯曲和折叠的,图示必然会有所扭曲。①为了减少扭曲,在皮层薄板上有选择地进行了切割,得到了一个几乎隔离的V1区,插入在图的左侧。将该图与图48相比较,那里略去了表示皮层折叠的标志,并在相应位置上画了许多皮层区域,视觉区域以及那些具有部分视觉的区域都用阴影表示。对猕猴而言,它们总计占有总皮层略多于一半的区域,(要记住猴子是视觉功能非常强的动物。)

      这张图远非最后的结论。例如,右上方的46区仍可被细分。许多区域具有奇怪的名字,但它们通常是其全称的缩写,如MT代表中颞叶(middle temporal),VIP代表背侧内顶叶(ventral intrapari-etal),等等。其他有些区域具有数字编号(在此省略),它们通常是波罗德曼所定义的,其中一些已经被细分(如7a和7b)。

      我将简要描述其中两个区域:MT区和V4区,因此对已知的关于全部视觉区的所有情况不作叙述。这特别是由于对许多视觉区的了解还相当缺乏。皮层MT区比较小,有时也称为V5区。它具有视野半区与视网膜区域相当好的对应,但其神经元的感受野一般比v1或V2区大。MT区神经元对刺激的运动(包括运动的方向)特别敏感,每个神经元对一定速度范围内的刺激产生发放。有些对高速运动发放最佳,其余的则对应于低速运动。

      最初人们没有想到这些神经元的反应通常依赖于目标与背景的相对运动。加利福尼亚理工学院的约翰。奥尔曼(John Allman)意识到了这一点。因为与许多神经科学家不同,他对猴子以及它们的野生生活方式非常感兴趣,至今他仍在家中养猴子。他曾数次出国在猴于的自然栖息地对它们进行研究。因此他具有关于猴子的典型视觉环境的第一手资料。他试图在实验室中以一种大大

      简化的形式再现这种环境。他和同事们使用电视屏幕上由随机点组成的棒作为刺激,通常一个神经元可能对其感受野内沿垂直于它的长度方向向上(或向下)运动的斑点组成的棒有很好的反应。然而他发现,如果由斑点组成背景也沿相同方向运动,神经元的发放会下降。如果背景沿相反方向运动,那么该神经元对运动棒的发放将会提高。这样,神经元主要检测的是局部特征与邻近背景的相似特征间的相对运动。这正是前面提及的非经典感受野的最简单形式。虽然事情并不总是这样明了,①看来这样的神经元组成的集合能够学会不仅仅对一个物体的一个特征反应,也能对物体的某些环境特征反应。

      MT区的某些神经元对更复杂的运动方式反应。它们的行为与所谓的小孔问题有关,考虑图49,想像在一个屏上有一个小圆孔,通过它来观察一根没有特征的直线,它是一根很长的直线的一部分,这根长的直线的大部分被屏所掩盖,如果这根直线沿任何方向运动,你通过小孔所能看到的一切只是一小段直线沿垂直于它长度的方向运动。在图49的注解中有更加详细的解释。

      V1区中对运动方向敏感的神经元的行为便是如此。它所能感受的只是垂直于该直线方向的运动分量,而不是整个物体的真实运动。然而,MT区的某些神经元确实能对实际运动反应,特别是如果信号是由若干个线段集合组成的。实验表明MT区的神经元可简单地分成两类,一类能解决小孔问题,另一类则不能,就像们区的神经元那样。如果真是这样的话,那太好了。事实则要复杂得多。神经元表现出了这两类之间整个范围内的各种行为。尽管如此,这给出了一个例子表明视觉系统较高层次神经元的反应如何变得更加精细。

      如果输入信息被误解,脑就会作出错误的解释。一个大家所熟悉的例子是理发店的柱状旋转招牌形成的错觉――这个柱子实际上是绕着它的长轴旋转,但条纹看起来像是沿柱子方向向上运动①。红、白条纹边界上的任意点的实际运动方向垂直于柱子的长度方向。但脑却看到条纹沿柱子方向运动。图50解释了这个现象。

      皮层MT区的神经元几乎不对颜色敏感。不过其中一些对照度相同而仅由颜色差异形成的边界的运动有反应。这与皮层V4区的神经元形成鲜明对照。V4区的神经元对波长的反应很复杂,但对运动几乎不敏感。②它们的感受野通常很大,但在某些情况

      下神经元能对感受野内任意位置上具有恰当视觉特征的小物体作出反应。这个映射具有复杂的视网膜区域对应,但不像V1区那样简单。

      许多颜色反应是颜色视觉理论引导我们所期待的“双拮抗反应”。更重要的是,伦敦大学学院的神经生理学家赛米尔?泽奇(Semir Zeki)表明它们的行为具有兰德效应(见第四章)。它们的反应不仅仅取决于感受野中央和外周的光的波长,还受邻近表面的光的波长的强烈影响。大致说来,它们不是只对波长反应;而是对感受颜色反应,猕猴V4区的一个神经元对由不同颜色的长方形组成的图案中的一个红色色块反应。而泽奇自己也认为它是红色的。即使有照明光波长的干扰,从该色块到达视网膜的光的实际波长已有很大差别,该神经元仍能有反应。这显然是环境影响神经元行为的另一个例子。对于心理学家来说,认识到在某种程度上对环境的反应专门由单个神经元来加以表达,这一点很重要;他们应当在他们的理论模型中考虑这一点。

      图48给出了目前已知的视觉区域的示意图,但并未涉及它们之间的连接方式。一般而言,主要的信息流从左侧的皮层V1区开始,流向右侧远端靠近脑前部与皮层非视觉区交界处的那些区域。通常用一个粗略的映射大致代表这些投射,它意味着在接受区彼此邻近的轴突终端一般来自发送区相距不太远的神经元。这也会出现在没有视网膜区域对应的区域,比如在等级中较高层的区域。

      范?埃森和同事们试图采用由神经解剖学家凯瑟琳?洛克兰(Kathleen Rockland)和迪帕克?潘德亚(Deepak Pandya)最早提出的观点,把所有视觉区按照大致的等级作一排列。洛克兰和潘德亚特别指出,如果从A区到B区的投射集中在第4层,那么,从B到A的反馈一般避开第4层而通常与第1层有强连接。我们已经看到在V1和V2之间的连接出现过这种情况。如图51所示,可以相当简单地表示这种观点。从眼到脑的投射(主要集中于第4层)称为“向前投射”,反方向的则称为“反向投射”。

      这个关于第4层的连接的规则总是成立的吗?事实比较复杂。不过已经证明,使用图51的约定,有可能将已知的大部分连接用单个等级图表示。最新的一种形式见图52。(别忘了图中每根连线代表沿两个方向的大量轴突。)你不必因这张连接示意图的复杂细节望而生畏,只需注意到它体现了视觉处理的复杂性(如果你看不出其他东西的话)。极少有人会想到他们的脑是以这种方式构建的。

      关于第4层约定的协议有一些例外是值得重视的。例如在相同层次的皮层区之间有许多互连接。简单的第4层规则并不包括它们。因而在构建该图时使用了更为精细的规则。现在还不清楚真实的布局是否只是拟等级排列的,或者对这些更复杂规则的例外是否主要是由实验误差引起的,不管怎样,毫无疑问各个区域可以粗略地按一个近似等级的方式排列。如果存在例外的话,它是否具有特殊的意义呢?只有进一步的工作才能回答这个问题。的区域。所有连接是双向的,这个规则几乎总是对的,但也有例外。①随便说一句,图52并不打算显示连接强度(例如,每根直线代表多少轴突),这主要是因为这方面信息太少。图52中某些线代表上百万个轴突,其他的可能只有十万个,或者更少。

      皮层中邻近区域总是互相连接在一起吗?通常如此,但也有少量例外。

      等级排列也得到不同来源的证据的支持。它是不同区域神经元活动的一般规律,当我们沿着该等级上升时,其行为大致遵循两条规律:感受野的大小不断增加,因而在最高层区域的感受野通常覆盖整个半侧视野,甚至还部分地或全部包括了另外一半视野(这主要经过胼胝体连接来实现的)。此外,引起神经元反应的特征变得越发复杂。V2区的一些神经元对某些主观轮廓有反应,而MT区的一些神经元对略微简单的运动图案有反应(我们已经看到,它们能够解决或部分解决小孔问题)。MST区的神经元对整个视野内的运动有反应,有的发放对应于物体正在逐渐靠近并变大,有的则对应于物体在后移,V4区的神经元对颜色感受有反应,而不仅仅是光的波长。

      在较高皮层中,我们发现了对脸的正面有反应的神经元。它对脸相对于凝视中心的位置并不敏感,甚至当脸略微倾斜也不受影响。这样的神经元对由眼、鼻、嘴等随意组合成的图像几乎不反应。另外一些神经元对脸的侧面最敏感,另一方面,7a区的神经元主要对一个物体与头或身体的相对位置敏感,而不那么关心该物体是什么。后者是下颞叶(那些缩写中间是IT的区域,如CITd)的主要任务,这些己在识别脸的描述中提到过。几乎可以肯定还可以发现许多更复杂的反应。

      由此可知,一般每个区域从更低层区域接受若干输入。(这些低层区域提取的特征要比V1区所反应的相当简单的特征更复杂。)然后它对这些输入的组合进行运作,以便产生更为复杂的特征,并把它们传到等级中的更高层次上。同时,信息分成若干相互作用的流顺着等级向上流动。我们已经看到了一些例子,如来自视网膜的部分分离的M信号和P信号,从V1到V2来的三支信息流,以及更高层次上的“是什么”和“在哪里”。但必须强调这些流之间常常有某些信息交换。

      反向通道又怎样呢?这也迫切需要更详细的研究。人们可以想像它们的各种功能。它们也许能帮助形成前面提到的非传统感受野,从而允许高层次的行为影响较低的层次。它们也可能属于这样一个高层次系统:当较低层区域的操作己在略为全局的层次上获得了成功时,则向它们发回信号,表示应当对其突触进行修正,以便将来能更容易地探测出这个特征。它们还可能与注意机制和进行视觉想像的机制紧密相关。它们或许对神经振荡同步(见第十七章)有作用。这些仅仅具有一定的可能性,但其中哪些是事实尚有待进一步考察。

      此外,整个系统看起来并不像一个的固定不变的反应装置。它更像是由许多以相当高的速度传导的瞬间动态相互作用所控制的。最后,我们不要忘记我所描述过的一切是应用于猕猴而不是我们人类的。当然我们有理由假设我们自己的视觉系统与猕猴相似,但这仅仅是个假设。就我们目前的全部知识而言,差异可能不仅在细节上,而且还可能在其复杂性上。

      如果新皮层有某些秘密的话,这就是它有能力在处理等级上进化出新的层次,特别是在那些等级较高的层次更是如此。这些额外层次的处理可能是区别人或高级动物与刺猬这样的低级动物的特征。我猜测新皮层使用了一些特殊的学习算法,使得尽管每个皮层区域包含在复杂的处理等级上,但它们各自都能从经验中提取新的类型。这种能力可能使大脑皮层区别于其他形式的神经结构,如小脑和纹状体(它们并没有这种复杂形式的等级)。

      这些观点都只是推测,但有一件事情相当清楚:虽然有许多不同的视觉区域,每一个区域以不同的复杂的方式分析视觉输入,但是,迄今为止无法定位出单个区域,其神经活动精确对应于我们看到的眼前的世界的生动图像,看着图52,人们也许会想,这一切或许发生在某些更为高级复杂的结构(如海马)以及与之相关的皮层结构(标记为HC和ER)当中。它们位于等级的顶端。但是我们在第十二章 将会看到,一个人可能会丧失脑的两侧的所有这些区域,但仍报告说他能很好地看到外界事物,而且他的行为表现似乎也是如此。简而言之,虽然我们知道脑如何分解视觉图像,但我们仍不知道它如何将它们整合在一起的,它又是如何构建出视野中所有物体及其行为的组织良好的详细的视觉觉知呢?_

      ======================

      ①同一物种的不同猴子的条纹和斑点的准确图案大致相似,但在细节上并不完全一样。即使对一只猴子而言,脑一侧的图案与另一侧也不相同。这就好像你左手的指纹与右手并不完全一样,由于同样的原因,这种细节多少依赖于发育过程中的偶然事件。我们又一次面对这种形式,它具有某种程度的秩序,但细节上则是显著的杂乱无章。

      ①最大的混乱在于这种细胞是否可能完成视觉场景的付氏变换。从字面上讲这是荒谬的。在任何情况下,它们更适于完成伽柏(Cabor)变换。但甚至这种观点是否有实际用途尚有待确定。可以肯定的是,某些神经元对细微的细节(它们常被称作“空间频率”)反应最佳,而其他一些神经元则对中间或更粗糙的细节反应更好。

      ①如图15所示,它们可能参与形成由直线端点构成的错觉轮廓。

      ①前者相应于一个衰减的余弦波,而后者相应于衰减的正弦波。

      ①这有助于我们去领会在展平的皮层表面显示凝视中心及视野的水平和垂直子午线的位置的那些标志。

      ②主观轮廓,也称作“错觉轮廓”,是我们看到的一些虚假的直线,它们实际上在视野中并不存在(如图2和图15)。

      ①我称之为“反向投射”,因为习惯上把从视网膜到侧膝体到V1期后到V2的广泛的信息流认为是“向前的”。人工智能领域的工作者通常用自下而上这个术语来代替“向前的”一词。他们称相反方向的信息流为自上而下的。

      ①从数学的角度讲,某些位置的高斯曲率远偏离0。

      ①最近,哈佛医学院的理查德?波恩(Richard Born)和罗杰?图特尔(RogerTootell)显示在果猴MT区有两种类型的神经元,每一种都存在于许多小的柱状簇之中。第一种类型的行为与文中的描述大致相同,第二种类型的神经元,其外周并不抑制反而增强神经元的主要反应。

      ①该方向也可能向下,这取决于柱子的旋转方向以及条纹画的方式。

      ②V4区很大,事实上,范?埃森把它分成三个子区:V4t、V4d,V74v。

      (1)V4向V1的反向投射很强,但从VI到V4的向前投射通常很弱,或者没有。

    • 家园 第十章  灵长类的初级视觉系统

      第十章  灵长类的初级视觉系统

      “我眯起一只眼睛偷偷地看,事情原来是这样……”

      ――儿童游戏

      “看”本身是一个相当复杂的过程。因此,脑中的视觉部分并不那么简单也就不足为奇了。它们是由一个庞大的初级系统、次级系统和许多更高级系统构成。各个系统都要接受来自于上百万个神经元的输入。这些神经元位于眼睛的后部,称之为神经节细胞。初级系统通过丘脑的侧膝体与新皮层相连接。次级系统要投射到前面提及的四叠体上丘。

      眼睛的一般结构如图38所示,它具有一个可自由调焦的晶状体,至少对四十五岁以下的人是可以自由调节。还有可改变孔径大小的瞳孔。在较强的光照下,孔径就会变小。晶状体把视场内的图像聚焦到位于眼睛后部的一片细胞之上,这薄薄的层称为视网膜。在其中一层上有四种不同的光感受器,它们对于入射的光量子有响应。由各自的形状取之名,如,视杆细胞和三种视锥细胞。每只眼睛里视杆细胞的数量超过十亿,它们对于微弱的光有响应,且仅有一种类型。视锥细胞的数目约有七百万,它对强光有响应,且具有三种类型,每种对入射光的不同波长范围有响应。正因为这样,我们才能看到不同颜色。这一点在第四章 中已作过介绍。

      当输入信息经过视网膜时,需进行第一步加工,事实上,视网膜本身就是脑极其微小的一部分,与新皮层相比研究它就更容易些。美国生理学家约翰?道林(John Dewling)把它称为通往脑的窗口。它也许就是能够完完全全了解脊椎动物脑的第一步。尽管它的结构也许是很值得研究的,但我仍把它看作一个“黑箱”,并仅仅介绍有关它的输入与输出之间的关系。所谓输入就是指射入眼睛的光线,而输出就是指神经节细胞的发放。①

      用于明视觉或日间视觉的锥体细胞在眼睛中央凹附近的分布密度极高。因此,我们才能够看到极其微小的细节。这也就是当你为了看清楚某个感兴趣的东西时,你就会注视它的原因。与此相反,当你在黑暗中能够把某个物体看得清楚,这正是由于视网膜上具有很多的视杆细胞。

      眼睛以不同方式移动,它可以跳跃或移动,称为扫视,一般每秒钟为3-4次。灵长类动物的眼睛可以跟踪某个运动目标,这是一个“平滑追踪”的过程。令人难以理解的是当你要使你的眼睛沿着静止的场景做平滑移动时,这几乎是不可能的,如果你一定要试图这样做时,你的眼睛将会做跳跃式的移动,还可以做各种连续的微小移动。不管用什么办法使视网膜上的图像完全保持平稳,那么在1-2秒钟后这种视感觉依然会消失。(这个问题将在十五章作更加详尽的讨论。)

      把信号从眼睛传送到大脑的细胞称为神经节细胞。任何一个特定的神经节细胞只能对视场中某一特定位置上的小光点开启与关闭有响应,见图39所示。由于晶状体把这个光点聚焦到视网膜上该神经节附近的地方,因此它一定要在那个特定的位置上。但这也依赖于眼睛聚焦点的位置。(就像在照相机中,底片上某一特定点的反应既与它在底片上的位置有关,还与照相机聚焦的方向有关。)视场中能够对一个单细胞活动产生影响的区域称之为感受野。

      在完全黑暗时,神经节细胞的发放常常是很低且无规则的。这种发放称为背景发放率。有一类神经节细胞叫做ON中心型,即当一个光点投射到感受野中心时,它的发放骤然增加。在这个小的中心以外,围绕它们有一个圆形范围。在这个区域上,如果同样用小光点刺激它时,则发生与之相反的作用。如果光点完全落在环形区域上,则背景发放就完全停止。而当撤光点时,将有一丛脉冲发放(见图39左侧)。

      假定视网膜上放置各种大小的光点,使它们的中心位于该细胞感受野的中间区域,正如我们所见,当用小光点刺激时,该细胞就强烈发放,而光点的直径越大其响应越小。当这个光点大到足以覆盖中心及围绕它的环形区域时,则该细胞根本就不发放了。换句话说,感受野中心区域的响应与周边是相反的,这就意味着任何一个特定神经节细胞对在恰当位置上的光点刺激具有强脉冲发放,而对其整个区域的均匀光刺激并没有响应。视网膜就是要去掉部分传入眼睛里的冗余信息。它传送到脑中的正是在视野中的感兴趣的信息,在那里光分布是不均匀的,而要忽略的正是几乎不变的部分。

      与ON中心型细胞数目差不多的另一类细胞是OFF中心型细胞:大略地讲,它们与第一类细胞性质正好相反,即当在感受野中心把光点撤走时,它会有强烈的发放(见图39右图)。这就说明了许多神经元相当一般的性质,即它们可以把这些峰电位下行传送到轴突、一个神经元不会产生负向的峰电位。那么,它们又怎样传输负信号呢、在丘脑或皮层中要找出一个快的背景发放率,比如说200赫兹,这是相当不容易的。如果这样一类细胞存在的话,通过增加其发放率到400赫兹,则产生一个正的响应,通过降低其发放率至零则产生一个负的响应。通常,替代这种神经元的有另外两类相当类似的神经元,它们都具有很低的背景发放率,一类是当某一参数增加产生发放,另一类则对其减少而有响应。当没有施加任何刺激时,神经元通常也不作出任何反应,更不是200赫兹,这大概是为了保存能量。

      如果大脑要传送在某点按正弦形变化的神经活动,那么当信号为正的时候则某个神经元发放,当它为负时,则另一个神经元发放。但需告诫的是不能用太简单的数学函数去描述所发生的一切:,而且,一个真实的神经元常常对输入的突然变化以初始阶段的一丛发放作出响应。而这种时间上的发放模式随神经元而各异,神经元并不是按照数学家的便利而进化的。

      神经节细胞的感受野大小是相当不同的。位于眼睛中心区域的要比外周的感受野要小。节细胞之间相对讲相距是比较近的,因此,它们的感受野是相互重叠的,在视网膜上一个光点通常会引起一组相邻神经节细胞的兴奋,即便它们发放程度并不一样。

      神经节细胞并不仅仅只有两种主要类型,即ON中心或OFF中心。它们实际上还有好多类别,且每类又包含有其亚型,在哺乳动物中这样的分类方法在各物种间也稍有不同,对于猕猴来说,有两个主要分类,①有时称为M细胞和P细胞(M细胞是指Magno,意思为大;P细胞是指Parvo,意思为小)。人眼的神经节细胞与其极为相似。在视网膜的任何地方,M细胞都比P细胞大,而且也具有大的感受野。它们还具有粗厚的轴突,这就使信号的传导速度加快。同时,M细胞对光强分布中的微小差别敏感,因此它能够很好地处理低对比度。但是它们的发放率在高对比度时会达到饱和,它们主要用于对视觉场景中的变化发出信号。

      P细胞的数量更多,与多数M细胞相比它们的反应具有更好的线性,即正比于输入。而且它们对细节、高反差及颜色更感兴趣。例如P细胞感受野的中心对绿色波长反应很强,但与环绕中心的外周区对红色波长更敏感。正是由于这个原因,中心与外周具有对不同颜色光的敏感性,则可以把P细胞分成几类亚型,每种亚型对不同颜色的反差有敏感。在这里,我们再次看到,视网膜不仅只是传输落到光感受器上的原始信息,实际上,它已经开始通过多种方式对信息进行处理。

      神经节细胞主要包括M细胞和P细胞,每一类都具有ON中心和OFF中心的感受野,它们通过轴突将信号传导到丘脑的侧膝体,然后再将信息传输到新皮层。而且,视网膜也还要将信号投射到上丘(Superior Colliculus),但P细胞并不投射到那里,尽管一些M细胞和其他各种非主要类型的细胞可以投射到上丘。由于缺乏P细胞的输入,上丘是色盲的。

      ***

      在大多数脊推动物中,右眼的神经节细胞几乎全部投射到左脑的视顶盖(大致相当于哺乳动物上丘),而左眼与此相反。在灵长类动物中,各种投射更加复杂些。每只眼睛投射到大脑的两侧,但脑的左中侧仅接受与视野中右半部分有关的输人。

      因此,用你右眼中央凹看到的东西,被送到左边的侧膝体,然后再达到左边的视皮层,见图40所示,并且也可以到达左边的四叠体上丘。当然,正常的大脑两半球通过几处神经纤维束相互联系在一起,最大的纤维束是胼胝体。如果出于医学的原因,把它切掉(这在第十二章 将会讨论),这个人的左脑只看视野中的右边的部分,右脑只看到视野中的左边,这会产生某些令人很奇怪的结果,几乎就好像有两个人在一个脑里。

      让我们先扼要地介绍一下投射到上丘的次级系统。这是低等脊椎动物(如蟾蜍)主要的视觉系统;对哺乳动物,它的许多功能已被新皮层等完成,而其余的主要功能似乎如眼动的控制,也可能还包括视觉注意的一些方面。

      上丘是一个分层结构,主要有三层,称之为上中下。上层接收来自视网膜的各种输入,同时也接收来自听觉系统和其他传感系统的输入。各种输入具有粗略的映射关系,尽管这种映射的细节物种各异。下层的输入就更具多样性了。

      很重要的一点是下层中的一些神经元与大脑对侧的上丘相连接,这条通路被称为顶盖间连合(它在第十二章 描述的裂脑手术中保持完好)。下层的神经元也连接到脑干上的神经元,控制着眼或颈部的肌肉活动。

      这些神经元具有什么样的特性呢?上层中的许多细胞对运动具有选择性。在猕猴中它们是色盲的,即对人射光的波长没有选择性。它们对微弱的刺激很感兴趣,但对刺激的细节不怎么敏感。不管是给光或撤光,它们对光的变化都会作出瞬时性反应。这些大概都是无意识的注意产生的关键。它们发出类似于“注意!有什么东西在那儿”的信号。

      任何作过演讲的人可能有这样的经验,当突然发生变化时,例如,演讲者的左边或右边的门打开了,所有的听众的眼睛同时朝向那个方向,这种即刻的反应在很大程度上是无意识的。我认为上丘是产生这类眼动的主要因素。

      眼睛究竟怎样知道该往哪里跳跃呢?这就要感谢戴维?斯帕克斯(David Sparks)、戴维?罗宾逊(David Robinson)和其他一些人设计的精巧实验。现在我们对眼动有更好的了解。其实上丘的上层也许可以看作感觉的投射,中间与下层对应于运动系统的投射。在这些区域中,神经元的发放对眼睛变化的方向与振幅进行编码,以便使眼睛以跳跃的方式跟随靶目标。在跳跃之前那一霎那这个信号或多或少是与眼睛的位置无关。这个信号被送到脑干以决定需要作出多大且在什么方向上的跳跃。

      这种信号并不能用工程师所猜测的那种方式来表达。一个神经元也许对特定的跳跃方向编码,而它的发放率可能对跳跃的距离进行编码。因此,用这种方法,一个神经元的小集合就可以对所有的方向和距离编码。另一种方法是每个神经元就可以对跳跃的向量,即方向和距离进行编码。实际上并不是这样的。为了产生一个跳跃,上丘中一片神经元就开始快速发放。从广义上讲,它是确定跳跃向量的运动映射图的活动中心。这样一个特定的上丘神经元也许参加到许多极为不同的跳跃中。正是这些激活的神经元作为一个整体以便确定跳跃向量特性。简言之,一次眼动都将受到许多神经元的控制。①

      眼动的速度究竟由什么来控制呢?这可能与激活区域内神经元的发放率有关。它们发放得越强,眼睛移动得也越快。因此,最终的跳跃方向不仅依赖于有关的神经元发放有多么快,而且还依赖于这群活动的神经元的有效中心在运动系统定位图上的位置。

      你可能会发现这种排列方式很独特,但它是个极好的例子,可以说明一群神经元怎样对相关的参数,如:眼动的速度与方向进行编码的。它的优点是如果一些神经元不参与活动了,整个系统也不会停止工作,没有一个工程师能够设计出这样一个系统,除非他已经了解脑是怎样工作的。当这些信号到达脑干时,必须以不同的信号集合去传递,以便控制眼睛的肌肉。究竟怎样恰当地做到这一点还待进一步研究。

      现在让我们考虑通过侧膝体投射到视皮层的初级视觉系统。侧膝体是丘脑的一小部分。当我1976年去索尔克研究所,我继承了属于已故的布鲁诺?布鲁诺夫斯基(BrunoBronowski,电视连续剧“The Ascent of man”的制作者)可以鸟瞰海洋的办公室,和一个两倍于真实脑的彩色塑料模型。我开始着手干的就是找出侧膝体在模型上的位置。我很容易地找到丘脑,但花了好多时间才找到了一个上面标着侧膝体的小突起,但,这也没有什么可惊讶的,因为它只不过是由150万个神经元构成的。

      了解侧膝体需要抓住两点,第一点,它仅仅是一个中转站。第二点则与前一点相反,它还干了许多到目前为止我们还未曾了解到的更加复杂的工作。

      侧膝体中为主的神经元是主细胞(principal Cell),它产生兴奋性反应。此外,还有一小部分具有GABA受体的抑制性细胞。侧膝体被称为中转站有解剖上和生理上的两个原因。主细胞直接接收来自视网膜的输入,并且经轴突传送到皮层V1区,这条通路上再没有其他神经元。因此,称其为“中转站”。这些轴突很少有侧枝连接到其他主细胞上或侧膝体的其他部分。换句话说,这些神经元倾向于保持孤立而不愿与同伴进行交流。另外,视网膜的输入被映射到侧膝体,以使侧膝体上每一层对来自视野的映射稍有畸变。侧膝体的神经元的感受野比视网膜细胞的要大一些,且二者间是极其相似的。乍看起来,侧膝体仅仅是把视网膜接收的信息原原本本地传递到视皮层。

      “MAP”这个词在视觉系统中有两种稍稍不同的解释。它的一般意思来源于那些在供体中相距不太远的神经元,直连接到受体域中彼此靠近的轴突的终点。这就要在接受域中产生供给域的粗略的映射。更严格的意思是指“视网膜映射”,在某一特定的视域中彼此相邻近的神经元趋向于对视网膜上相邻点上的活动反应,也就是将视网膜上相邻点从视域上三维信息转换成二维投射。当对视觉系统更高层次作进一步探索时,视网膜映射由于许许多多步的近似映射会越来越变得杂乱无章。但是,从一个区域到下一个区域的映射仍然保存得相当完好。

      猕猴的侧膝体共有六层,见图41所示,其中两层是由大细胞(称之Magno cellular)构成的,它们分别接收右眼或左眼的输入,但彼此间却几乎没有什么相互作用。而且输入主要来自视网膜的M细胞。很自然也会联想到视网膜的P细胞也是按照类似的方式投射到另外两层具有许许多多的小细胞上(称为Parvo cellular)。但是,它恰恰并不是只有两层,而是共有四层。它们的输入是分别来自两个眼睛,且总是保持分别输入的。

      大细胞层与小细胞层究竟起着什么不同的作用呢?在两个实验室用训练过的清醒的猴子去完成各种视觉任务,然后在侧膝体上做了局部的小损伤。这些实验大致能表明:小细胞层中的神经元主要携带有关颜色、纹理、形状和视差的信息,而大细胞层的神经元主要检测运动和闪烁目标(见参考文献2)。

      到目前为止,我们仅讨论了兴奋性的主细胞。抑制性细胞主要分为两类,它包括侧膝体本身与丘脑的网状核团中的细胞。网状核团是在丘脑中一薄层,千万不要与脑干中的网状结构相混淆。这一薄层的细胞围绕着丘脑的大部分,且神经元都是抑制性的。它们接收的兴奋性输入来自传人到新皮质或由此传出的轴突,而且它们彼此存在着相互作用。它们的输出又被立即映射到在它们下面的丘脑部分。如果把丘脑看成是通向皮层的大门,那么这些网状核团就好像看守大门的卫兵了。

      侧膝体中的神经元还可以从皮层V1区获得反馈输入。令人奇怪的是,从V1区反馈的轴突比上行到皮层的轴突更多,但这些下行的轴突与远离胞体的树突形成突触。因此,它们的影响会大大地被削弱。这些反向的连接确切的功能还不甚清楚(有关它们功能的一些猜测请看第十六章 )。

      当然,它也有来自脑干的输入,调制着丘脑的行为,尤其是网状核团的联系。这意味着动物清醒时,侧膝体中的神经元可以自由地传送视觉信息。但是,当动物处在慢波睡眠时,这种传送就被阻断,这里已较详细地叙述了一些与丘脑有关的神经元以及各种类型的突触联系,然而有关侧膝体的特性应能表达那种既简单又复杂的令人难以理解的组合。

      侧膝体中的主细胞投射到视觉皮层(见图40所示),猫的轴突可以到达几个视觉区,但猕猴与人的轴突几乎都连接到视觉的第一区(1)。(在猴的皮层中,它与其他区域的联系较弱,这个问题与第十二章 讨论的育视有关。)如果人或猴的V1区中全部受到严重损伤,他(它)的视野的一半几乎全盲。

      乍一看,大脑皮层的任何部分都是那么杂乱无章。每一平方毫米大约有10万个神经元;轴突与树突相互交错,还有许多起支撑作用的胶质细胞与微血管都混杂在一起,完全处于混饨状态。它们可不像计算机的芯片上晶体管和其他结构的布线有着整齐的排列。如果进一步作仔细观察,也会发现它确有部分结构是有序的。在大脑皮层的许多不同区域中,神经元的一般排列还是具有好多相同之处。让我们首先看看这些共同点究竟是什么。

      大脑皮层就是一片薄薄的层,它的垂直厚度比平行于该层表面的长度要小很多,神经元的排列与外观是非对称的。与这一薄层表面相垂直的方向称之为垂直方向(这如同把皮层在桌面上展平一样)。另外两个方向称之为水平方向。例如:几乎所有的锥体细胞都有沿垂直方向上升到皮层表面的树突。与之相比,皮层水平方向上的细胞彼此有着相当类似的特性。这与森林中的树木的排列有点类似,垂直方向与水平方向有明显的不同。

      皮层最引人注目的特性就是层状的。了解这些层以及各层中神经元不同的功能是很重要的。为描述上的方便,可以把它分为六层。实际上在层中也还包含有几个亚层,见图42所示,最上面的一层为第1层,它具有很少的细胞体,主要是由位于它下面层中的锥体细胞向上延伸形成的树突末梢及末梢间的相互连接的轴突构成。因此,它都是这些神经布线而很少有细胞体。在它的下面是2、3层,常常被统称之为上层。在这些层中有许多锥体细胞。第4层是由许多兴奋型的星状细胞组成,而几乎没有锥体细胞。它的厚度在不同的皮层区变化是相当大的,在一些皮层区几乎没有这一层。第5、6层称之为下层,它包含有许多锥体细胞,其中一些细胞的树突末梢一直可到达第1层。

      在不同层中的神经元之间不仅是相当不同的,而更重要的是这些神经元的连接方式也极不一样,见图43所示。

      上层(第2,3层)的细胞仅与其他皮层区相联系。尽管它们中的一些神经元通过胼胝体可与大脑另一侧的皮层区连接,但它们的投射作为一个整体未超出皮层区。虽然第6层的一些神经元具有与第4层连接的侧向轴突,但它们当中神经元主要反向投射到丘脑或屏状核,它是位于皮层下的附属于皮层的核团,并通向脑的中部。第5层是皮层中很特别的一层,只有这层的神经元完全投射到皮层以外的地方,也就是说,它们不投射到丘脑和屏状核,尽管也有一些神经元投射到其他的皮层区。因此,从某种意义上讲,第5层把在皮层中处理完的信息传送到大脑其他部分和脊髓。所有这些远离皮层的连接,甚至包括反向的连接都是兴奋性的。

      当然,皮层也具有许多抑制性的细胞。但在数量上占多数的是产生兴奋性的锥体细胞,用GABA作为神经递质的抑制性细胞大约占了整体的五分之一,剩下的主要是刺星状细胞。这些可产生兴奋的刺星状细胞的轴突相当短(约100-200微米),仅仅能够与水平方向上相近的细胞联系。所有抑制性细胞都具有这种特性,但也有些例外。①

      有一类抑制性的细胞好像不存在。锥体细胞的轴突经常向下延伸到离皮层相当远的区域。在此之前,它通常会伸出几个分枝,这称为侧枝。在某些情况下,这些侧枝又形成许多局部分叉,而且它们就在同一皮层区域内沿水平方向伸展相当长的距离,约几个毫米。

      如果我们认为皮层能够实现计算功能,它就应该具有一种类似“门’;的特殊类型的抑制性突触。在把结果沿主要轴突的分枝传送到其他区域的目的地之前,它要能够允许信息通过轴突离开胞体,并在皮层区域内循环好几次,也就是说,它需要实现几次循环计算。为此,我们需要一个强抑制的突触集合,但它不在该轴突的起始端,而是位于轴突就要离开皮层之前的地方。尽管有一位理论家为了使他的模型能够工作,需要构建这样一类突触,但实际上还没有证据说明它们的存在。在轴突各个分叉点上也没有发现。

      这些却显示出皮层区总像是没有做任何循环的处理就急急忙忙地将信息发送出去。这也意味着,当大脑需要通过反复迭代运算建立一种活动的共同体时,各个皮层区的连接与单皮层区内的连接是同样重要的。

      ***

      信息究竟在皮层的各层之间是怎样传递的?这是一个极其复杂的问题,然而我们可以从下面粗略的框图获得一些了解(见图43)。

      进入皮层区的主要的,但不是唯一的入口位于它的第4层。但当它很小或不存在时,就直接进入第3层的下部。第4层主要连接到上部的第2J层,然后,又依次与第5层形成一个很大的局域连接,一直到达位于它下面的第6层。第6层又依次通过短的垂直联系返回到第4层。第1层还接收来自其他皮层的一些主要的输入。这些与来自低层的高锥体细胞的树突末梢相联系。

      关于小片皮层中的许多轴突连接的复杂性质,特别是某一层到其本身的许多连接是惊人的长,以上这些都未作介绍。很显然,在所有这些规律性的后面也还存在着一些必然的联系。然而,在我们对皮层有较深了解之前,要讲清楚这些规律是太困难了。新皮层可能是人类无上的荣耀,故它不会轻易地将其秘密公诸于世。

      最后将谈到大脑的分区。最初,皮层的分区是根据在高倍光学显微镜下,观察切片染色后的形状(这类学术研究称为结构学)。纹状皮层正是由于它具有着明显的水平方向纹理而得名,这些纹理是从大的轴突末端沿各个方向水平伸展出而形成的。这些纹状足够的大,可以从染色的显微镜切片中,用肉眼观察到纹理,见图44所示。这些纹理突然在一大片皮层区域的边缘上消失了。因此,很自然地,把这样一块相当一致的区域给它起个名字或排个序号。皮层其他区域稍微有些不同。例如,纹状皮层具有很厚的第4层,而初级运动皮层即便有的话也是很少的。遗憾的是,相邻的区域的差别如此细微,以至于神经解剖学家们之间也无法达成一致的见解。20世纪初,德国的解剖学家科比尼安?波罗德曼(KorbinianBrodmann)把包括人在内的各种哺乳动物的皮层分成几个不同区域,并给每个区域排序。他把纹状皮层叫做17区,与它相邻的区域定为18区,与18区相邻的区域称为19区。把初级运动皮层标为第4区。其他一些神经解剖学家,如奥斯卡和赛西勒?沃格(oskar andCecile Vogt)把皮层分为更多的区域。①

      虽然波罗德曼的划分基本上是正确的,但总的说来这种划分太粗略了。比如说,17区、18区、特别是19区都是与视觉有关。在下一章 将会涉及到17区可以看作为单个区域,18区和19区还包括许多重要的亚区,因此,这样一些术语就不再使用了。当然在某些医学文章中,他们对人的皮层还沿用这样的划分。

      总而言之,视觉系统的初级部分是高度平行的即许多类似的但不同的神经元在同一时刻都处在活动状态。位于眼后部的视网膜是处理视觉输入的前端,它沿着两条主要通路将这些信息传送到通往皮层通路上的侧膝体及与眼动有关的上丘,还有脑干几个较小的视觉区,它们与眼动、瞳孔的调节有关。与颜色有关的信息传送到侧膝体,但不到达上丘。这些初级部分的信息都是相当局域和简单的。我们要是能看到任何东西,就说明这些视觉信息都必须在视觉系统的不同区域被作了进一步处理。

      ===============================================

      ①在哺乳动物中,即使存在着从脑其他部分投射到视网膜的神经元,也是很少的,当然,移动我们的眼睛,可以影响视网膜神经元的发放。

      ①还有第三类,有时被称为“w细胞”,包括相当多的神经元,并且具有各种特性。

      ①然而,请注意,由于所需的输出仅是一个简单的二维向量,因此,当一个区域同时要处理更为复杂的信息时,这种方法是不能用的。

      ①也称为“纹状皮层”和“17区”。

      ①一个例外是一种被称为“篮状细胞”的抑制性神经元,它的轴突在皮层内延伸长得多的距离,能有一个厘米或更长。当它们与另外一个神经元连接时,在它的胞体和附近的树突上形成多个突触。因此它们能在神经元的重要部位产生相当强的抑制。它们确切的功能还不了解,我们这里也忽略了一种著名的抑制性细胞的功能,这类细胞被称为“枝形细胞”(chandelier cell)。它的轴突仅与锥体细胞相联,并且仅在它们轴突的起始部位,形成多个抑制性突触。

      ①就是奥斯卡?沃格切开并且检查了列宁的脑袋,苏联当局为了这个目的而授权与他。

    • 家园 第九章  几类实验

      第九章  几类实验

      “研究是一门艺术,即如何设计一些方案去解决那些难题的艺术。”

      ――彼得?梅达沃爵士(Sir Peter Medwar)

      严格他说,每个人所能确信的只是他自己是有意识的。比如说,我知道我是有意识的。在我看来你的行为举止与我很相似,特别是你使我相信你是有意识的,故而我很有把握地推断你也是有意识的。倘若我对自己的意识的本质感兴趣的话,我就不必仅仅把研究局限在自己身上,而完全可以在别人身上做实验,只要他们不是处于昏迷状态。

      要揭示意识的神经机制仅仅靠对清醒的受试者进行的心理学实验是不够的。我们还必须研究人脑中的神经细胞、分子以及它们之间的相互作用。我们可以从死者的脑中获得关于脑结构的大部分信息。但要研究神经细胞的复杂行为,则必须在活体上做实验。实验本身并不存在什么难以克服的技术问题。更多的是由于伦理道德方面的考虑使得许多这样一类实验变得不可能,或是十分困难。

      大多数人并不反对在他们的头皮上放置电极来测量脑电波。但是为了直接把电极插入活体脑组织而要移去部分头骨,即便这只是暂时的,也是众人所不能接受的。即便有人甘愿为了科学发现而接受开颅实验的话,也不会有医生同意实施这种手术。他会说这是违背其希波克拉底誓言的,或者更有可能说会有人为此而控告他。在我们这个社会里,人们会自愿参军并不惜受伤甚至牺牲,却未必会愿意仅仅为了获取科学知识而接受那些有危险性的实验。

      有少数勇敢的研究者在他们自己身上做实验。英国生物化学和遗传学家霍尔丹(J.B。S.Haldane)就是一个著名的例子。他甚至写了一篇关于这方面的文章,名为《作自己的实验兔子》(On Being One’s Own Rabbit),此外还有一些医药史上令人传颂的故事,如罗纳德?罗斯爵士(Sir Ronald Ross)在自己身上证明蚊子传播疟疾。但除此以外,为那些可能有助于满足科学好奇心的实验去充当受试者,这是不被鼓励的,甚至是被禁止的。

      在某些情况下,必需对一些病人在清醒状态下做脑部手术。这样,如果病人同意,便可在裸露的脑做一些很有限的实验。由于脑中没有痛觉感受器,病人不会因为裸露的脑的表面受到轻微电刺激而感到不适。遗憾的是,在手术中可供做实验的时间通常很短,而且也很少有神经外科医生出于对脑的细微工作感兴趣而进行这种尝试。这种研究是在本世纪中期由加拿大神经外科医生怀尔德.彭菲尔德(wilder Penfield)开创的。近一个时期西雅图的华盛顿大学医学院的乔治?奥杰曼(George Ojemann)领导进行了该领域的研究。他用短暂的刺激电流抑制电极附近的一小块区域内神经元的活动。如果电流足够微弱,去掉后并不会造成永久的影响。他将精力集中在与语言有关的皮层区域;这是因为当他切去患者的部分大脑皮层以降低他们癫痫病发作的可能性时,他希望尽可能少地使邻近的语言区受到损伤。

      奥杰曼有一个实验结果很出名。患者自幼会讲英语和希腊语。当大脑左侧新皮层表面的一些区域受到电刺激时,她暂时无法使用某些英语词汇,但这并不影响她使用相应的希腊语,刺激其他部位则会出现相反的情况,这表明两种语言的某些特征在脑中的定位有显著的差异。

      ***

      在大多数情况下,我们只能从头骨外研究人脑的行为活动。①现在已有多种不同的扫描方法可以获得活体脑的影像,但它们在空间或时间分辨率上都有很大的局限性。大多数方法过于昂贵,并且出于医学上的考虑被限制使用。

      因此,神经科学家们优先选择在动物身上做实验便不足为怪了。虽然我并不确信一只猴子也像你一样有意识(consciousness),但我有理由认为它并非完全是一个自动机,即那种行为复杂但完全缺乏觉知(awareness)的机器。这并不是说猴子与人一样具有自我觉知(self-awareness)。一些实验,如镜中识别的实验等,表明某些类人猿(如黑猩猩),可能具有一定程度的自我觉知。而对猴子而言,即便有自我觉知,那也很少。但仍有理由大胆断言猴子具有一种与人类相似的视觉意识,只不过它无法用语言来表达而已。

      例如,可以训练猕猴让它鉴别两种非常相近的颜色。这些实验表明,猕猴的表现与我们人类是可以相比的,大约在2倍以内。而对于主要在夜间活动的猫则远非如此,大老鼠则相差更大。由于黑猩猩和大猩猩过于昂贵,很少用它们做伤害性实验,如果我们主要关心的是哺乳动物脑中的分子特征,那么作为实验动物大老鼠和小白鼠是最好又是最便宜的。虽然它们的脑的特征在许多方面比人类要简单,但是脑的分子却可能与我们非常类似。

      用猴子和其他哺乳动物而不用人做实验还有个优越之处,即目前它们更适于用来进行神经解剖学研究。原因很简单。几乎所有现代的关于脑中长程连接的研究方法部利用了神经元中分子的上行和下行的主动运输。为此需要把某种化学物质注射到动物活体脑中的某个部位。该物质在脑中沿着神经元之间的连接被运送到与注射点直接相连的脑的其他部位。这一过程通常需要几天时间。此后,实验动物将被无痛苦地杀死,并检测注射物质所到达的部位。用人做这种实验显然是不可能的,由于这种局限使得我们对猕猴脑的长程连接的了解远比对我们自己的了解丰富得多。

      人们或许认为,这种知识上的明显的空白会使神经解剖学家忧心忡忡;由于人脑与猕猴的脑并不完全相同,他们会特别要求研究人体神经解剖学的新方法,然而事实并非如此。其实,现在是改变我们在人体神经解剖学上的缺陷的时候了,那些有远见的基金会应当立即着手从事有关的新技术的发明。

      即使我们设计出可以在人身上进行神经解剖学研究的新方法,仍有许多关键性实验只能在动物身上进行。这些实验有时会持续几个月。尽管大多数实验没有什么痛苦,或只有很少的痛苦,但实验结束后常常需要把实验动物杀死(仍旧是无痛苦的)。动物保护组织坚持要求善待实验动物,这无疑是对的。由于他们的努力,实验室中的动物现在得到的照顾比以前要好一些,但是,倘若把动物理想化,那就太多愁善感了。与被捕捉的动物的生活相比,野生的食肉和食草动物通常过着严酷的生活,寿命也较短。有一种观点宣称由于人和动物都是“自然的一部分”,因而应当完全平等地对待他们。这是没有道理的。难道一只大猩猩真的应当享受大学教育吗?一味坚持完全像对待人类那样对待动物,这种说法贬低了我们人类所独有的能力。动物应当受到人道的待遇,但若将它们置于同人平等的地位,那则是一种扭曲的价值观。

      作为神经解剖学和神经生理学的实验对象,猴子有什么局限性呢?训练机灵的猴子完成一些简单的心理学测试是可能的,但这很费力。有个实验要求猕猴保持凝视(即注视同一点)。当它看到水平线段时按动某一控制杆,而看到垂直线段时按动另一控制杆。这样的训练通常需要几周甚至更长的时间。而让大学毕业生来做这个实验则多么简单!此外,人作为受试者可以用语言来描述他们所看见的一切。他们还能告诉我们他们所想像到的或是梦见的情景。而要从猴子身上得到这种信息则几乎是不可能的。

      看来只有一种策略是可行的。这就是分别在人和动物上做某些不同类型的实验。这需要假设猴子的脑与人脑的相似程度(以及差异性),但这尚有一定的风险。没有风险就不能取得大的进展。因此,我们既要大胆地按此方法进行研究,又应足够谨慎,尽可能地经常检查我们的假设是否合理。

      研究脑波的一种最古老的方法是脑电图(EEG)。它将一个或多个粗电极直接放在头皮上。脑中有大量的电活动信号,但是头骨的电学特性干扰了对电信号的提取。单个电极将提取多至上千万个神经元产生的电场信号,因而单个神经元对电极贡献的信号淹没在它临近的大量神经元的活动中。这就好像试图从1000英尺高度上研究城市中人们的谈话一样。你能听到足球赛场中人们的叫喊声,却无法判断那里人们用何种语言交谈。

      脑电图最大的优越性在于时间分辨率相当高,大致在1毫秒左右。这样便可相当好地记录到脑波的上升和下降。人们尚不太清楚这些波意味着什么。处于清醒状态与处于慢波睡眠状态的脑波有非常显著的差异。快速眼动睡眠时的脑波与清醒时很相似。因而它又有个别称――反常睡眠,即人处于睡眠状态,但他的脑看上去却是清醒的。我们的梦幻大多出现在睡眠的这一阶段。

      有一种常用的记录脑波的技术是在某种感觉输入(如耳听到的一声尖锐的卡搭声)之后立刻记录。与背景的电噪声相比,由刺激引起的反应通常很小(即信噪比很低)。因此,从单独一次反应中几乎看不出什么,实验必须重复多次,并以每次事件的开始作为基准对所有信号进行平均。因为噪声总是被平均掉,所以这样可以提高信噪比,并通常可得到一条可完全重复的典型的脑电波曲线,它是与脑的活动相关联的。例如,反应中常存在着一个被称为P300的尖峰,其中P表示正电位,300代表给刺激信号与尖峰之间有300毫秒的时间间隔(见图35)。它通常与某些令人吃惊并需要注意的事件有关。我猜测它大致是从脑干传向记忆该(刺激)事件的高层脑区的一种信号。

      遗憾的是,要确定产生这种事件相关电位的神经活动的位置是件困难的事。问题在于,如果我们知道每个神经元的电活动,从数学上讲就能计算出放置在头皮上任意位置的电极上的效果。反之,从电极上得到的电活动却无法计算出脑中所有部位的电活动。从理论上讲,可以在头皮上产生同样的信号的脑活动分布几乎有无穷多种。尽管如此,即便我们不可能恢复出神经活动的全部细节,但仍希望对大部分这些活动发生的部位有所了解。通过在整个头皮上放置一定数目的电极,我们可以对大部分神经活动的定位有较好的了解。如果一个电极记录到较大的信号而其他电极的信号都较小,那么大部分神经活动可能发生在记录到大信号的电极附近。遗憾的是,实验中情况要复杂得多(1)。

      从这些事件相关电位中能获得一些很有限但非常有用的信息。举例子说,皮层的听觉部分主要位于脑的颞叶附近。如果一个人生来就是全聋的话,那里的情形会是怎样的呢?有一项研究选择了那些双亲也是耳聋的聋人。这样几乎可以肯定他们的天生

      的缺陷是遗传引起的,该缺陷可能是在于耳的构造上而不是在脑中。心理学家海伦?内维尔(Helen Neville)和她的同事们通过观察事件相关电位发现,这些患者对视野外周信号的某些反应与听觉正常者相比有一个大得多的尖峰(延迟时间大约150毫秒)。这些增强现象出现在通常与听觉有关的前颞叶及额叶的一部分。

      人们对这种由来自视野外周的信号引起的增强反应并不感到惊奇,因为当聋人相互打手势时,他们的目光主要固定在打手势者的眼睛和脸上。因此,大部分手势信息来自凝视中心的边缘区域。作为对照,内维尔还研究了那些双亲耳聋但本身听觉正常且学习过美国手语的受试者。他们并没有像天生耳聋的被试者所表现出的神经活动的增强现象。这表明学习美国手语并不能引起上述的增强效果。

      内维尔推测,因为完全耳聋者缺乏正常的与声音有关的神经活动,在脑的发育过程中部分视觉系统通过某种方式取代了部分听觉系统。对于具有听觉的人,可能是正常的听觉输入阻止了任何视觉区域取代皮层的听觉区域。目前的动物实验表明这种想法是有道理的。

      一种近代技术研究了脑产生的变化的磁场。这种磁场极为微弱,仅为地磁场的极小一部分。因此,使用了一种称为squids(超导量子相干装置,superting quantuminterference devices的缩写)的特殊检测器,并小心地把环境中变化的磁场屏蔽掉,使得整套装置不受干扰。最初仅使用了一个squids,但现在使用一组共37个这种探头。它通常比脑电图具有更好的空间定域性。此外,它的优越性和局限性都与电场相似,只是头骨对磁信号的干扰要小得多。磁探头所响应的偶极子源垂直于产生脑电图的电偶极子,因而能检测到脑电图所丢掉的信号。反之亦然。

      虽然squids探头并不便宜,但进行研究脑波的实验并不十分昂贵。而其他主要扫描方法不仅需要昂贵的仪器,运行的开销也很大。这些扫描设备数目极少,并几乎都归医学机构所有。它们每次只能产生脑的一个片层的活动影像。因而要覆盖某个人们感兴趣的区域,通常需要好几个片层的成像。

      大致来说扫描技术有两种,分别探测脑的静态结构和动态活动。最早的一种技术称为CAT扫描,即计算机辅助X射线断层照相,它利用了调射线,一种较现代的技术――磁共振成像技术(MRI),能产生极好的高分辨率图像。就目前所知,它对实验者的脑不产生伤害。通常的使用中,它记录质子(即氢原子核)的密度,因而对水特别敏感。它得到的图像具有很好的对比度,但该图像是静态的,并不记录脑的活动(见图36)。除此之外,两种方法都清晰地呈现出不同的大脑之间的大致结构的差异。在各自适合的环境下,两种方法均能探测到脑受到打击、枪伤等伤害引起的结构损伤。只不过不同的技术所容易探测到的伤害的种类各不相同。采用一种特殊技术之后,MRI扫描可以产生活体人脑的三维重建,包括外观。图37是神经哲学家帕特丽夏.丘奇兰德的脑的一个侧面。

      正电子发射X射线断层照相术(PET)是一种不同的方法。它可以记录脑的局部活动,但记录的是这些活动在大约一分钟左右时间内的平均值。实验者被注射一种无害的放射性原子(如15O)标记过的化学物质,通常是水。该放射性原子在衰变时会发射一个正电子。①被标记过的水进入血液。15O的半衰期很短,这意味

      着它从回旋加速器产生到注射人体内必须在很短的时间内完成。但它有两个优点:氧衰变非常快,因而大约十分钟以后就可做第二次实验;放射性物质寿命很短,这意味着为了取得所需信号而使实验者所受的辐射总剂量非常少,造成的伤害是可以忽略的。因而该方法可以用于健康的志愿者,而不必仅限于体弱的病人。

      当脑中一部分的神经活动比平时加强时,供给它的血液也增加。实际上,计算机生成的图像对应于扫描得到的各个部分脑区的血流水平。其他的实验扫描了处于控制状态被试者的情况。两幅图之间的差异与脑处在被刺激状态和控制状态时神经活动的变化是大体一致的。

      这项技术已经得到了大量有趣而又具有挑战性的结果。特别值得一提的是圣路易斯的华盛顿大学医学院马库斯?雷克尔(Mar-cus Raichle)所领导的研究小组。在早期的实验中他们研究了对一小组视觉模式的反应。这些模式是经过选择的,可以在皮层的不同的、相当宽的区域中产生最大反应。在新皮层的初级视觉区域的血流变化与通过早期对人脑的损伤研究中所预料的结果大致相同。此外还发现皮层其他视觉区域的血流也有变化,但它们是否有价值目前尚不清楚。

      他们最近研究了被称为“斯特鲁普干扰效应”(Stroop interfer-ence effect)时血流的变化。这是一种更复杂的视觉任务。在实验中要求被试者尽可能快地识别一个单词的颜色。比如说,被捕捉的目标可能是用绿色印刷的红色这个词。词的颜色(绿色)与词义(红色)之间的差异会引起被试者反应时间增加。将这种任务下的血流分布与另一种直接情况(即单词红色被印成红颜色)相比较,他们发现,在斯特鲁普(Stroop)条件下,有几个皮层区域出现了血流增加的现象,其中增长最大的区域是“右前扣带回”,它在脑的中部,靠近额部。他们认为这与完成任务所需注意的程度有关。他们由此得出结论:“这些资料表明,前扣带回参与了下述的一种选择性过程:即,以先前形成的一些内部的有意识的计划为基础,在这两种情况中进行竞争性的交替处理。”我感觉这种说法更接近于我们考虑的自由意志,而不是通常意义下的注意(见本书末尾的附言)。很显然,我们需要更多地了解有关的不同处理过程的神经机制。

      PET扫描可以获得一些其他方法很难得到的结果,但它也有若干局限性。除了昂贵以外,其空间分辨率并不很高(虽然它也随多数现代仪器一起逐步改进),目前通常大约为8毫米。它的另一个不足之处是时间分辨率相当差。为了获得好的信号需要大约一分钟,而EEG的工作在毫秒范围。

      一些居主导地位的研究中心目前把PET扫描与MRI扫描二者结合使用。PET记录脑的活动,而MRI得到脑的结构,这样便可把PET扫描结果影射到同一个人的脑上,而不是像过去做的那样影射到一个“平均”的脑上去。然而,不久对这些结果的解释就会遇到上述由于缺乏详尽的神经解剖学知识而产生的局限。

      现在又发展出一些使用MRI扫描的新方法。其中一种方法对类脂化合物特别敏感。扫描得到的图像可以用来帮助定位某个人的一些不同的皮层区域(不同人的这些区域的准确位置有所不同)。这是由于某些皮层比其他部位具有更多的有髓鞘的轴突,含有更多的类脂。

      其他一些新的MRl方法试图探测各种新陈代谢及其他脑活动,而不仅仅探测其静态结构,但它们的信噪比似乎都比常规的MRl低。因而人们期待看到这些新方法的发展。

      关于人脑的研究就先叙述到这里。有什么方法可以观察到动物脑中神经元的行为呢?有一种方法是用较细的电极获取最为详细的信息。这是一根尖端暴露的绝缘导线。将动物麻醉后,移去部分头骨,并将电极正好放置在神经组织内。由于脑中没有痛觉感受器,因而该电极并不会使动物感到痛苦。只要微电极的尖端离某个细胞非常近,它就可以在该细胞外探测到它在什么时候发放。它还能收集从较远的细胞传来的较为微弱的信号。将电极尖端沿它的长度方向在组织内移动,就可以一个接一个地检测神经细胞的活动,实验者可以选择将电极置于动物脑中的位置,但从某种意义上说他记录的究竟是哪种类型的细胞完全要看运气了。现在人们常使用一组电极进行记录,这样就可以同时探测不止一个神经元的活动。

      另一种技术是对从动物脑中得到的神经组织的一层很薄的切片进行研究。在这里使用的电极是一种非常小的玻璃管,它的尖端逐渐变细。小心地放置电极使它的尖端刚好在一个神经细胞内部。这样可以得到关于该神经元的活动的更为详细的信息。(这项技术也可用于麻醉的动物而不会损伤其脑部,但用在清醒的动物则要困难得多。)如果浸泡在合适的培养液中,脑片能维持许多小时。在脑片中很容易灌流不同的化学物质来考察它们对神经元行为的影响。

      在某种情况下,从非常年幼的动物的脑中提取的神经元能够在碟子中生长并向四周扩展。这样的神经元在生长时会与周围临近的神经元接触,这种条件与活着的动物体的环境相差更远,但它可以用来研究神经元内部连接的基本行为。这些连接的膜上有通道。当通道打开时,允许带电原子(即离子)流过。

      最令人吃惊的可能是当前有可能研究单个离子通道中单个分子的行为。这是通过一项称为“膜片钳”技术实现的。欧文?内尔(Erwin Neher)和伯特?萨克曼(Bert Sakinann)因为发展并应用这项技术而荣获1991年诺贝尔奖,他们使用了一种小型玻璃吸液管,它具有一个特殊的倾斜尖端,直径约12微米,能从类脂膜中吸起其中的一小片。如果运气好的话,这小片中至少会包括一个离子通道。经过电放大器及记录装置可对穿过该膜的电流进行研究。在这小片膜的两侧相关离子的浓度保持着不同的值。当通道打开时,即使只有很短暂的时间,也有大量带电离子奔涌穿过。这种汹涌的离子潮产生了可测量的电流。即使只打开一个通道也是如此。这样人们便可研究神经递质及其他药物制剂(通常为其他的一些小的有机分子)的效果,以及膜电压的作用。

      膜片钳也被用来进行另一项关于离子通道的研究。该通道的基因被人工引人到未受精的蛙卵中。在这些外来基因的引导下,卵母细胞(即未受精卵)会合成这种通道的蛋白并将其放置于外膜。这样就可以利用膜片钳将它吸取出来。这种技术对于发现某种特别的离子通道的基因很有帮助。

      现在作一总结,目前有许多种方法研究人和动物的脑。其中一些方法从头颅的外面进行研究,另外一些方法则直接深入脑的内部。所有的方法都有这样或那样的局限性,或者是时间分辨率或空间分辨率不足,或者过于昂贵。有些结果非常容易解释,但仅能提供相当有限的信息;另外一些测量做起来很容易,结果却很难解释。我们只有综合不同的方法才有希望解开大脑的奥秘。

      ==============================

      ①在极少数情况下,出于医学原因必须在脑组织中很深地植入永久性电极。但植入的电极数量很少,故能得到的信息也十分有限。

      ①目前常用的一种近似方法是假设脑中存在四个中心产生大部分这些电活动。这样,通过数学手段有可能求出这些中心的大致位置。有一种方法用来检验这种假设的有效性,即假设存在五个中心并重复上述计算。如果得到的四个中心很强而另一个非常弱,那么四个中心的近似就可能是相当有效的。即便如此,这也仅仅是一个有根据的猜测罢了。

      ①正电子在与电子结合以前会漫游一小段距离。结合后,两个粒于都湮灭,它们的质量转变成辐射,成为按几乎相反方向运动的两束了射线。记录这些γ粒子的是一个环状的相干计数器。有一台计算机综合处理所有衰变的痕迹,并分析出最可能产生这些γ射线的区域。

    • 家园 第八章  神经元

      第八章  神经元

      “脑的功能不可能与它的基本单元――神经细胞一的功能完全没有联系。”

      ――伊丹?赛杰夫(Idan Segev)

      由于“惊人的假说”强调了“你”就是大量神经元行为的体现,因此,你应该对神经元以及它究竟做些什么有个粗略的了解。尽管神经元的种类繁多,但其大多数都好像按照同一幅蓝图构建的一样①

      一个典型的脊推动物的神经元对于施加在它的胞体、枝体――它的树突(见图28所示)――上的电脉冲刺激具有三种响应模式:有些输入使它兴奋,有些使之抑制,还有的可以对它的行为进行调制。当神经元变得相当兴奋时,它就会将一个峰形的电脉

      冲下行传至它的输出电缆,即轴突,这样一根轴突通常也有许多分枝。电信号将沿着各个分枝及小分枝传输直至与其他神经元相联系的轴突,它也会对其他神经元的行为产生影响。

      这就是神经元的主要工作。它通常是以电脉冲形式接收来自许许多多其他神经元的信息。实际上,它就是对这些输人进行复杂的动态加和,然后把处理后的信息以电脉冲流的形式沿着它的轴突传输到许多其他的神经元,虽然神经元为了维持这些活动及合成分子需要能量,但它的主要功能就是要接收和发送信号,简而言之,就是处理信息。一个类似的情况是:一个政治家会不断地收到来自那些想让他投票赞成或反对某一项措施的人士们的信息一样,当他在表决时就必须考虑所有这些信息。

      在没有任何信号时,神经元通常也会沿着轴突以相对较慢、无规则地传送背景脉冲。这种发放率一般是1-5赫兹(1赫兹表示一秒中有一个脉冲或一个周期)。这种连续的“易激动”活动状态,可以使神经元处于警觉点,并随时对新的刺激做出更强烈发放的准备。由于神经元接收许许多多兴奋的信号,使它处于兴奋状态,则它的发放率就会增至一个很大的值,典型的为50-100赫兹或更高。在短时间间隔内,发放率可达到500赫兹,见图29所示。1秒钟内有500个脉冲,乍听起来觉得很快,但把它与家用电脑的处理速度作一比较,它是极慢的。如果一个神经元接收一个抑制性的信号,它的电脉冲输出可能比正常的背景发放率更少些。但这种减少是那么小,以至于它只能传送相当少的信息。神经元只能沿着轴突下行传送一类信号。当然没有“负”的峰电位。而且,这些电信号一般从胞体沿着轴突单向下行传输,直至这些轴突的终端。①

      神经元是什么样子的?它是由什么构成的?在许多方面,神经元类似于人或动物体内的其他细胞。它的许多基因由DNA构成,而DNA位于细胞内一个被称为“细胞核”的特殊结构中的染色体上。细胞体内还有其他一些特殊结构,它们(例如:细胞的能源基地――线粒体)具有自己的DNA。体内几乎所有细胞都有两套基因信息的复制品,①分别来自每个母体。每一套都约有1 0个不同的基因。②并不是所有的基因都在所有的细胞中活动。有些在肝脏的细胞中更活跃,有些在肌肉细胞中更活跃,等等。一般认为,在脑中各个部位的基因比任何其他器官中所具有的基因都更加活跃。

      这些基因的大多数对某种或另一种蛋白质合成的指令进行译码。如果把每个细胞看作一个工厂,那么蛋白质就是使这个工厂进行运转的快速而又精巧的机械工具。蛋白质一般的体积通常是细胞体积的十亿分之一,它是如此的小,用光学显微镜都无法看到。但它的形状(不是其近乎原子结构的精确细节)有时还能够用电子显微镜观察到。每一种蛋白质都具有它自己极为精细的特定分子结构,它们是由成千上万个原子按照各自独特的方式连接在一起的。生命中起关键作用的分子正是以原子的精确性而构筑起来的。

      细胞中的所有东西被包容在有点流动的类脂膜内,这层膜能阻止蛋白质和它们的产物离开细胞,膜上的一些蛋白质好比灵敏的门或泵,控制各种分子进出细胞。整个细胞结构是由那些有机的分子构成,且具有灵敏的控制部件,以便使细胞可以进行自复制,并且与体内其他细胞有效地进行相互作用,简而言之,在如此小的空间内,竟发生如此奇迹般的化学反应,这是经历了儿十亿年自然选择进化的结果。

      神经元与体内的其他细胞泅然不同:成熟的神经元既不会移动,也不会聚在一起和发生正常的分裂。如果一个成熟的神经元死后,(除极少外)它不会由新的神经元代替。与许许多多其他细胞相比,神经元的外形更具刺突形。神经元树突的分枝随其不同的类型各异,但它通常有几个主要的分枝,而每个分枝又可分成几倍之多的小分枝。细胞体(常称为胞体)可长成各种不同大小,一般其直径约为20微米。①

      在新皮层中最常见的一类神经元叫作锥体细胞,它的胞体稍像角锥,在顶部有大量的树突,见图30所示。其他神经元,例如星状细胞,在各个方向上都有分枝,见图31所示。

      神经元的轴突(输出电缆)可以非常长,例如,像你的脊椎柱能有几英尺长,否则你就无法摆动你的脚趾(记住一个神经元胞体的半径很少有大于千分之一英寸)。没有脂肪髓鞘包着的轴突的直径通常很小,一般在0.1-1微米范围内。轴突外面包着脂肪髓鞘,它的电脉冲传输速度要快于不带髓鞘的。

      ***

      轴突中的峰电位并不像导线中的电流。在金属导线中,电流是由一团电子携带的。在神经元中,细胞绝缘膜上有蛋白质构成的分子门,电效应依赖于通过分子门进出轴突的那些带电离子。由于离子来来回回的运动使跨膜的局域电位发生变化。正是电位的这种变化要下行传输到轴突。这个信号要不断地更新,需要补充能量。因此,沿着轴突下行传输的脉冲不会衰减,而且它的形状和幅度在终点与起始点大体相同。这样的一个特性就使得峰电位在被传送很长的距离后,还能对与轴突未端相联的神经元产生明显的作用。

      在19世纪,人们错误地认为峰信号的传导速度很快,以至于无法测量,或许是以光速传播。在上个世纪中叶,由亥姆霍兹(Helmholtz)最终测出这个速度,才发现它很少有超过每秒30英尺的(这个速度约为声音在空气中传播速度的三分之一)。当时包括亥姆霍兹父亲在内的许多人对这个结果感到非常惊讶。对没有脂肪鞘的轴突,它的速度一般为每秒5英尺,这个速度看上去相当低(实际上,它比自行车的速度还低),它等价于每毫秒行走1.5毫米。

      轴突的远端需要得到来自胞体分子的给养,因为几乎所有的基因与大多数用于蛋白质合成的生物化学物质都在胞体内,而不在轴突内。沿着轴突存在着双向的系统的分子流动。观察用高倍放大的光学显微镜拍摄的这种分子的流动是极不寻常的,它展示出小的粒子彼此缓缓地行进着,有些下行到轴突,有些是上行至胞体;有些行进速度稍快些,有些则不然。但是,所有这些流动的速度都远远低于轴突中峰信号的传播速度。很自然,为指挥和控制这种运输,就需要有特殊的分子部件参与工作。

      神经元经典的观点认为树突(输入电缆)是“被动的”,这意味着当电位从树突的某个位置传到另一个位置时,它是衰减的。原因是一些离子漏过了细胞膜而引起的,就像摩尔斯电码信号沿着横穿大西洋的电缆行进了相当长的距离后,常常也会衰减一样。正是这个原因,树突一般比轴突短,通常它的长度仅有几百微米。现在有种猜测,认为有些神经元在树突中也存在着主动的过程,但是它们或许并不与轴突中发现的完全一样。

      电脉冲沿着轴突向下一直传输到神经元之间的特殊的连接处――突触。每个神经元在它的树突与胞体上有许许多多突触。一个小的神经元约有500多个突触,一个大的锥体细胞可多达2万个。新皮层中每个神经元平均约有6000个突触。由于峰信号是电信号,对下一个神经元的作用主要也是电的,因此,可能会认为突触也是某种电接触。其实,有些突触是电接触,但更普遍的情况是神经元之间的信号传递要比电传导复杂得多。

      实际上,两个神经元不是直接连接在一起的。从电子显微镜拍摄的照片中容易看到,见图32所示,在两个神经元之间有一条明显分界的裂隙,约为四十分之一微米宽,这条裂隙被称为突触裂隙。当电脉冲到达突触前侧时,它能使一小包的化学物质(称为囊泡)释放到突触裂隙中。这些小的化学分子在裂隙中迅速扩散,其中的一些与突触后细胞膜上的分子门结合,使这些特殊的门打开,且允许带电的粒子流入或流出突触后膜,以使跨膜的局域电位发生了变化。整个过程如下所示:

      电-化学-电

      一般说来,离子的流入或流出依赖于离子在神经元内外浓度的高低。通常,钠离子(Na+)在神经元内保持低浓度,而钾离子(K+)在神经元内保持高浓度。这是由细胞膜上特殊的分子泵来完成的。如果一个门开启,两种离子都能通过,那么钠离子将会流入,而钾离子将会流出。①

      当没有峰电位时,神经元有一个跨膜的静息电位。这个电位一般是-70毫伏(指里面相对于外面),在胞体上一个正的电位变化(例如电位到达了-50毫伏)有可能使细胞发放;而一个负的电位变化完全阻止其发放。一个神经元是否能兴奋起来,以使它在轴突上产生一个峰电位,主要依赖于这些膜电位的变化(由位于树突和胞体上的兴奋性突触产生)能否引起轴突始端附近区域电位的变化。

      让我们更仔细地看一看突触的结构,见图33所示。在皮层中它主要有两种类型,称之为1型或2型。在电子显微镜下可以清楚地将它们区分开。①一般他说,1型突触使接受神经元兴奋,而2型使其抑制。

      在大脑中,大部分兴奋性突触不是直接位于树突的主干上,而是位于一些短小的侧枝上,见图34所示,这些侧枝称为棘(spine)。尽管有些棘上也有单个2型(抑制性)突触,但单个棘上从不会多于一个1型(兴奋性)突触。从图34中可以看到,一个棘有点像小烧瓶,它的颈被粘在树突上。棘有一个球形的头(通常稍有畸变)和细圆柱形的颈。突触本身位于其头部,并且在一定程度上与这个细胞在其他位置发生的活动相分离,突触有许多受体,其中也包括了离子门。如果神经递质的分子(来自于突触未端与棘头之间的突触裂隙)处于这种受体分子的某一特殊位置,就能打开离子门。

      棘是一个相当精巧的结构,它的功能远未完全了解。我猜测棘是进化的关键产物,有了它,可以对输入信号进行更为复杂的处理。

      我不想去描述神经元的脂肪膜上各种类型的蛋白质分子。其中一些分子能被递质分子激活,①它们被称为“受体”。在大脑的新皮层中,主要的兴奋性递质是一种相当普遍的称之为谷氨酸的小有机分子。(2)虽然离子通道仅有两种主要类型(一类仅对电压敏感,另一类仅对神经递质敏感),但最令人感兴趣的是第三类被称为“NMDA通道”的离于通道。③它对电压与谷氨酸都敏感,更精确他说,即便存在着谷氨酸,当局部的膜电位处于静息值,该离子通道很少打开的。如果膜电位升高(例如由于附近其他兴奋性突触的活动),那么谷氨酸可以打开这个通道。因此它仅对突触前的活动(由于轴突末端释放谷氨酸)与突触后的活动(由于其他的输入产生了跨膜电位的变化)的联合作用起反应。我们将会看到,这是脑功能的一个关键特性。

      当NMDA谷氨酸通道打开时,不仅允许钠、钾离子通过,而且也有适量的钙离子(Ca2+)通过,这些流入的钙离子像是这样一种信息的出现,即它能引发复杂的化学连锁反应,目前对这类反应仅获得部分的了解,它最终的结果是改变了突触的连接强度,这种改变可能维持几天,几个星期,几个月,甚至更长的时间(这可能就构成了一种特殊记忆形式的基础――见第十三章 描述的赫布学习率)。我们现在可以从分子的水平来解释认知过程,例如记忆。一个实验的例子:用化学的方法阻断小鼠海马中的NMDA通道,小鼠不能记住它到过的地方。

      抑制性突触的性质如何?是否存在这样的神经元,它的轴突的一些末梢产生兴奋性的作用,而另一些产生抑制性的作用?令人惊奇的是,在新皮层中从未或很少存在这种现象。更确切他讲,一个特定神经元轴突的所有末梢或都兴奋或都抑制,从未有两者并存的情况。上面提到,兴奋性突触的神经递质是谷氨酸,而抑制性突触的递质是相对较小的GABA分子(1)。在新皮质中,约有五分之一的神经元释放GABA递质(2)。

      大多数突触传递是化学的而不是电的,这样一个事实就产生了重要的后果,即一些特殊的小分子在浓度非常低的情况下也阻断它。这就是为什么剂量只有150微克的LSD能引起幻觉的效果。这也能解释为什么一些药在一定条件下能缓减精神状态,例如沮丧,看上去是由于某些神经传递机制的功能衰退而引起的,例

      如:安眠药中的化学物质结合了GABA受体,增强了GABA的抑制作用功能。这种突触抑制的增强有利于促进睡眠。镇静药利眠宁与安定也是苯二氮卓(benzodiazepine),有类似的功效。

      在新皮层中,兴奋性与抑制性不是对称分布的,但一些理论模型假设它们是对称的。从皮层的一个区到另一个区的长距离连接只能通过锥体细胞来实现。这些细胞都是兴奋型的。大多数抑制性神经元的轴突较短,仅影响它附近的神经元。①没有任何两个形态结构类似的神经元(可能有极少数的例外),会产生一个是兴奋的,而另一个是抑制的现象。整个分布的非对称性至少表现在两个方面:一个方面是神经元不能发放负的峰电位,另一个方面产生兴奋或抑制的神经元属于不同的类。然而、所有的神经元都接受兴奋性或抑制性的输入,这可能为了防止神经元总处在静息状态或永不停息的发放状态。

      在新皮层中主要有两类神经递质:兴奋性的谷氨酸递质(或相近的物质)和抑制性的GABA递质。遗憾的是,事情并不那么简单,存在着许多其他的神经递质。脑干中那些投射到皮层的神经元用5一羟色胺、去甲肾上腺素、多巴胺等为递质。脑中其他神经元用乙酰胆碱作为递质,约有五分之一的抑制性神经元在释放GABA的同时,也释放一种更大的有机分子――肽。这些递质大多数产生的效应要比两类主要的快速递质(谷氨酸和GABA)慢。它们通常用于调制细胞的发放强度,而不是直接使它发放。这些递质主要可能参与更一般的过程:例如保持皮层清醒,或者要记住什么,而不是参与大量复杂的信息快速处理过程。

      不仅存在有多种神经递质(尽管只有两种神经递质完成了大部分工作),而且还有多种离子通道。至少有七种不同类型的钾离子通道,且大多数还是相当普遍的。②有些通道能迅速打开,有些则缓慢打开;有些通道一旦打开就迅速失去活性,有些则较缓慢关闭:有些通道主要传递轴突上的电脉冲,有些则在胞体与树突上产生更精细的效应。为了计算神经元对输入信号所产生确切的行为变化,我们需要知道这个神经元所有的离子通道分布与特性。

      不同的神经元有不同的发放模式。有些神经元的发放非常快,有些则很慢;有些神经元发放单个脉冲,有些则倾向于发放一簇脉冲。在有些情况下,同一个神经元可以用以上两种方式中的任何一种发放,主要依赖于它的活动状态和当前的行为。动物在慢波睡眠(无梦的深度睡眠状态)与清醒状态时,神经元发放的模式是不一样的,主要的原因是脑干中的神经元对丘脑与新皮质产生了不同的影响。我们最终是需要更加深入地和更全面地了解各种类型神经元的信息处理过程。

      从表面上看,神经元显得异常地简单,它对众多的输入信号的响应是通过沿着它的轴突发送出一串电脉冲。只有当我们试图准确地刻画它是怎样反应的,这种反应是怎样随时间而变化的,以及它又如何随着脑中其他部分的状态而变化的,这才真正遇到神经元内在的复杂性。显而易见、我们又需要理解这些化学及电过程是怎样进行相互作用的,然后需要去掉这些过程的具体细节,用一种近似、可操作的方式来处理它们。简而言之,我们就需要建立各类神经元的简化模型,它们既不能太复杂而难以操作,也不能大简单而忽略了它的重要的特性。这可谓说起来容易作起来难。单个神经元有点像个哑巴,它能用很巧妙的方式表达着它的意思。

      神经元有一个相当明显的特性,这就是单个神经元具有不同的发放率,从某种角度来说,它具有不同的发放模式。尽管如此,在任何一段时间内,神经元只能发送出有限的信息。然而,神经元在这段时间内通过许许多多的突触而得到的潜在的信息是很大的。当我们孤立地看一个神经元时,这种输入与输出之间的转化过程必定要丢失信息的。然而这种信息的丢失可以用下面的方式得到补偿,即每个神经元对输入的特定组合的反应和传送出这新的信息形式,恰恰不是传送到一个地方,而是到许多地方。因此,由于单根轴突上有许多的分枝,沿着轴突下行传导的电脉冲是以相同的模式被分布在不同的突触上。一个神经元在它的某个突触上接收到的信息与其他许多神经元接收到的是一样的。所有这一切表明了:在某一时刻,我们不能仅仅单独考虑单个神经元,而必须考虑许多神经元综合的效果。

      认识到这样一个事实是很重要的:一个神经元仅能简单地告知另一个神经元它的兴奋程度。①这些信号不给接受神经元其他的信息,例如:第一个神经元的位置等。②该信号中的信息通常与外部世界的某些活动相联系,例如,由眼睛光感受器接收的信号。

      从感觉上讲,大脑所获得的通常是与外部世界或身体其他部分有关的信息。这就是为什么我们所看到的那些东西都位于我们的外部,尽管负责担任“看”的神经元位于脑中,对许多人来说,这是个根深蒂固的观念:“世界”位于他们的身体外,然而从另一种角度来看(他们所知道的),世界又完全位于他们的脑中。这对你的身体来说也是正确的,你对它所了解的不是附于你的头上,而是位于你的脑中。

      当然,如果我们打开头骨把某个神经元发放的信号取出来,一般能判断该神经元的位置。但是我们所研究的大脑并不知道这种信息。这就解释了在正常情况下,为什么我们不能知道感知与思考发生在脑中的确切位置。不存在这样的神经元来编码这种信息。

      回忆一下亚里斯多德认为这些过程都发生在心脏中,因为他既可以知道心脏的位置,又可观察到一些精神活动过程――例如

      但这种传送速度大慢,以致不能携带快速的信息。恋爱中在行为上发生的变化。如果不借助特殊的仪器,我们就不能对人脑中的神经元做类似的实验。这些及其他的有关内容将在下一章 中介绍。

      ==========================

      ①我将会集中讨论在脊椎动物(像人类)所发现的“典型”的神经元,这些神经元在无脊椎动物中(例如昆虫)几乎没有什么区别。

      ①对人工神经网络说,信号可以沿着反方向传输,称为逆向。

      ①红细胞是例外。

      ②目前还不清楚它更精确的数目,但到2000年左右或许将会知道。

      ①它的体积比一个细菌的细胞如大肠杆菌(E.Coli)约大1000倍。

      (1)这种解释是过于简化了,因为高子的流动还依赖于跨膜的电位差。

      ①1型突触具有圆形的囊泡,而2型的囊泡通常呈椭圆型或扁平状的,2型比1型更具对称性,且它的突触裂隙要小些。(l)有些仅对跨膜电压的变化有响应,有些仅当某些特殊的小分子――神经递质――与膜外的蛋白质相结合时有响应。有些蛋白质具有离于通道,它能迅速地打开,让离子通过去,有些不具有这些功能。它们在细胞内通过间接的方式产生慢效应,就是具有神秘色彩的第二信使。

      ②谷氨酸是构成蛋白质的二十种氨基酸中的一种,它有时被用来放在食物中以增加香味。

      ③这类受体的基因已被分离出来。

      ①主要有两类GABA受体,A型是一个快速的离子通道,它允许氯离子通过,D型受体速度较慢,是第二信使系统的通路。

      ②当成熟后,这种神经元在树突上很少或没有棘,它们的突触直接位于树突或胞体上。它们一般比具有棘的兴奋性神经元发放更快。有几种相当不同类型的抑制性神经元,但详细地描述它们已超出了本书的范围。

      ①有一种“篮状细胞”,能在某个皮层区内有相当长的抑制性连接。

      ②例如.一个称IC的钾离子通道,能被钙离子的内部浓度激活。

      ①除了编码平均发放率外,发放模式中也可能包含另一些信息。

      ②神经元能够沿着轴突发送化学信号。在一些情况下,它们能传递额外的一些信息,

分页树展主题 · 全看首页 上页
/ 2
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河