主题:对ChatGPT的几点思考 -- 唐家山
换一个词“内容安全”可能会更好一些。
GPT类的AI从原理上就会涉及网络攻防和网络安全,因为人类自身就处于GPT系统的循环之中。凡是涉及人类自身的问题,单靠技术是无法完全解决的。不过也不能因噎废食,将来总有对应的解决办法。这个可能是一个长期演化的过程。至于你说的隐藏文字的检测和剔除,在技术上反而是一个相对小的问题。
高维计算是一个可能的解答。
数学的强大超出你的想象——高维计算,让机器像人脑一样感知世界和类比推理
尽管像ChatGPT这样的大型语言模型取得了显著的成功,但支持这些系统的人工神经网络(ANN)可能存在问题。
首先,人工神经网络非常耗电。其次,它们缺乏透明度,意味着这些系统如此复杂,以至于我们无法真正理解它们是如何工作的,以及为什么它们能如此有效地工作。这种复杂性使得人工神经网络很难通过类比进行推理,而类比推理正是人类的一种思考方式——用符号表示对象、概念及其之间的关系。这表明,当前的人工神经网络可能需要在某些方面进行改进,以解决这些问题。
人工神经网络的不足之处可能主要源于它们的基本结构和构建模块:单个人工神经元(individual artificial neurons)。每个神经元负责接收输入、执行计算并产生输出。现代的ANN是由这些计算单元构成的复杂数字网络,经过训练后可以完成特定任务。
我们的大脑感知自然世界的方式不可能是通过单个神经元来表示不同的信息。例如,我们不会在大脑中有一个专门用来检测紫色大众汽车的神经元。相反,大脑中的信息是由许多神经元的活动共同表示的。这意味着,感知紫色大众汽车的概念不是由一个神经元的活动来表示的,而是由成千上万个神经元的活动共同表示的。当这些神经元以不同的方式激活时,它们可以表示完全不同的概念,例如粉红色的凯迪拉克汽车。这种观点强调了大脑对信息编码的复杂性和多样性。
这是一种高维计算(hyperdimensional computing)。在这种方法中,每个信息片段(例如汽车的概念、品牌、型号或颜色等)都被表示为一个单一实体:高维向量(hyperdimensional vector)。
向量是一个有序的数字数组。以三维向量为例,它包含三个数字:三维空间中一个点的x、y和z坐标。高维向量(也称为超向量)可以是包含10,000个数字的数组,表示在10,000维空间中的一个点。这种方法涉及的数学对象和代数操作非常灵活和强大,有助于现代计算突破当前的局限,并推动一种新的人工智能方法的发展。
这预示着一个全新的计算世界。在这个世界里,计算过程将变得更加高效和稳定,同时,机器所做的决策过程将是完全透明的,使人们能够更好地理解和控制这些决策。
高维计算的优势在于能够通过组合和分解高维向量进行推理。最近的一个例子是2022年3月,IBM苏黎世研究中心的Abbas Rahimi及其同事成功利用高维计算与神经网络解决了抽象视觉推理领域的一个经典问题。这个问题对于普通的人工神经网络,甚至对某些人来说都是一个极具挑战性的问题。这个问题被称为渐进矩阵测试(Raven's Progressive Matrices),其任务是在一个3×3的网格中展示一系列几何图形图像。网格中有一个空白位置。参与者需要从一组候选图像中选择一个最适合填入空白位置的图像。
高维计算的另一个优点是透明性:代数能清晰地解释系统为什么会选择某个答案。然而,传统的神经网络并没有这个特点。Olshausen、Rahimi等人正在开发一种混合系统,该系统中神经网络将物理世界中的事物映射到高维向量,接着高维代数就会接管处理。Olshausen表示,这种方式使得诸如类比推理这类问题变得容易解决。他认为,我们对任何AI系统的期望应该是能够像理解飞机或电视机一样去理解它。
还有一个方向是神经网络的可解释性。贴一篇综述文章吧。
神经网络模型性能日益强大, 被广泛应用于解决各类计算机相关任务, 并表现出非常优秀的能力, 但人类对神经网络模型的运行机制却并不完全理解. 针对神经网络可解释性的研究进行了梳理和汇总, 就模型可解释性研究的定义、必要性、分类、评估等方面进行了详细的讨论. 从解释算法的关注点出发, 提出一种神经网络可解释算法的新型分类方法, 为理解神经网络提供一个全新的视角. 根据提出的新型分类方法对当前卷积神经网络的可解释方法进行梳理, 并对不同类别解释算法的特点进行分析和比较. 同时, 介绍了常见可解释算法的评估原则和评估方法. 对可解释神经网络的研究方向与应用进行概述. 就可解释神经网络面临的挑战进行阐述, 并针对这些挑战给出可能的解决方向.
例如,我们不会在大脑中有一个专门用来检测紫色大众汽车的神经元。
这个是有争议的,而且是比较早的争议了。一个著名的反驳论据就是Jennifer Aniston Cell:
而且,你论证逻辑里
高维计算的另一个优点是透明性:代数能清晰地解释系统为什么会选择某个答案。
这个不成立。就好比写代码注释写得好,对其他程序员或者KPI考察者来说是优点,但是并不是对用户来说的优点。类似的,人脑的进化方向选择,并不包括让人类更容易理解这一标准。
就是GBT的回答水平与使用的深度非常依赖提问者/使用者自身的知识水平。 不同于常说的“没有愚蠢的问题,只有愚蠢的答案”,在GBT的使用上,如何提问可能才是得到正确答案的决定因素。比如,一个医生使用GPT应该就会比普通人使用GPT得到的帮助大得多。从一个侧面也说明为什么网上使用过GBT的人的之后的反应参差不齐,一方面是被媒体掀起的期望值,而另一方面也与每个使用者自身的话题与知识水平有关。
GBT的这个问题虽然目前已经被逐渐广泛认识到,但也带出了另一个问题,就是GBT自身没有目标(goal)这个概念,自身不会去给自己制定复杂的goal,为了回答问题可能内部有一些简单的比如去哪里搜索额外的信息等事先规范过的目标,比如曾有新闻说GBT靠撒谎获得某系统使用权限但无法证实。 而人包括动物的行为特点是一切活动都是有目标的,虽然有点自我有意识有的完全无意识,比如情绪控制下的举动是无意识的,而骗子的话术是有意识,所以如果担心GBT对人类社会产生危害,或担心涌现出自我意识,这个goal目标的底层行为模式是前提。 动物与人进化出这个行为模式是自然界适者生存的结果,而GBT没有这样的生存压力,大模型本身实际是个知识模型,其唯一的行为设计是输入与输出,虽然具备能力接受一个目标提问,但只能输出一个相关的计划与推理过程,但是没有自己执行这个计划的能力。
比如你提问要求去网上爬虫抓数据,GBT可以给你写一段程序,但不会自己去运行这段程序然后提供给你答案,甚至我不管GBT如何去获得数据,只管要答案,GBT自己决定使用什么手段或自带工具去完成。至少我还这样试过,也许有人这样用过我还不知道。
当然从AI广义上去说,自主意识与自主指定目标的能力是分不开的,而这也是AI最危险的能力。从底层上从基本设计上限制这个能力自然应该是所有AI产品团队的一个必备常识,相关立法很快出现也不奇怪。 这个限制同时也解决了AI取带人这个人们最关注的问题。话句话说,一切人类目前在做的伪装成脑力劳动的体力活,即没有复杂目标而且范围很窄但深度不小的脑力劳动,包括科研与分析工作中的很大一部分,行政管理,制造流程,产品市场,教育与医疗中的大部分都应该会被GBT直接冲击到。当然最经典的可能就是对应试教育下的做题家的冲击,这虽然是网上的蔑称但说明一定问题而且是个比较普遍的现象。
类似我们从小都会背诵的小九九乘法口诀,可以在完全无意识中只依赖肌肉记忆流畅运算。 人类现代教育很大一部分是注重在培养这些无意识条件反射的基本能力上。 网上经常被开玩笑的知道分子与知识分子的称号,互联网的兴起也带动了大量的”知道分子“的广泛出现,甚至给人感觉只要依赖搜索引擎,大学本科教育都可以不需要了,大量工作的存在也是吸收这样的教育培养出来的”人才“的源头。 那么,GBT至少在这个角度重塑社会劳动的组成,重新思考教育的重点,在未来几年到几十年中会有很大波及。当然更深度的对社会的冲击肯定也可以开脑洞引发更多思考与展望,至少是键政的一个兴奋点。
老医生见多识广,经验丰富。
这两条是GPT的长项。只要有输入,它有近乎无限的经验和见识。
就你说的两个病例,我觉得是医疗制度的问题。医生也是职业一种。只要不是急症,医生不需要非治病不可。反正也难于判断,出错的机会与正确的机会谁大谁小都不知。索性不判断。
国内也有类似的例子。我同学的母亲症状很奇怪。住了三次医院。每次一个月,每次都是套路的各种检查,就是不能发现病因。到了症状减轻就出院。症状严重了再入院。医生们都很真诚,不是为了钱。第四次我同学急了,说你们别检查了。我都搞明白啊了。肯定是胆的哪根管子堵住了。一检查果然是。我同学根本不是大夫。听医生们给他做各种病因解释后自己综合的结论。
当然我同学和北纬都是那种非常聪颖的人。普通人就受着吧😄。
每次当你以为自己低估美国的时候,其实美国比你心中的底线还要低。
一般中国人以为美国理工科不行,是因为人才全去读医法商,全去华尔街了。其实就算一二线城市的普通人,办个签证,自己到美国旅游一趟,迈开双腿,去参观一下美国最顶尖的私立学校(虽然不会录取你的孩子,参观日还是可以随便进的),只要脑袋还没有进水,就会立刻意识到:这种教育体制,完全就是为了上层世袭打造,不可能培养出在任何方面有竞争力的人才。从课程安排到教育理念,就是水平令人吃惊的低。只要中国国力稍微上来一下,给中国下一代提供世界级的舞台,美国相对应的下一代就会全军覆没,没有任何还手之力。
看看美国上层,什么布林肯之流,现在大家知道水平低啦。这些可是美国80年代培养出来的精英 - 90年代到2010年代美国培养出的自大狂们,还没上台呢。
都是一群装模作样的利益共同体!
对有小小孩的网友还是有启发帮助的.
您参观过美国顶级私校,什么表现出不可能培养出任何方面有竞争力的人才?有具体的例子更有说服力。
我可以举例。我参观过纽约最有钱的私校。金发碧眼幼儿园孩子画中国画的水平比我高。就这点,他们画中国画是有竞争力的。
能打败在中国的中国小孩中的佼佼者才能算是本事。
就像弹钢琴一样,至少李云迪那样的才算有竞争力,毕竟这一行是赢者通吃的。
你看,本猫几秒钟就能给你举个例子。
另外,本猫是两校子弟,这个河里知道的人不少。小时候见过听过生而知之的天才多了去了,画个画也能叫培养未来的人才,这不是要笑掉大牙。
告诉你什么叫良好的培养体系,理想的培养体系是要把各行各业这种生而知之的天才放到合适的岗位上去 - 当然并不一定是学习,乔丹打篮球梅西踢足球也算数,当然这是理想状态,没有国家能做到。
但像美国顶级私校这样只要有钱就基本没什么淘汰机制的,其绝大多数人必然是没有任何培养价值的庸才,也就画画中国画来糊弄家长。正确的问题是问他们学校的毕业生中有没有培养出对中国研究极深,不是靠台湾翻译官的中国专家呢?本猫想你大概也知道答案是什么。
这种学校的毕业生,按照本猫简单的估算,至少一半以上可以进入美国的所谓名校。当然除了私校的功劳,动不动五六位数的各种校外专家咨询费也起了很大作用(本猫说的可不是中国家长概念里的什么补课),本猫想这些门道你不会不知道吧。这种系统培养出来的人,其社会观人生观是什么样的,你大概也不会想不到吧。现在美国局势每况愈下,干什么什么不行吃什么什么没够,和这帮私校培养出来的“人才”脱不开干系吧 - 其实美国公校也差不多,只不过一群初中毕业都困难的,还有什么好说的。
老美的私立高中stem好的也有一些。
美国这样的国家,其实stem是可以外来引进的。而且作为实质上没有道德标准的一个移民国家,引进stem要比培养stem好。
如果一个国家,完全像中国那样靠考试,中。
如果像两百年前的美国,就完全丛林法则,也成。
现在美国是各种法则混在一起,大家都各种叠buff,那就头大了。
嗯,本猫一开始说什么了,美国本质上是一个没有道德标准的移民国家,再全民叠buff,你想想最后会是什么结果。
六年级印裔学生用汉语和我讨论过秦始皇。
顶级私校的硬件软件,还有老师的教学方法,学生的相处,有可取之处。
另外,我孩子是经常被一个白人巨富请到家里去陪太子读书的。当然我们也受益不少,主要是孩子情商的训练,所以愿意去陪。巨富能够想到请我孩子去陪读,显然不是要他孩子躺平的意思。
人才不是巨富的子弟,也不是靠培养情商培养出来的,不是六年级讨论什么秦始皇,更不是什么硬件设施能弥补。
真正的人才,是百万人中冲杀出来的,作为美国顶级私校,有没有给美国社会提供这样一个舞台?相反,他们还各种叠buff,很大程度上消灭了美国的丛林社会,给了各色人等一堆捷径。本猫不客气地说一句,每多一条捷径,美国社会的前景就黯淡一分。
中国的考试,美国的丛林社会,在本猫看来,都是各自的社会支柱。
中国科举考试结束后,是靠什么方法选拔人才的?本质是全民吃鸡大赛,比美国丛林社会更丛林的社会,用这样的方法迭代出了最伟大的一代中国领导人。但毕竟中国的社会基础不是丛林社会,所以后来要快速转回传统的考试模式。
那美国现在把丛林社会叠buff叠没了,要靠什么来选拔人才呢?美国顶级的私校们,有什么想法吗?
竞争是很激烈和现实的。
我认识一个巨富的女儿,当年和她在纽约压马路的时候她一会一指这座楼是我家的,一会一指这座楼是我家的。她是顶级大学博士。但是她混得比起她身分很不如意,也很不开心。我见过阶层下沉的不止她一个。
私校。我的经验是私校老师观察学生和家长很仔细。学生和家长想躺平的(不多),他们随你。想上进的,他们很认真地教。发现好的,直接加强。我孩子就是我们自己没有提出被学校加强的。
另外我没有第一手观察中国低龄学生。不过孩子有个朋友在国内读过,现在暑假通常回国读书。他比我孩子大两岁,数学不能和我的孩子比,差不是一点。另外我不知道国内几年级开始写一页纸的作文,这里不止一个私校是幼儿园最后一年。
我想我说得差不多了。