五千年(敝帚自珍)

主题:【整理】芯片败局 -- 拿不准

共:💬719 🌺8746 🌵288
全看分页树展 · 主题 跟帖
家园 你这几个问题都是很浅显的层次的问题

1. "meta的llama 2开源且可以直接用于商业化, 这就决定了大部分国内的大模型没有存在的必要。" 为什么呢? 难道说国内的大模型都是基于llama 2?llama 2的开源会不会同样影响美国的大模型?

中国引进有商业化问题么? 美国包括西方整体法律不适用与中国特殊国情,所以美国的license法律问题,这个问题上完全不存在疑问空间。用起来挣到钱就是真的,其他都是浮云。

2. "语料和模型输出的各种被阉割",我猜想语料是指中文网一些被屏蔽的内容,模型输出的阉割是指输出中需要屏蔽的内容。但众所周知,这些屏蔽范围很明确,其实并不大。中文网绝大多数内容不在这个范围。您似乎认为有限的限制会对模型产生很大的影响,为什么?

目前大语言模型的一个共识是训练数据集的作用是决定性的, 训练数据的潜规则一定会在模型的输出上反映出来。 比如chatgpt不能说被认为是种族歧视的话,不论有多少训练中的证据,输出必须符合政治正确,那么只能在训练数据中下功夫,让大模型进入韭菜状态,被忽悠的大模型才是好的大模型,在输出的语言自然都是满满的正能量。

3. 如果"中国在算法,模型,训练方法上没有任何创新",那中国如何又能"输出了大量优秀的AI人才"? 这些AI人才不能创新,又如何堪称"优秀"?

这也很好理解,AI需要数理基础,中国培养的人才这方面比较偏重。 AI本身的逻辑不需要太多的数理基础,但是AI运行与开发的工作目前让然是依赖于人类对数理知识1掌握。 而中国教育制度的下的一个突出技能是数理技能,因此AI的开发目前绝大部非是华人,包括美国海华与大陆移民。尤其大陆移民,看论文署名就可以知道。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河