主题:【整理】芯片败局 -- 拿不准
1. "meta的llama 2开源且可以直接用于商业化, 这就决定了大部分国内的大模型没有存在的必要。" 为什么呢? 难道说国内的大模型都是基于llama 2?llama 2的开源会不会同样影响美国的大模型?
中国引进有商业化问题么? 美国包括西方整体法律不适用与中国特殊国情,所以美国的license法律问题,这个问题上完全不存在疑问空间。用起来挣到钱就是真的,其他都是浮云。
2. "语料和模型输出的各种被阉割",我猜想语料是指中文网一些被屏蔽的内容,模型输出的阉割是指输出中需要屏蔽的内容。但众所周知,这些屏蔽范围很明确,其实并不大。中文网绝大多数内容不在这个范围。您似乎认为有限的限制会对模型产生很大的影响,为什么?
目前大语言模型的一个共识是训练数据集的作用是决定性的, 训练数据的潜规则一定会在模型的输出上反映出来。 比如chatgpt不能说被认为是种族歧视的话,不论有多少训练中的证据,输出必须符合政治正确,那么只能在训练数据中下功夫,让大模型进入韭菜状态,被忽悠的大模型才是好的大模型,在输出的语言自然都是满满的正能量。
3. 如果"中国在算法,模型,训练方法上没有任何创新",那中国如何又能"输出了大量优秀的AI人才"? 这些AI人才不能创新,又如何堪称"优秀"?
这也很好理解,AI需要数理基础,中国培养的人才这方面比较偏重。 AI本身的逻辑不需要太多的数理基础,但是AI运行与开发的工作目前让然是依赖于人类对数理知识1掌握。 而中国教育制度的下的一个突出技能是数理技能,因此AI的开发目前绝大部非是华人,包括美国海华与大陆移民。尤其大陆移民,看论文署名就可以知道。
- 相关回复 上下关系8
压缩 2 层
🙂美国缺乏AI的应用场景。 9 绝对不是白领 字0 2023-08-31 08:11:14
🙂你这几个问题都是很浅显的层次的问题
🙂接着问 7 zwx650 字1154 2023-08-16 00:08:22
🙂语料虽然只是一方面,但对语言模型很重要 6 川普 字3397 2023-08-25 00:50:16
🙂还有一个有利与国内的地方忘了提 7 川普 字872 2023-08-25 16:17:50
🙂关于华为的AI,一直有个疑问 4 光头佬 字276 2023-07-31 00:55:17
🙂华为实际控制的线超过若干条 205 陈王奋起 字1625 2023-07-31 06:09:06
🙂华为麒麟9000s芯片制程为5nm 19 真理 字45 2023-08-29 04:14:04