- 近期网站停站换新具体说明
- 按以上说明时间,延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间
主题:这几天大火的Deepseek没有人讨论吗 -- 俺本懒人
羊驼3分为8B、70B、400B+三个不同应用场景的版本,很显然依然是大模型方向,但为了适应低精度应用场景降档了。
中英文的区别,羊驼3的中文性能如何你用过吗?DeepSeek主力战场可是中文,但在英文上也不差。
DeepSeek的预测在国内可是独一档的快,性能也是碾压式的进步,如果羊驼3没有能够跟国内其他大模型拉开差距,那就是差。
更重要的,羊驼3依然是大模型方向,接下来是众所周知的更大更大更大。但DeepSeek不仅是走通了另一条路,还可能预示着小模型方向。
如果你也是相关的领域,不会看不懂其中的差别、因为我只是相关的领域,我没办法判断这些是不是实实在在的差距,我只能说可能。
==
最后,我说下因为DeepSeek太忙,我昨天去用阿里的通义2.5大模型,别信知乎上吹嘘的得分超过DeepSeek-V3的话,用起来:
不仅菜,而且你明显能够感觉到在决策上玩了各种话术、糊弄的花活,你要花大量时间在鉴别它是不是在骗你。
我被恶心坏了,大家有个美国时间陪你玩花活啊?基本上是我在西西河遇到体制内脱产教士的感觉,不仅菜,还想忽悠别人。
不是我看不起体制内用户,而是在这帮猪队友的拖累下,体制内从基层到技术官僚,能力都是出类拔萃的。
但体制内的脱产教士是没有任何社会实践:菜也就算了,菜还不自知天天想忽悠别人,失去了垄断特权之后,在网上跟个弱智一样。
任何在社会上工作过的人,任何体制内的基层和技术官僚,如果不能一眼认出这些脱产教士,那就是没有仔细想过自己的社会实践。
- 相关回复 上下关系8
压缩 5 层
🙂很独特的视角,对我有启发 8 唐家山 字1177 2025-01-30 21:30:42
🙂DeepSeek还到不了逻辑的层次,依然是自然语言的层次 8 nobodyknowsI 字3141 2025-01-31 03:39:02
🙂DeepSeek 的模型可不小 3 孟词宗 字1243 2025-01-31 13:45:43
🙂性能差不多小一半也是小。说说恶心到我的阿里通义2.5
🙂AI要到什么层次它才能输出人类未知的东西 1 贼不走空 字207 2025-01-31 04:49:08
🙂这就是标准的体制教士 胡辣汤 字764 2025-02-01 07:32:30
🙂“叙事即权力,想象力即战场”、“城中谈礼法,乡野种稻粱”算吗 4 nobodyknowsI 字503 2025-01-31 07:37:39
🙂DS的自学路径之语义的创造与批判 3 瓷航惊涛 字386 2025-02-01 01:52:48