五千年(敝帚自珍)

主题:这几天大火的Deepseek没有人讨论吗 -- 俺本懒人

共:💬73 🌺220 🌵9新 💬44 🌺3 待认可4
全看分页树展 · 主题 跟帖
家园 性能差不多小一半也是小。说说恶心到我的阿里通义2.5

羊驼3分为8B、70B、400B+三个不同应用场景的版本,很显然依然是大模型方向,但为了适应低精度应用场景降档了。

中英文的区别,羊驼3的中文性能如何你用过吗?DeepSeek主力战场可是中文,但在英文上也不差。

DeepSeek的预测在国内可是独一档的快,性能也是碾压式的进步,如果羊驼3没有能够跟国内其他大模型拉开差距,那就是差。

更重要的,羊驼3依然是大模型方向,接下来是众所周知的更大更大更大。但DeepSeek不仅是走通了另一条路,还可能预示着小模型方向。

如果你也是相关的领域,不会看不懂其中的差别、因为我只是相关的领域,我没办法判断这些是不是实实在在的差距,我只能说可能。

==

最后,我说下因为DeepSeek太忙,我昨天去用阿里的通义2.5大模型,别信知乎上吹嘘的得分超过DeepSeek-V3的话,用起来:

不仅菜,而且你明显能够感觉到在决策上玩了各种话术、糊弄的花活,你要花大量时间在鉴别它是不是在骗你。

我被恶心坏了,大家有个美国时间陪你玩花活啊?基本上是我在西西河遇到体制内脱产教士的感觉,不仅菜,还想忽悠别人。

不是我看不起体制内用户,而是在这帮猪队友的拖累下,体制内从基层到技术官僚,能力都是出类拔萃的。

但体制内的脱产教士是没有任何社会实践:菜也就算了,菜还不自知天天想忽悠别人,失去了垄断特权之后,在网上跟个弱智一样。

任何在社会上工作过的人,任何体制内的基层和技术官僚,如果不能一眼认出这些脱产教士,那就是没有仔细想过自己的社会实践。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河