五千年(敝帚自珍)

主题:这几天大火的Deepseek没有人讨论吗 -- 俺本懒人

共:💬139 🌺468 🌵14新 💬9 🌺1 待认可1
全看分页树展 · 主题 跟帖
家园 看怎么问,检索类得信息,数理分析类得分析,自然语言类得谎言

水准忽上忽下,特别不稳定,主要取决于问题类型,怎么问甚至都是次要的。原因是我在另一个回答中说的:

DeepSeek只是把数理分析做得特别成功,通过数理分析,在可以进行数理分析的领域,获得了小学生级别的判断力。

在所有不能进行数理分析的领域,深搜和别的大模型差别不大,即使R1再怎么展示思考过程给你,让你改进提问方式,结果依然很差。

--

深搜的所有智能只体现在数理分析领域,在所有不能数理分析的领域,深搜立刻蜕变为话术聊天机器人,因为语言类大模型属于生成模型,没有判断能力就是在源源不断地制造谎言。

ps:当遇到需要真假判断的时候,一定要开着R1(深度思索),检查一下思维链,甚至需要多问一句,它引用的那些关键证据的处处。

我已经受到各种教训了,比起单纯地编证据骗我,它检索的证据的真假性也不能保证,比如它引用贾湖骨笛9000年前。

我多问一句,它告诉我没有经过树轮修正,修正后立刻少了2000~3000年;我多问了一下贾湖遗址分为几期,它立刻告诉我分为三期,每期的持续年代又有很大的不同。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河