主题：这几天大火的Deepseek没有人讨论吗 -- 俺本懒人

共:💬118 🌺319 🌵12新 💬10 🌺3

从实用角度，DS是个里程碑：性能高；创造力——来自信息压缩

我没试过chat-gpt，但国内之前的那些语言类大模型都是垃圾，性能低到必须不懂装懂，就是我说的——聊天机器人、话术、糊弄。

chat-gpt模型更大，预测应答更慢，虽然看似性能比国内的那些垃圾大模型强，但性能曲线是处于差不多位置的。

DS则是整个性能曲线进步了一大截，这本是就是特别了不起的进步，所以DS在回答的时候，遇到不懂的问题可以老老实实承认：

【对不起，我还没有学会如何思考这类问题，我擅长数学、代码、逻辑类的题目，欢迎与我交流。】

DS的性能曲线提升，不仅因为是整体架构上突破，特别是模型大小减少了很多，后面这点更重要。

模型做得越小，越说明对于整个知识库的压缩能力越强，越接近人类，这一点是毫无疑问的。

你要从整体的信息压缩角度看，压缩的越厉害，越接近人类，压缩超过人类，那就是超过人类。

从信息角度，创造力并不是什么了不起的东西，接近人类平均水平，就获得了人类平均水平的创造力。

当大模型的信息压缩能力超过了人类平均水平，那就是某种生成模型了，当然可以根据某些规则生成人类真假难辨的东西。

这一切都是信息，信息压缩得越厉害，就越有创造力，当前的DS在短篇上、诗词上、古文已经表现出了超出普通人的创造力。

DS把大模型做小这一点，才是在人工智能这个领域真正的突破——只要你能够做到信息压缩，你就能获得创造力。

然后对于你说的问题，你是按照给严格正确的问答机器人角度拷打DS，我写过，DS依然不是问答机器人，而是介于聊天机器人和问答机器人中间态的智能助手：搜索助手、分析助手、汇总助手。

当前的DS没办法替代人来得出答案，做是否判断，只能够作为智能助手来帮助人做出判断——跟过去的的聊天机器人比起来，这已经是特别惊人的进步了。

通宝推：时间的影子,

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友