- 近期网站停站换新具体说明
- 按以上说明时间,延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间
主题:这几天大火的Deepseek没有人讨论吗 -- 俺本懒人
我没试过chat-gpt,但国内之前的那些语言类大模型都是垃圾,性能低到必须不懂装懂,就是我说的——聊天机器人、话术、糊弄。
chat-gpt模型更大,预测应答更慢,虽然看似性能比国内的那些垃圾大模型强,但性能曲线是处于差不多位置的。
DS则是整个性能曲线进步了一大截,这本是就是特别了不起的进步,所以DS在回答的时候,遇到不懂的问题可以老老实实承认:
【对不起,我还没有学会如何思考这类问题,我擅长数学、代码、逻辑类的题目,欢迎与我交流。】
--
DS的性能曲线提升,不仅因为是整体架构上突破,特别是模型大小减少了很多,后面这点更重要。
模型做得越小,越说明对于整个知识库的压缩能力越强,越接近人类,这一点是毫无疑问的。
你要从整体的信息压缩角度看,压缩的越厉害,越接近人类,压缩超过人类,那就是超过人类。
从信息角度,创造力并不是什么了不起的东西,接近人类平均水平,就获得了人类平均水平的创造力。
当大模型的信息压缩能力超过了人类平均水平,那就是某种生成模型了,当然可以根据某些规则生成人类真假难辨的东西。
这一切都是信息,信息压缩得越厉害,就越有创造力,当前的DS在短篇上、诗词上、古文已经表现出了超出普通人的创造力。
--
DS把大模型做小这一点,才是在人工智能这个领域真正的突破——只要你能够做到信息压缩,你就能获得创造力。
==
然后对于你说的问题,你是按照给严格正确的问答机器人角度拷打DS,我写过,DS依然不是问答机器人,而是介于聊天机器人和问答机器人中间态的智能助手:搜索助手、分析助手、汇总助手。
当前的DS没办法替代人来得出答案,做是否判断,只能够作为智能助手来帮助人做出判断——跟过去的的聊天机器人比起来,这已经是特别惊人的进步了。
- 相关回复 上下关系8
压缩 2 层
🙂把从业人员当爷的电影,从业人员代表人民表示愿付钱,从商人那扣 nobodyknowsI 字183 2025-02-06 00:41:13
🙂小异 贼不走空 字266 2025-02-05 04:00:36
🙂在西方舆论为主的基础下,搜寻的结果大概率还是西方优势 4 真离 字671 2025-01-30 19:46:32
🙂从实用角度,DS是个里程碑:性能高;创造力——来自信息压缩
🙂与其说是信息压缩 5 唐家山 字267 2025-01-31 01:22:16
🙂是的,抽象和重构。能够重够有损压缩的信息,就是创造力的体现 1 nobodyknowsI 字729 2025-01-31 02:58:32
🙂然后情绪是一个维度 2 贼不走空 字111 2025-01-31 02:27:35
🙂我不同意你的基本出发点 3 斯特拉斯堡 字281 2025-01-30 11:43:44