五千年(敝帚自珍)

主题:【原创】我的chatGPT的使用体验 -- Swell

共:💬285 🌺1767 🌵12
全看树展主题 · 分页首页 上页
/ 19
下页 末页
家园 不好意思,功课做的不扎实

刚才在请教,因为记忆🈶冲突

点看全图

左边是高斯--克里斯托夫·古德曼--卡尔·赫尔曼·阿曼杜斯·施瓦茨--费耶尔·利波特--约翰·冯·诺伊曼

右边是黎曼,黎曼结构是阿法狗基础

家园 强化学习和监督学习不在一个分叉上

最初,深度学习和强化学习是分开的。

深度学习就是搞一个训练数据集,通过回溯算法把一堆(可能分好几层)参数算出来。如果,提前给训练数据集做了标注,那就是监督学习。

强化学习是另外一条路:首先对问题的搜索空间给予数学定义,然后在搜索空间中通过试错的方式寻找(最)优解,每步迭代时,大概率是采用以前搜索时找到的当前最优解,小概率是在没有搜索过的空间中去碰运气。因为是大概率采用当前最优解,所以叫强化学习,也因此容易掉进局部最优解的陷阱中。

到阿尔法狗的时候,是在强化学习的基础上,用了深度学习。每对局一盘就是强化学习的一次迭代,迭代的目的就是搜索棋盘每个格点的价值。同一个空间点位,有没有旗子算不同的格点

通宝推:方平,Swell,
家园 来自于chatGPT所使用的数据集

图书馆,当前的互联网,今后的互联网,三个不同的数据集。从前到后,信息量的大小是递增的,信息的干净程度的递减的。假设信息量的值是1,100,10000;信息的干净程度是100,0.1, 10(-4)(我的拍脑袋,大家不必较真)

今天的chatGPT是从图书馆和当前的互联网学习的,那么它获取干净知识的估值是100.1

未来的chatGPT beta是从图书馆和今后的互联网学习的,它获取干净知识的估值是101。基本上,出道即巅峰。

为什么?由它产生的大量虚假知识可能会封闭掉它进化的可能。

另外,chatGPT生成内容与阿拉法狗搜索棋盘格点价值的底层逻辑是不一样的。所以,不应该用阿尔法狗的进化类比chatGPT

通宝推:陈王奋起,履虎,Swell,
家园 【商榷】用哲学或政治口号指导科研,不要闹笑话

老毛听说分子,原子,电子,,,,就说物质无限可细分,然后西方发现了新粒子,

中国报纸大吹,老毛哲学指导出来的结果 ,物质果然还能细分,,,,

家园 实际只是初筛,目前无法替代人工

chatgpt在英文方面可能比较容易,来源于英文的语义分析相对简单,更深原因在于语音表字往往隐含的信息量很少。所以英文的各类法律文本很厚,在于定语从句多,而运用chatgpt+3段落恰好很容易分析具体表达的意思。但中文是单字多意,极少文字能够表达丰富的内涵,这个和英文不一样。忘了是看谁的帖说,联合国中文的法律文本是最薄的。

在大陆用户不能使用chatgpt前(目前封了入口),浦东和上海市的语义分析还不能达到有效识别文件程度,最多就是较快的定位可能出现问题的地方,但远未到替代的程度。且看吧。

家园 说的好

代码质量差,技术缺乏专业性,软件极端落后。最最关键的是那种既不懂又不屑的态度。

家园 这么说的话,美国掌握互联网的根服务器是巨大的优势。
家园 互联网的干净程度也差别巨大吧

比如med pub上的知识,我认为和图书馆知识的干净程度几乎相同,它也是随着时间不断增长的。另外像elsevier等等,基本上可以看成是一个快速增长的在线图书馆。另外,加上各种政府企业文档,软件手册。

稍微差一点的, 我认为可以去主流的门户网站,报纸,杂志,技术上,stack flow, GitHub。

其他的我认为就不用参与训练了。

家园 兄台, 并不存在什么互联网根服务器

一般人说的是"互联网根域名服务器", 这东西其实也没啥用. 既不能切断某些国家的域名服务,也可能被局部污染.

互联网不存在什么"总电源开关"之类的东西.

美国的互联网霸权并不是因为这个.

家园 中国2007年秋上证指数最高点6124现在也没回去,咋的了?

中国亡国了吗?十五六年来还不是一样从胜利走向胜利。

家园 难道中国基础物理理论研究比西方跑得快?

五十步笑百步可以理解,一百步笑五十步的,我就不理解了。

家园 我的意思就是美国的互联网霸权在数据集上是不是有优势
家园 是的, 美国在信息上确实有很大的优势

主要原因是

1\ 现在大部分的有效内容产出是英语 ,比例可能在60%-70%左右(具体比例我没有查),尤其是在信息科学技术领域, 几乎都是英语.

2\因为西方世界的互联网巨头几乎都在美国,所有这些英语信息内容也大部分在美国的信息巨头手上.

3\其他语言的内容生产和传播, 在质量和数量上都被远远拉下了.

家园 请教葡大,数学史有什么推荐的吗,
家园 其实也挺有道理

自动驾驶好像也有类似问题,到底出了事算谁的。

全看树展主题 · 分页首页 上页
/ 19
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河