五千年(敝帚自珍)

主题:【原创】深入谈一下chatGPT对我们我国的重大影响 -- 东东山

共:💬200 🌺1876 🌵20
全看树展主题 · 分页首页 上页
/ 14
下页 末页
家园 国内不让用

没办法测试

家园 说起国内这些互联网公司就让人来气

要么跟在别人后面抄,要么刚挣点钱就乱动心思,比如搞互联网金融放高利贷挣快钱,一副土财主的样子。别人家的资本家靠技术挣钱,这帮人有几个安心搞技术的?老是盯着别人又搞出来什么好东西,自己去拿现成, 都亿万家产了还是一副猥琐相,难怪被人鄙视。

家园 没有让你反思

你尽可能地说别人的东西连个鸡巴毛都不是,但你嘴硬是啥用都没有。比如芯片,你嘴硬能马上有,你骂几句别人的芯片算是鸡巴毛,下一秒你就有了,那你也不用在这喷了,中央早就给你请过去了。你接着吹,吹的越大越好,你最好是直接吹大一口气,把美国吹消失了,那才是你的本事。

家园 有点过虑了,chatGPT这类

是AI在NLP方面的应用, 底层技术实际大家都差不多。chatGPT 反而是强在产品化方面。 就底层技术而言,大家都差不多。AI的元老 Yann LeCun 也说了“ChatGPT 并没有什么特别的创新,也不是什么革命性的东西。许多研究实验室正在使用同样的技术,开展同样的工作。”。比较搞笑的是,第2天,OpenAI CEO Sam Altman在推特上取关了 Yann LeCun。

马斯克是牛人,但其投资的公司比如特斯拉,星舰,OpenAI等等都有一个显著的特点:工程化,商业化很厉害,但基本没什么原创性的东西。马斯克是很好的企业家,创新性很高,风险很大的东西,他应该是不会投的。

通宝推:方平,
家园 也聊聊ChatGPT

我的小组已经用了一段时间ChatGPT,也正好借宝地谈一些初步的感想。

1. 我在高校这些年一直在做AI相关的东西。上周学生返校后我迫不及待地和学生聊起ChatGPT,才知道他们早就已经各种花式地使用ChatGPT了。我是理解他们的,无论是研究生还是老师,都需要输出论文,从这个角度来讲ChatGPT是生产力工具无疑。原来写论文的过程是先有一个想法,然后查文献、写综述、写代码,跑实验出结果,后面大部分时间需要用来组织语言形成论文,但是大部分学生最头疼的正好就是写论文这块儿,特别是写英文论文,需要很长时间的训练,需要掌握一定的写作技巧和套路,才可以过关成为所谓的成手。而后面的这部分正好是ChatGPT擅长的。通过精心设计的关键字和逻辑引导,ChatGPT可以形成很好的具有逻辑性的文字输出。估计以ChatGPT的迭代进化速度,以后写代码、跑实验部分很快也会被替代。因此,我对我的学生的要求是,必须要学会使用ChatGPT,需要了解他哪些能干,哪些不能干,要把它当成一个工具和对手,既要防备也要学会利用。

2. ChatGPT的核心技术之一即人类反馈强化学习RLHF并不是新的东西,特别是自然语言处理技术NLP已经发展到能让机器在语义层面更高效地学习人类积累的海量知识。我觉得openAI的策略和alphago类似,关键都是要先做出一个人类能够接受的东西,再通过和人的大量交互来迅速迭代。目前面向公众开放的这个版本的GhatGPT实际上是用21年以前数据训练的预训练模型,这个模型虽然不完善但已经好到让大部分人愿意和他交互,后面海量的人类交互就会形成正反馈循环,加快ChatGPT的强化学习迭代。

3. 尽管很多人说ChatGPT存在的种种缺点,但我认为这不是问题。ChatGPT目前这个版本虽不成熟,但已经具备通过自然语言和人类沟通的能力,与人类知识工作者相匹配的知识输出能力。也就是说,它是一个全面具备语义层交流、学习、反馈能力的机器了。我认为已经触到了那个奇点,通往强AI的路似乎隐约可见。后面迭代进化的速度一定是超乎想象的。但很多人并没有意识到,而且也没有做好准备。未来,ChatGPT所代表的强AI技术一旦成熟,必将替代大量的知识型工作。也就是说,ChatGPT的能力会成为一条基线,达不到这条线的人将会被淘汰。

4. 尽管chatgpt还没有开源,但相信中国的chatbot很快也会出来。算法层面即使有差距,也不是决定性的因素。未来最关键的是中文互联网世界所蕴含的知识和用户总体。包括中文世界的典籍、科技论文、论坛、新闻和用户,我们这个圈子的水平也决定了所孕育的中文世界的chatbo的水平。

5. 目前我看只有英文和中文世界具备足够的算力、知识和人口体量来产生超级智能体。这个智能体如果利用得当会反哺人类,加快知识积累。但是,它带来的虹吸效应会导致中文和英语世界之外的小民族在提早出局。畅想未来,那些掌握强AI和自动化核心技术的极少数精英和他们拥有的智能机器成为主宰,其余人类皆为蝼蚁。中西文明之间或许还存在一次终极对决,总决赛是在中国和西方世界的MOSS之间来进行,较量的就是算力、算法和真正的创新。或许我有生之年就有可能目睹这样的时刻,不知道是应该害怕还是兴奋。

元宝推荐:神仙驴,铁手,加东, 通宝推:报以琼琚,繁华事散,梓童,scanning,鳄鱼眼泪,wage,鹰蓝,俺是老胡,潜望镜,田雨,wild007,脑袋,strain2,衣香楚楚,hnlhl,桥上,破鱼,菜根谭,履虎,吃土的蚯蚓,方平,尖石,白浪滔天,微笑问天,谷口白云,陈王奋起,上帝大叔,不远攸高,海外俗人,老惰,脊梁硬,加东,外俗内正,落木千山,心远地自偏,唐家山,铁手,土地革命,秦波仁者,
家园 我想到的和用到的

说说正在用的吧:

1.其实如今几乎所有的科研人员都是某种程度的软件使用者。不用专业软件是不可想象的。随着这些软件越来越复杂,即使是专业的也没法做到100%全部掌握。过去是:问别人,问客服,查手册,甚至上一些软件公司组织的学习班。如果换一个领域或者换一个工作,还要重新学一些类似,但是不同的软件。ChatGPT基本上相当于一个私人定制的帮手,随叫随到。特别是针对一些有点冷门的软件。其实它只要能做到理解我的问题并在手册里找到相关答案就已经实现90%的功能了(这比单纯搜索强太多了)。

2. 编程序转码。搞计算的都懂。很多时候需要对万年前的古典程序动刀。Fortran77写的,能不能转成python。这个程序能不能改成面向对象。这种东西其实完全是代码进,代码出。但是很多时候还要耽误你大量的时间。我没有试过,但是我觉得这个东西它未来能做。

家园 我还看到有用3D打印把内容打出来

当时看着觉得牛,连字都不用写了。

现在想想,好像有点脱裤子放屁,多此一举了。

家园 在这之前微软曾有自动代码功能的推出

其数据来源应该就是在它收购的GitHub里面大量的成熟的开源软件代码。

除代码以外,知识类的内容,我想它的搜索引擎也应该搜集到足够多的内容,尤其是wikipedia 这样的,可以在很大程度上保证信息的准确性。

有了这些原始数据后,要做的应该就是从这些数据中找到关联,做内容分析整合。这个能力应该是比较牛。我想,如果有足够信息,它应该完全可以摸透任何一个人的性格和行为模式,比算命先生还要铁口。也很可能在某种意义上实现个人的永生,精神、思维上的永生。至少在旁人的角度来看跟活着没区别。

从不好的角度,也挺可怕,希望不会把人耍的团团转。

家园 嘿嘿

理论没有突破之前。ai的应用并不多,但却是能实实在在的解决一些智慧及工作上的重复。公式化的小说、公式化的程序、公式化...当然,在舆论场上的应用更是强大。

家园 材料工程恰恰是需要爆肝氪金的

不同合金的组合配比,一样一样试验基本没啥捷径。你缺钱烧不起实验材料那就是追不上

家园 中美差距最大的是数据量,全球互联网占得优势太大了

谷歌脸书之类的全球公司,就有全球的数据供他们训练,中国智能用本土的数据训练,体量差距太大了

家园 基于chatGPT的马甲zero

利用api读家园全部文章,分析文风的聚类,或许可以有效区分马甲。

家园 气也没用,人家硅谷创业潮从上世纪80、90年代就开始

已经有超过几十年的积累,中国的创业潮才多少年?美国的高科技互联网泡沫已经破灭过一次,已经挤过一次泡沫了,现在能留下来的肯定有不凡之处,而中国的高科技互联网泡沫还没破灭过,整个行业没有经过市场的筛选,所以鱼龙混杂,乱七八糟。

现在国内所谓的高科技互联网企业根本就没有创新和搞技术的心,就算有心也没能力,有心也有能力,整个社会环境也不会给他们机会,所以他们只能抄。在我看来,要是能抄得好都算大功一件了。

本人对国内现在所谓的“互联网”、“高科技”巨头一点期待都没有,只是希望他们不要掉队,不要被外面甩得太远。也正因为没有什么期待,所以一旦能拿出一点成绩我反而会夸一夸。

家园 原创性的东西基本都在实验室

AI 所用的数学工具也应该已经至少出现几十年了。关键是把这些工具进行组合并和计算能力结合起来做出的东西。

家园 AI是倍增器,但无法拿来无中生有

有些人认为有了AI,很多行业都可以淘汰了,只能说不懂人类过去几百年的产业变迁。

有些事情,你懂就是懂,越懂就越能借AI来提高水平,不懂就是不懂,只能用AI来消磨时间。你有1,借用AI可以很快从1到2,从2到4,你只有0,不管怎么用AI,最后还是0。

通宝推:五峰,方平,外俗内正,北纬42度,葡萄,唐家山,
全看树展主题 · 分页首页 上页
/ 14
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河