五千年(敝帚自珍)

主题:【原创】深入谈一下chatGPT对我们我国的重大影响 -- 东东山

共:💬200 🌺1876 🌵20
全看分页树展 · 主题 跟帖
家园 谢谢铁手老大的回复

据说stack overflow要禁止用ChatGPT回答问题。我觉得这也说明ChatGPT的训练很大程度上得益于stack overflow这样高水平QA论坛。ChatGPT的训练需要大量数据来喂养,而且数据质量越高得到的模型约好。目前我们中文网络不仅缺少可以媲美维基百科这样体量的知识库资源,而且缺少高水平的技术论坛,特别是能够对标stack overflow这样的QA论坛。目前知乎和CSDN都难以做到stack overflow的专和精。stack overflow的评议、投票机制能够过滤掉大部分灌水内容,它的tag、得分又可以帮助筛高质量回答。所有这些信息直接可以用于模型训练和评价,节省大量的人工评价。顺便说一下,我觉得stack overflow的评议机制非常棒,的确是有利于筛选出真正志同道合的人,这些人是保持论坛长久活跃的根本。

另一个是在科技论文资源方面差距更大。现在还没有开放版权中文论文库,知网也难堪大任。中国科学家们勤奋又高产,国家科技投入那么大,但最好的论文都发到英文期刊,并以此为荣。正如东东山河友指出,这主要是科技部的失职,我认为还要加上教育部,目前的评价体系逼迫大家把最好的论文写在国外大地上,把习大大的嘱托当做了耳旁风。

通宝推:方平,破鱼,履虎,尖石,陈王奋起,sywyang,铁手,偶卖糕的,唐家山,秦波仁者,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河