五千年(敝帚自珍)

主题:【原创】深入谈一下chatGPT对我们我国的重大影响 -- 东东山

共:💬200 🌺1876 🌵20
全看分页树展 · 主题 跟帖
家园 这是典型的人工训练数据不够不深

搜索行业分一般搜索(General Search)与垂直领域搜索(Vertical search ),而后者又得继续分化为若干更细化的子类别。

比如多年前,我从事的相关工作中,对图片搜索就得考虑专门为孩童做的数据(过滤掉色情、暴力),或者对某一项专门的经营行业准备的数据(如美国NASCAR比赛)。

又比如仅就新闻搜索而言,德语搜索就得专为雇请懂徳语的人手工标识(Label)大量德语训练正负相关性训练数据。

这就是我上文提到的问题:训练量极大,人工昂贵。

非如此,就只能是行业那句话:Garbage in Garbage out—— 垃圾数据进,垃圾结果出。用中文说就是不能“不教而责”———你不花工夫去教它,它当然不会懂。

从这个意义上来说,ChatGPT仍然是离不开人工调教的工具。

往更深一层说:人既然能训练好它,也自然有的是办法“折腾”它。

沒有任何工具是超然的不受仍何制约的。

通宝推:GWA,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河