五千年(敝帚自珍)

主题:下半场开踢 -- 方平

共:💬5008 🌺38272 🌵370
全看分页树展 · 主题 跟帖
家园 数据的意义有两层,好多人弄混了

一种是与时俱进,总有最新数据,那是搜索的逻辑,所以有OpenAI加微软暗杠谷歌的说法,但那其实没有什么技术含量,真正的瓶颈还是AI自身的满嘴跑舌头,这个问题没解决,没人敢相信AI的搜索,这是重中之重,不要拎不清。

所以方平说的数据问题,与我前贴提到的数据质量是两回事。说白了,对于训练算法而言,在大家都醒悟数据需要立高墙之前,早已经四处泛滥了,今天的AI突破不依赖于新的数据,因为已有的数据对于逻辑训练足够了,新的数据无非是与时俱进问题,逻辑上没有新的贡献。但这不代表以前数据的质量不重要,如果话术一直是数据的来源的话,那么可想而自训练出的AI也是一个话术AI,仅此而已😂。

所以回到方平的贴,随时更新数据有什么意义,当然有意义,因为可以与时俱进,但对于AI的底层逻辑没影响。反而是算法才能带来真正的突破,这里的突破特质对硬件对算力的降低要求。这方面之前几个月已经有了不少突破,如果以为AI还是仅能被寡头们掌控的算力说一不二的,那么需要更新一下认知了😂。

科学技术是生产力,这话谁说的来着。虽然很浅显,但真的很反直觉😂。 从乾隆到僧格林沁,从俄乌到加沙,一个永恒的主题就是这个认知上的永不改悔,总奢望用某个老祖宗的话术去大事化小,过一天算一天,就不要总去扯什么星辰大海的淡😂。

通宝推:夜如何其,Swell,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河