五千年(敝帚自珍)

主题:【原创】深入谈一下chatGPT对我们我国的重大影响 -- 东东山

共:💬200 🌺1876 🌵20
分页树展主题 · 全看首页 上页
/ 14
下页 末页
          • 家园 需要说服用户付月费,微软垄断办公室软件可以最好利用AI

            谷歌其实也一直想打入办公软件。Adobe的制图,美术开发,设计辅助软件其实都已经往月费方向走了很久了。

          • 家园 说的很对,零可能算少了

            自动整理报表,我估计100亿都有可能。多少秘书就是负责整理报表,一人一年五万。一个30多人的公司就至少需要一个秘书。一个亿也就2千个秘书. 美国现在有1千多万个公司。 除去水的,至少也有几十万个公司。至少也有上百万个秘书。就算能代替百分之一,也是不止的。

          • 家园 ChatGPT就是微软用来砸场子的

            Bing的搜索及广告份额不过百分之三、四,微软也不靠Bing一个产品谋生。

            而搜索及广告收入,是Google 能生存的生命底线。

            微软这么玩,就是冲到竞争对手家里放🔥的,Google 不跟着放火也不行了,哪怕明明知道是饮鸠止渴。

            这样也好:人类历史上的历次重大技术革命,以及相关的产业淘汰及升级,从来都是被逼出来的,过程中充满了死亡与新生,是一部血淋淋的发展历史。从专业数据库到unstructured data, 从Yahoo到Google, 这是历史宿命、也是历史史命———无论当局者喜欢不喜欢、愿意不愿意。

            大约十八年前,我曾参加过在亚特兰大举行的数据库专业年会。会议的两主席之一是我导师。年会最后一天的议程,是辩论当时初生的搜索技术(谷哥的两个创始人,是数据库行业大牛的学生)。

            一个数据库业界大牛坚持说:“unstructured data处理尚无完整理论支撑,也不是我们数据库专业应该干的活”。翻译成白话就是:“你连输入数据(即搜索到的信息)都不规范,我数据库干嘛要处理?也无法处理”——-这也是当时与会的绝大多数研究者的共识。而我导师等几个教授及工业界学者持开放态度的少数派,沦为被批判的对象。

            十八年下来,谁对谁错,只有市场说了算,而且市场已经说了算。

            若不改变自己,环境会逼着自己改变。变则生,不变必死。

            正如你文中所说:从广告到生产过程,不必把自己圈死了。

            人类更不必过于悲观,否则人类早灭亡若干次了。

            也许明天又是一个发展空间更为广阔的新世界。

            通宝推:大山猫,GWA,李根,桥上,唐家山,凤城,
            • 家园 搜索最早的算法源于国内某人

              他现在是废了垃圾了

              但当年确实是有冲劲有本事的

              • 家园 某人吹牛而已

                Page Rank就是个营销工具,大众吃这套。这个想法本身七十年代就有了(用来给学术期刊排名)。I B M和A S K。C O M也用了类似算法。

                谷歌的成功来自对大数据处理的创新:因为搜到的网页更新更全而吸引到更多的用户;结合用户的点击判断网页的质量;相对高的质量吸引更多的用户。

            • 家园 嗯。Google干活的思路就是平台中间商,微软是生产力2C

              公司的风格典型是由创始人的文化基础决定的。

              Google、Facebook全部都是中间商思维,国内几个大平台,除了京东,都是一丘之貉。

              微软则是生产力,一直专注2C市场,2B也有,但是基本上面向的都是一个个工人/雇员。

              为何微软能做和其他人做不了?因为微软的数据就是从老百姓身上直接获取的啊,而Google、Facebook这些,要么是专业知识,要么是些生活边角料内容。

              目前看,唯一有本事和微软掰手腕的,就是苹果了——而且苹果数据比微软还多了个手机数据,更精准。不过按照苹果做事的尿性,可能要搞个精品AI,不知道要过多久才能堪堪能用,而且不一定能做的好(参考地图翻车事件)。

            • 家园 可择机买微软股票

              真,不开玩笑

        • 家园 ChatGPT 的确能大幅提高生产率 -- 有补充

          同时,使用者需要有质检的能力。

          比如这是一个显然的语病和冗余信息。

          点看全图

          通宝推:桥上,
          作者 对本帖的 补充(1)
          家园 瀑布汗 -- 补充帖

          点看全图

        • 见前补充 4859654
          • 家园 这是典型的人工训练数据不够不深

            搜索行业分一般搜索(General Search)与垂直领域搜索(Vertical search ),而后者又得继续分化为若干更细化的子类别。

            比如多年前,我从事的相关工作中,对图片搜索就得考虑专门为孩童做的数据(过滤掉色情、暴力),或者对某一项专门的经营行业准备的数据(如美国NASCAR比赛)。

            又比如仅就新闻搜索而言,德语搜索就得专为雇请懂徳语的人手工标识(Label)大量德语训练正负相关性训练数据。

            这就是我上文提到的问题:训练量极大,人工昂贵。

            非如此,就只能是行业那句话:Garbage in Garbage out—— 垃圾数据进,垃圾结果出。用中文说就是不能“不教而责”———你不花工夫去教它,它当然不会懂。

            从这个意义上来说,ChatGPT仍然是离不开人工调教的工具。

            往更深一层说:人既然能训练好它,也自然有的是办法“折腾”它。

            沒有任何工具是超然的不受仍何制约的。

            通宝推:GWA,
            • 家园 跟中国的互联网墙有关吧,海外的中文语料库怎么也是体量小

              百度貌似要搞个鳖版的ChatGPT,估计体验会是中文用起来体验不错,用其他的语言就很糟糕。

分页树展主题 · 全看首页 上页
/ 14
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河