五千年(敝帚自珍)

主题:【原创】深入谈一下chatGPT对我们我国的重大影响 -- 东东山

共:💬200 🌺1876 🌵20
全看树展主题 · 分页首页 上页
/ 14
下页 末页
家园 【原创】深入谈一下chatGPT对我们我国的重大影响

chatGPT是美国去年在人工智能上取得的重大成果,另外还有一个是画图做视频的DALL.E, 这些都是内容生成的人工智能,能够推理关联组织信息,能靠谱地生成素材,人类有了一个真正实用化的AI助手,足以改变今后的工作生态。

很多人对chatGPT的运用浅尝即止,认为他就是聊聊天,比小度siri好点,或者中文表现太差(他英文表现好很多)。这其实肤浅了,他能干很多事情,甚至比他推出时候的还要多。比如写程序(真的理解了编程手册,是生成的,不是网上搜的),比如推公式(现在和mathmatica相当),比如说写论文(每段给关键意思提示,就可以写的很准确,不能给个题目就了事),这些事情我都做过,给我的感觉就是给我请了个程序员+助理+万事通,即使他收费,我也会用,我请个人都要多少钱了?所以chatGPT盈利根本不成问题。

几句话交流让chatGPT写了个软件项目

https://www.guancha.cn/XiongJie3/2023_02_01_678074.shtml

目前,工作受到冲击的是客服,文案,律师(太多案例和条文可以学习),中低端程序员.....。但中远期(几年后)来看,影响远不止于此,因为AI会自我迭代,学习速度快,现在每天上亿人和他交互,几年后会怎么样很难猜测。

对于学者来说,首先受影响的是文科论文,其次受影响的实验数据类论文(生化环材等,堆砌不知真假的数据,填充辞藻华丽的文字),当然这需要GPT学习更多专业词汇(时间问题,迟早学会),至于公式推导类的,那就等尚待GPT的发展,但是把公式转换为程序,GPT可以干,研究者的仿真速度加快了。chatGPT还会拉平大组和小组的人力差距。

但是可怕的不是这个,在下面这个OPenAI CEO的访谈中,他说到5年后,chatGPT能够进行的科学内容演绎创造会达到现在规模的1000倍。什么科学内容呢,就是在既有逻辑上关联各种素材,进行排列组合式的关联式知识创造,

这其实是中国论文工作者的最爱方式。他掌握素材化的全面知识其实时间不远了(比如生化环材之类的)。

OpenAI CEO谈chatGPT时代下未来十年的大趋势

https://www.bilibili.com/video/BV1Ws4y1Y7Jq/?spm_id_from=333.1007.top_right_bar_window_history.content.click

下面张捷访谈这个链接谈到chatGPT写的论文摘要给顶刊审,收稿率是三分之一,这个比例很高了。要知道顶刊拒稿率非常高,都是百分之个数点,而且张捷也谈到,在既有已发现方法和逻辑上,进行逻辑叠加,素材排列组合,举一反三,其实正是AI的擅长,这其实抵消了中国的优势;而AI还解决不了创新问题,这其实发挥了美国的长处。如果chatGPT再迭代下去,可能会擅长工程师思维,极大帮助人力工程师,解决美国再工业化的难题,抵消中国的长处(工程师多),发挥美国长处(创新)。

chatGPT的边界讨论:工程问题善于解决(抵消中国长处),创新问题解决不了(发扬美国长处);

https://www.bilibili.com/video/BV1is4y1Y7px/?spm_id_from=444.41.list.card_archive.click

https://www.bilibili.com/video/BV1te4y1A7Wt/?spm_id_from=444.41.list.card_archive.click

当然就学术方面,这样对中国未必不好,解构灌水论文的光环,让社会觉得不再神圣,让学者真正专注于创新,而不是灌水博业绩,得到各种帽子(目前上去的人都是这个路径依赖);标志性事件可能是GPT发了篇顶刊,一如当初阿法狗在围棋上战胜人类后,围棋就走下了神坛,人类对围棋冠军关注度下降了很多,阿法狗解构了围棋光环。。只要不再神圣了,那么科技部门就不好只靠这个(论文指标)糊弄国家。

现在科技战正酣,形式很严峻,美国的科技其实很强,我们总说美国衰落,其实是说他工程师不足,去工业化,但是我们必须正视,美国的研究能力非常强,人才也非常强,基本主导了原创成果,也正在解决工程化短板问题。而我们,就学术界而言,上去的都是灌水依赖路径的人,填满了各级帽子和管理岗位,创新是极其不足的。就AI而言,重大的成果,原创的成果从来都是美国做出的,我们这一两年成天宣传AI论文数量超过了老美,自以为AI和老美并驾齐驱了,这是错觉,我们跟的紧的是别人开源了的,被人不开源的就难跟。所以有笑话说,别人不开源,我们就不领先。

我希望在科技战形式下,国家要理顺科技部和工信部的职责,现在科技部和工信部脱节,科技部管花钱,工信部享受卡脖子。 科技部不直接承当科研后果,所以随便结题,既然随便结题,那么自然各个学阀山头私相授受利益。 科技部成天刷灌水指标糊弄国家,结题的在工业部门能用的有几个?国家也不统计一下,警醒一下。工程化的科研项目和验收就该给工信部,它才是被卡脖子的,迫切需要真实成果的。科学探索的项目可以留给 科技部基金委。

还需要重新调整考核科研绩效的机制,科研的直接指标就是实际应用成果,间接指标就是SCI论文和高引,但是间接指标被中国人玩坏了,现在间接指标被中国人玩坏了,比如高引,微信群组团刷高引,文章出来没多久,招呼一声,大家引用时候互相关照,引用引的高高的,下次我再帮衬你。一篇文章才出来一年,引用就高上天,然后靠刷这些指标得到各种帽子(国内学校抢帽子都抢疯了,所有资源都倾斜,帽子和其他老师就是人仙两界的生物)。在间接指标失真的时候,国家真的有必要重新捡起直接指标,实机用下游用户论证,项目搞赛马制进行实机PK,用实机这个尽量直接的指标来调动举国力量投入科技战。

美国现在正在启动新一轮的技术革命,国内能不能跟的住?不理顺机制很难,虽然当前国内有几家企业也称几个月后推出这个服务,但是并不是让人看好,国内在这方面积累最多的是百度,毕竟语意分析和资料收集,百度积累最好,但是是否能够达到别人程度(能编程能公式能论文等)?有待观察,因为百度在搜索方面也做的很烂。chatGPT的算法其实也有独到之处,不是纯粹堆算力,美国和他一样的公司有好几家,别人也不缺算力,但是chatGPT表现最惊艳,所以chatGPT不开源,论文也讲的不清不楚。此外,还有算力问题,美国已经向中国禁运AI处理器和运算卡。

现在看来,美国真的想启动AI技术革命压倒中国。由于AI学习迭代速度快,能力进化快,所以中国改革动作要快,我们不要重蹈华约的覆辙,现在又到了我们唱国歌的时候了,“起来!起来!.........起来!”

通宝推:史文恭,报以琼琚,敲门,purplue,老老狐狸,乃力,wild007,hnlhl,天白,HarryGore,破鱼,初心,神仙驴,川普,夜如何其,fumachu,方平,尖石,微笑问天,菜根谭,海外俗人,广阔天地,潜望镜,落木千山,秦波仁者,肖羽,无竞,赵美成,唐家山,newbird,途人,达雅,hansens,Swell,胡辣汤,
家园 【求助】

大神我想转载到我的朋友圈里,让正在上学的孩子们看看行吗?

家园 不吃大亏,不可能改变

这种大亏要大到大家不可想像,提起来好几辈子人都得记住。清末的教训也刚刚100年,现在人大都对外面的新技术新应用不屑一顾,提起来什么东西,我天朝都有,即使现在不能用,百度也说了,三个月以后就可以了。实在没有,我们可以对着这个CHATGPT泼屎尿就可以让其不能失效。

通宝推:达雅,
家园 人工智能的数据重要性要大于模型吧,中国也就这两年重视数据安全

你读读人工智能的论文,大多是模型跟代码给你写的明明白白的,但是数据集比较语焉不详

美国有全球的互联网平台,可以用全球的数据做训练。中国只能用国内的数据做训练,最多加上点周边东南亚国家的数据,抖音的数据还无法回传,虽然中国人口众多,但是跟全球人口还是没法比。至于老欧洲?已经沦为数据农场了,他们的数据他们说了不算的。

家园 ai的前景也许没有想象中的乐观

我更看好新能源(核聚变/储电技术)、新资源(人造物质)、量子技术的前景。

家园 这几个不是相互对立是相辅相成的,现在尖端学科都是互相交叉的

研究新能源新资源量子技术很可能需要人工智能的帮助,而人工智能的突破也许需要新材料量子技术的突破

家园 终于在这个时间连上了,做了个测试 -- 有补充

If I have N recorders to record sounds in a room, and there are M people talking in the same room, N>M+5. Potentially there may be noises from cars outside. Could you give me some python code to demix the voices of these people from the recorded sounds?

This is a complex problem that requires expertise in signal processing and machine learning. The task of demixing multiple sources from a single recording is referred to as "blind source separation".

One common approach to solve this problem is to use Independent Component Analysis (ICA). ICA is a statistical technique that aims to separate a multivariate signal into independent non-Gaussian components.

Here is a sample code to perform ICA on a signal using the FastICA library in Python:

import numpy as np
from scipy.io import wavfile
from sklearn.decomposition import FastICA
# Load the audio data into a numpy array
rate, data = wavfile.read('input_signal.wav')
# Reshape the data into a matrix, where each row represents a time frame
samples, channels = data.shape
data = data.reshape((samples, channels))
# Perform ICA
ica = FastICA(n_components=M)
sources = ica.fit_transform(data)
# Save the separated sources
for i in range(M):
 wavfile.write('source_{}.wav'.format(i), rate, sources[:, i])

Note that this is just an example code, and the actual performance will depend on the specifics of your data and the quality of separation achieved by the ICA algorithm. It is common to perform preprocessing on the data before applying ICA, such as filtering to remove low-frequency noise, or normalizing the data to improve the stability of the ICA algorithm. Additionally, it may be necessary to manually inspect the separated sources and perform additional post-processing steps to obtain the desired output.

Could you give me an example python code to filter out noises from an airplane?

Here is an example code to filter out the airplane noise from a signal in Python:

import numpy as np
import matplotlib.pyplot as plt
import scipy.signal as signal
# Load the signal
fs, data = wavfile.read("airplane_noise.wav")
# Design a Butterworth band-stop filter to remove airplane noise
f0 = [1000, 6000] # Cutoff frequencies
b, a = signal.butter(3, f0, btype="bandstop", fs=fs)
# Apply the filter to the data
filtered_data = signal.filtfilt(b, a, data)
# Plot the original and filtered signals
plt.figure(figsize=(12, 6))
plt.plot(data, label="Original")
plt.plot(filtered_data, label="Filtered")
plt.xlabel("Sample")
plt.ylabel("Amplitude")
plt.legend()
plt.show()

Note: The above code assumes that the airplane noise is centered around 1000 to 6000 Hz. The cutoff frequencies and the order of the Butterworth filter can be adjusted to achieve better results. Also, this code uses the filtfilt function from the scipy.signal library to apply the filter, which is a zero-phase filter that doesn't cause phase shift in the filtered signal.

通宝推:方平,
作者 对本帖的 补充(1)
家园 感觉对于低端脑力劳动者是个帮助 -- 补充帖

你提问题它给思路,但是还是不能替代。以后码农可能会是一个产品经理和AI之间的翻译工作。

见前补充 4858572
家园 这篇有很多真知灼见
家园 可以啊
家园 解决美国再工业化的难题怕没这么简单

工业化目前看总是需要人动手的,它能解决动脑的问题,还能解决动手的问题?

这得靠机器人了

这么几亿人持续调教下来,搞出自我意识估计快了?😅

这次人家不开源,百度阿里能不能迎头赶上就很值得期待了

家园 不颂圣的时候写的挺好
家园 消灭灌水的南郭先生对中国是好事怎么能说是坏事呢

还乌烟瘴气的学术界朗朗乾坤,还怕灭不干净呢。

通过一些了解,我国与西方的差距在材料工程方面短板尤其明显,并且似乎不能通过“爆肝”996的方式追赶。但是人工智能方面我看跟新材料不一样。

毛主席写《星星之火可以燎原》的时候大家的疑惑是革命会不会成功,有要放弃的心思,现在人家的chatGPT已经做出来了,证实了可行性,剩下的就是996了,说不定中国会推出更优的“于敏构型”呢。

家园 没必要随便抓个东西就要中国反思

不知你对自己是否如此要求,比如同龄人有比你成功的多的,你是否每天反思自己了呢

对新技术的排斥更多的与年龄相关,老人往往偏保守一些。另外过去类似的牛逼也吹了很多,后来好多也证明没有那么神,一些人有怀疑态度也是正常的。

这东西我和身边朋友早就试过了,比过去的产品的确提高了很多,但具体的实际用途还要观察。

美国作为唯一的帝国,某些最尖端的东西他先弄出来是很正常的,我不知道有个鸡巴毛可以反思的。先跟上,如果有前途就继续追加,我看也就可以了。

通宝推:journal,
家园 美国的孩子们更不愿意学习了

ChatGPT 这东西能写不错的程序和看上去头头是道的论文。这下美国的孩子们就彻底从“繁重”的学习中解脱出来了。

美国从小学就开始鼓励大家用计算器做数学。谷歌出来后,大家写文章都直接放狗了。现在更好,什么作业和考试都直接用 AI 搞定。😁 这事已经闹到要再发明一个 AI 的 APP 来鉴定作业是不是 AI 写的程度了。😁

所以 ChatGPT 不对中国开放是好事。😁

全看树展主题 · 分页首页 上页
/ 14
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河