主题：【原创】深入谈一下chatGPT对我们我国的重大影响 -- 东东山

共:💬200 🌺1876 🌵20

老视野待整

【原创】深入谈一下chatGPT对我们我国的重大影响

chatGPT是美国去年在人工智能上取得的重大成果，另外还有一个是画图做视频的DALL.E, 这些都是内容生成的人工智能，能够推理关联组织信息，能靠谱地生成素材，人类有了一个真正实用化的AI助手，足以改变今后的工作生态。

很多人对chatGPT的运用浅尝即止，认为他就是聊聊天，比小度siri好点，或者中文表现太差（他英文表现好很多）。这其实肤浅了，他能干很多事情，甚至比他推出时候的还要多。比如写程序（真的理解了编程手册，是生成的，不是网上搜的），比如推公式（现在和mathmatica相当），比如说写论文（每段给关键意思提示，就可以写的很准确，不能给个题目就了事），这些事情我都做过，给我的感觉就是给我请了个程序员+助理+万事通，即使他收费，我也会用，我请个人都要多少钱了？所以chatGPT盈利根本不成问题。

几句话交流让chatGPT写了个软件项目

https://www.guancha.cn/XiongJie3/2023_02_01_678074.shtml

目前，工作受到冲击的是客服，文案，律师（太多案例和条文可以学习），中低端程序员.....。但中远期（几年后）来看，影响远不止于此，因为AI会自我迭代，学习速度快，现在每天上亿人和他交互，几年后会怎么样很难猜测。

对于学者来说，首先受影响的是文科论文，其次受影响的实验数据类论文（生化环材等，堆砌不知真假的数据，填充辞藻华丽的文字），当然这需要GPT学习更多专业词汇（时间问题，迟早学会），至于公式推导类的，那就等尚待GPT的发展，但是把公式转换为程序，GPT可以干，研究者的仿真速度加快了。chatGPT还会拉平大组和小组的人力差距。

但是可怕的不是这个，在下面这个OPenAI CEO的访谈中，他说到5年后，chatGPT能够进行的科学内容演绎创造会达到现在规模的1000倍。什么科学内容呢，就是在既有逻辑上关联各种素材，进行排列组合式的关联式知识创造，

这其实是中国论文工作者的最爱方式。他掌握素材化的全面知识其实时间不远了（比如生化环材之类的）。

OpenAI CEO谈chatGPT时代下未来十年的大趋势

https://www.bilibili.com/video/BV1Ws4y1Y7Jq/?spm_id_from=333.1007.top_right_bar_window_history.content.click

下面张捷访谈这个链接谈到chatGPT写的论文摘要给顶刊审，收稿率是三分之一，这个比例很高了。要知道顶刊拒稿率非常高，都是百分之个数点，而且张捷也谈到，在既有已发现方法和逻辑上，进行逻辑叠加，素材排列组合，举一反三，其实正是AI的擅长，这其实抵消了中国的优势；而AI还解决不了创新问题，这其实发挥了美国的长处。如果chatGPT再迭代下去，可能会擅长工程师思维，极大帮助人力工程师，解决美国再工业化的难题，抵消中国的长处（工程师多），发挥美国长处（创新）。

chatGPT的边界讨论：工程问题善于解决（抵消中国长处），创新问题解决不了（发扬美国长处）；

https://www.bilibili.com/video/BV1is4y1Y7px/?spm_id_from=444.41.list.card_archive.click

https://www.bilibili.com/video/BV1te4y1A7Wt/?spm_id_from=444.41.list.card_archive.click

当然就学术方面，这样对中国未必不好，解构灌水论文的光环，让社会觉得不再神圣，让学者真正专注于创新，而不是灌水博业绩，得到各种帽子（目前上去的人都是这个路径依赖）；标志性事件可能是GPT发了篇顶刊，一如当初阿法狗在围棋上战胜人类后，围棋就走下了神坛，人类对围棋冠军关注度下降了很多，阿法狗解构了围棋光环。。只要不再神圣了，那么科技部门就不好只靠这个（论文指标）糊弄国家。

现在科技战正酣，形式很严峻，美国的科技其实很强，我们总说美国衰落，其实是说他工程师不足，去工业化，但是我们必须正视，美国的研究能力非常强，人才也非常强，基本主导了原创成果，也正在解决工程化短板问题。而我们，就学术界而言，上去的都是灌水依赖路径的人，填满了各级帽子和管理岗位，创新是极其不足的。就AI而言，重大的成果，原创的成果从来都是美国做出的，我们这一两年成天宣传AI论文数量超过了老美，自以为AI和老美并驾齐驱了，这是错觉，我们跟的紧的是别人开源了的，被人不开源的就难跟。所以有笑话说，别人不开源，我们就不领先。

我希望在科技战形式下，国家要理顺科技部和工信部的职责，现在科技部和工信部脱节，科技部管花钱，工信部享受卡脖子。科技部不直接承当科研后果，所以随便结题，既然随便结题，那么自然各个学阀山头私相授受利益。科技部成天刷灌水指标糊弄国家，结题的在工业部门能用的有几个？国家也不统计一下，警醒一下。工程化的科研项目和验收就该给工信部，它才是被卡脖子的，迫切需要真实成果的。科学探索的项目可以留给科技部基金委。

还需要重新调整考核科研绩效的机制，科研的直接指标就是实际应用成果，间接指标就是SCI论文和高引，但是间接指标被中国人玩坏了，现在间接指标被中国人玩坏了，比如高引，微信群组团刷高引，文章出来没多久，招呼一声，大家引用时候互相关照，引用引的高高的，下次我再帮衬你。一篇文章才出来一年，引用就高上天，然后靠刷这些指标得到各种帽子（国内学校抢帽子都抢疯了，所有资源都倾斜，帽子和其他老师就是人仙两界的生物）。在间接指标失真的时候，国家真的有必要重新捡起直接指标，实机用下游用户论证，项目搞赛马制进行实机PK，用实机这个尽量直接的指标来调动举国力量投入科技战。

美国现在正在启动新一轮的技术革命，国内能不能跟的住？不理顺机制很难，虽然当前国内有几家企业也称几个月后推出这个服务，但是并不是让人看好，国内在这方面积累最多的是百度，毕竟语意分析和资料收集，百度积累最好，但是是否能够达到别人程度（能编程能公式能论文等）？有待观察，因为百度在搜索方面也做的很烂。chatGPT的算法其实也有独到之处，不是纯粹堆算力，美国和他一样的公司有好几家，别人也不缺算力，但是chatGPT表现最惊艳，所以chatGPT不开源，论文也讲的不清不楚。此外，还有算力问题，美国已经向中国禁运AI处理器和运算卡。

现在看来，美国真的想启动AI技术革命压倒中国。由于AI学习迭代速度快，能力进化快，所以中国改革动作要快，我们不要重蹈华约的覆辙，现在又到了我们唱国歌的时候了，“起来！起来！.........起来！”

通宝推：史文恭,报以琼琚,敲门,purplue,老老狐狸,乃力,wild007,hnlhl,天白,HarryGore,破鱼,初心,神仙驴,川普,夜如何其,fumachu,方平,尖石,微笑问天,菜根谭,海外俗人,广阔天地,潜望镜,落木千山,秦波仁者,肖羽,无竞,赵美成,唐家山,newbird,途人,达雅,hansens,Swell,胡辣汤,

复【原创】深入谈一下chatGPT对我们我国的重大影响

家园

【求助】

大神我想转载到我的朋友圈里，让正在上学的孩子们看看行吗？

复【原创】深入谈一下chatGPT对我们我国的重大影响

家园

不吃大亏，不可能改变

这种大亏要大到大家不可想像，提起来好几辈子人都得记住。清末的教训也刚刚100年，现在人大都对外面的新技术新应用不屑一顾，提起来什么东西，我天朝都有，即使现在不能用，百度也说了，三个月以后就可以了。实在没有，我们可以对着这个CHATGPT泼屎尿就可以让其不能失效。

通宝推：达雅,

复【原创】深入谈一下chatGPT对我们我国的重大影响

家园

人工智能的数据重要性要大于模型吧，中国也就这两年重视数据安全

你读读人工智能的论文，大多是模型跟代码给你写的明明白白的，但是数据集比较语焉不详

美国有全球的互联网平台，可以用全球的数据做训练。中国只能用国内的数据做训练，最多加上点周边东南亚国家的数据，抖音的数据还无法回传，虽然中国人口众多，但是跟全球人口还是没法比。至于老欧洲？已经沦为数据农场了，他们的数据他们说了不算的。

复【原创】深入谈一下chatGPT对我们我国的重大影响

家园

ai的前景也许没有想象中的乐观

我更看好新能源（核聚变/储电技术）、新资源（人造物质）、量子技术的前景。

复 ai的前景也许没有想象中的乐观

家园

这几个不是相互对立是相辅相成的，现在尖端学科都是互相交叉的

研究新能源新资源量子技术很可能需要人工智能的帮助，而人工智能的突破也许需要新材料量子技术的突破

复【原创】深入谈一下chatGPT对我们我国的重大影响

家园

终于在这个时间连上了，做了个测试 -- 有补充

If I have N recorders to record sounds in a room, and there are M people talking in the same room, N>M+5. Potentially there may be noises from cars outside. Could you give me some python code to demix the voices of these people from the recorded sounds?

This is a complex problem that requires expertise in signal processing and machine learning. The task of demixing multiple sources from a single recording is referred to as "blind source separation".

One common approach to solve this problem is to use Independent Component Analysis (ICA). ICA is a statistical technique that aims to separate a multivariate signal into independent non-Gaussian components.

Here is a sample code to perform ICA on a signal using the FastICA library in Python:

import numpy as np
from scipy.io import wavfile
from sklearn.decomposition import FastICA
# Load the audio data into a numpy array
rate, data = wavfile.read('input_signal.wav')
# Reshape the data into a matrix, where each row represents a time frame
samples, channels = data.shape
data = data.reshape((samples, channels))
# Perform ICA
ica = FastICA(n_components=M)
sources = ica.fit_transform(data)
# Save the separated sources
for i in range(M):
 wavfile.write('source_{}.wav'.format(i), rate, sources[:, i])

Note that this is just an example code, and the actual performance will depend on the specifics of your data and the quality of separation achieved by the ICA algorithm. It is common to perform preprocessing on the data before applying ICA, such as filtering to remove low-frequency noise, or normalizing the data to improve the stability of the ICA algorithm. Additionally, it may be necessary to manually inspect the separated sources and perform additional post-processing steps to obtain the desired output.

Could you give me an example python code to filter out noises from an airplane?

Here is an example code to filter out the airplane noise from a signal in Python:

import numpy as np
import matplotlib.pyplot as plt
import scipy.signal as signal
# Load the signal
fs, data = wavfile.read("airplane_noise.wav")
# Design a Butterworth band-stop filter to remove airplane noise
f0 = [1000, 6000] # Cutoff frequencies
b, a = signal.butter(3, f0, btype="bandstop", fs=fs)
# Apply the filter to the data
filtered_data = signal.filtfilt(b, a, data)
# Plot the original and filtered signals
plt.figure(figsize=(12, 6))
plt.plot(data, label="Original")
plt.plot(filtered_data, label="Filtered")
plt.xlabel("Sample")
plt.ylabel("Amplitude")
plt.legend()
plt.show()

Note: The above code assumes that the airplane noise is centered around 1000 to 6000 Hz. The cutoff frequencies and the order of the Butterworth filter can be adjusted to achieve better results. Also, this code uses the filtfilt function from the scipy.signal library to apply the filter, which is a zero-phase filter that doesn't cause phase shift in the filtered signal.

通宝推：方平,

作者对本帖的补充(1)

家园

感觉对于低端脑力劳动者是个帮助 -- 补充帖

你提问题它给思路，但是还是不能替代。以后码农可能会是一个产品经理和AI之间的翻译工作。

见前补充 4858572

复【原创】深入谈一下chatGPT对我们我国的重大影响

家园

这篇有很多真知灼见

复【求助】

家园

可以啊