五千年(敝帚自珍)

主题:【原创】机器学习的基础是什么?(0) -- 看树的老鼠

共:💬154 🌺509 🌵1
全看分页树展 · 主题 跟帖
家园 讨论机器学习的一个问题和一种极限

这是和itn网友的讨论。虽然是他的一个特殊的例子,我认为具备普遍性,就提上来到这里。

按照我的理解,他的情况基本上如此:有一个时间序列A1A2A3······AN,这里N大于300。Ak是标量(不知道范围,估计可以认为在一个小范围内,比如说0-255等,他的量可能要取对数?)。他需要一个比较智能的东西来监测这个标量的变化,在异常变动时,自动报警。而且这个异常变动不仅和前后两个标量的变化幅度有关,也时间所在也有关。他说的,白天变化颇大也正常,但是晚上这个变化就不正常了。

这个事情本身不是难题,甚至可以说连问题都不是。如果是写程序来做的话,很容易。但是,我们希望的是能够让机器自己来学习,尽量减少人工的干预。现在来看如何做。

当然有很多做法。itn网友是根据Hawkins的那个脑学习算法来做的。根据他们的那个视频,他们的那个算法可以把时间序列记忆下来(恐怕也记忆不了全部,仅能记忆一段吧),而且可以预测以后若干时间的标量,至少是可以比较好的预测(这要请itn网友来仔细讲讲),就是说,如果我知道了Ak,我就可以比较好预测A(k+1),A(k+2),······,A(k+20),等。那么,有了这样的数据,是否就比较好做报警了呢?

可能可以。比如说,如果我预测A(k+10)应该仅比Ak大10(比如说的话),但是,实际上A(k+10)大了50,是不是我就可以报警了呢?这样看,好像不太用人工干预,就可以做报警了。

但是,仍然,为什么大了50,就可以报警?这个标准,不是机器可以学习的,如果没有外面的监督和指导的话。我想,这就是目前的机器学习的极限了。

其实,如果没有了外面的监督和指导,即使一个真人在那里,也不太好定这个标准。这个标准多少需要外部的反馈。这就更是学习的极限。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河