五千年(敝帚自珍)

主题:【原创】抛砖!模式识别和机器学习、数据挖掘的区别与联系 -- 永远的幻想

共:💬65 🌺337
全看分页树展 · 主题 跟帖
家园 说到点子上了

我觉得让机器学习首先人要有点概念,否则人自己都一头雾水,想让计算机替他思考,怎么可能呢?

以前搞过神经网络和SVM,见过太多的人随便拿几个变量就去预测。

其实我在前面说为什么工科人还能混,已经说到这个了,但是没地方展开说了。

那个流程图里的“数据表示”,其实不仅仅是“量化编码”的软硬件需要背景知识,还有“特征选择”其实也是要背景知识的。

针对特定问题下得到的训练数据,构造、选取什么样的特征,直接关乎识别结果,这个比后面用什么样的ML算法还要关键。你的原始特征下是严重不可分的样本,或者是非凸的,你“没这点概念”(这个词用得太恰当了),不进行预处理,就送进一个凸优化寻优的算法,结果是可想而知的。

这就是我推荐的第一本书里提到的“没有天生优越的分类器”定理。没有一个万能方法能通吃各种数据。NN SVM确实分别以“误差低”和“在样本不可分情况下误差低”而著称,但是也不是万能的

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河