五千年(敝帚自珍)

主题:【原创】抛砖!模式识别和机器学习、数据挖掘的区别与联系 -- 永远的幻想

共:💬65 🌺337
全看分页树展 · 主题 跟帖
家园 计算机系也学这个,不过

个人以为他们的长项是在数据挖掘上。

在海量数据上的数据挖掘,动辄就是百万级的数据,存储访问,管理,都涉及数据库和相关的软硬件知识,从软件上的数据库、信息安全,到硬件上做超算的机群的部署,乃至并行计算算法设计。这绝对是计算机系主打了。我们这种外专业的搞这些,只能是用到了就学两下子,不是玩票水平,也是草台班子了。

而作识别呢,对不起,样本少得多了。人脸之类一般用到的库也就是3000 4000人的规模吧,这一人几张图的采集工作已经很不得了了,有的论文用自己采集的数据可能用到的人也就是几十人。即使训练算法的时候故意加入些“不是人脸”的负样本,一般矩阵的规模也就是1万维左右,单个PC的内存还够用,用C++写的程序速度也还能忍受。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河