主题:【原创】抛砖!模式识别和机器学习、数据挖掘的区别与联系 -- 永远的幻想
共:💬65 🌺337
复 一直很奇怪的,
个人以为他们的长项是在数据挖掘上。
在海量数据上的数据挖掘,动辄就是百万级的数据,存储访问,管理,都涉及数据库和相关的软硬件知识,从软件上的数据库、信息安全,到硬件上做超算的机群的部署,乃至并行计算算法设计。这绝对是计算机系主打了。我们这种外专业的搞这些,只能是用到了就学两下子,不是玩票水平,也是草台班子了。
而作识别呢,对不起,样本少得多了。人脸之类一般用到的库也就是3000 4000人的规模吧,这一人几张图的采集工作已经很不得了了,有的论文用自己采集的数据可能用到的人也就是几十人。即使训练算法的时候故意加入些“不是人脸”的负样本,一般矩阵的规模也就是1万维左右,单个PC的内存还够用,用C++写的程序速度也还能忍受。
- 相关回复 上下关系8
🙂(六)对几本经典著作的评注2 14 永远的幻想 字4592 2010-07-22 18:09:56
🙂一直很奇怪的, 柯镇恶 字86 2010-07-21 21:01:03
🙂界限哪有那么清楚? 晨枫 字204 2010-07-22 08:26:55
🙂计算机系也学这个,不过
🙂计算机研究的模式识别更偏向于算法,比如他们很少 老石头 字173 2010-07-26 03:39:46
🙂學習了 1 ResHacker 字87 2010-07-21 18:23:28
🙂哈哈,有人转帖啊,好啊 2 永远的幻想 字822 2010-07-21 19:21:08
🙂轉貼BBS是 ResHacker 字95 2010-07-21 21:47:40