主题:【原创】抛砖!模式识别和机器学习、数据挖掘的区别与联系 -- 永远的幻想
这次先贴两本离题稍远点的,作为开阔知识来用的参考书。
《Artificial Intelligence:A Modern Approach》
中文版:
英文原版:
中文 和2种影印都是原书第2版,02年出的,两种影印我比较过内容没区别,但是清华的纸质稍好,但价格贵好多。
中文和人邮的影印图书馆好找,但是市面上好像木有了。
现在原版是09年底刚出的第3版了。但看书评,好像变化不是特别大,有些有第2版的人觉得亏了。
优点:
1.涉及面特别广。从走棋的算法,到语义逻辑分析,到智能系统……并不局限于概率统计类的方法,无所不包。
2.很多AI方面的历史人物和典故。从莱布尼茨时代的机械计算机器,到图灵,到50 60年代某人第一次写了个啥算法。怎么说呢,当故事书看也行了。
3. 叙述比较清楚。
问题:
1. 有点散。各个章节之间有时联系不是那么大,其实为了做到包罗万象,散是难免的。
2. Introduction 而非 Reference。所以指望看这个书完了去照着写算法,就别想了。
3.第2版里没涉及支持向量机(Support Vetor Machine SVM)。这个即使作为02年出的书也不应该了。不过现在SVM基本是大路货了,到处都是(SVM有点走当年神经网络最后烂大街,无人问津的趋势)。
4.太厚,快速翻阅即可。中文700多页,英文1100多页。因为毕竟大家有各自专业背景,所以挑前几章+自己相关领域的章节,浏览即可,其他当故事书看,就当做专业英语的阅读资料吧。
总之,适合没接触过的这方面的人入门用。但是个人感觉一个是有点散,一个是概念太多,没有突出概率统计。感觉很容易迷路似的,所以第一本没推荐这个。但N多学校都用这个做教材,不是没道理的。
《Nonlinear Time Series: Nonparametric and Parametric Methods》
中文版:
影印版:
英文原版:
这本虽然专讲时间序列,但是觉得自动化之类工科出身的人往机器学习数据挖掘方面转的话,这样一本由数学家写的数学味浓一些的书还是很有必要的。特别是中国人写的,所以在大牛在国内的时候,还有机会当面请教。
优点:
1.背景知识适合自动化、通信这些专业的。一般电子类的都会学点现代数字信号处理比如Wiener最佳滤波,Kalman滤波之类,已经了解ARMA模型了,这样看这个书可以了解这些方法的发展和引申。虽然不见得以后真的去做金融之类,但是用自己熟悉的背景知识去入门,总比两眼一抹黑钻进去强。其实“在工言工”,看成是在讲高级滤波算法的话,能不能用在控制系统里呢?反正俺那本已经被搞控制的同学借去鸟。
2.图表例子多,程序提供下载。虽然是S-plus/R写的,可能工科的没接触过R,但是很容易上手。
3.数学味,不解释。
问题:
1.领域比较专门。主要适合经济数据,金融数据这些。当然书里也举了生态学上的例子。
2.比较难懂。一个是数学味,一个是很少分析算法细节,公式推导都比较简略,要配合参考文献和程序。
但是之所以推荐这本,倒不是说里面讲到的那些方法。而是想:
1.介绍两位中国牛人,有机会见到可以请教。
2.通过这书里的例子,了解点R语言。开源的数学软件,是数学家用的,上面有很多最新的ML算法。假如你早已熟悉了工程味的MATLAB,现在可以体味一下R简化的都是哪些地方?在思路和实践上,都要习惯不断切换工科和理科两种方式。试试理科的工具,也就能多找找感觉。
3.要适应数学家的表达。毕竟这个领域的算法都是人家提出来的,看论文基本就是在膜拜统计学家了。通过这个也体会一下同样是ARMA模型,理科是怎么思考的。不要再满足于当初学信号处理的时候,好像学了个Levinson-Durbin,Kalman递推公式就万事大吉。
- 相关回复 上下关系8
🙂independent component analys 1 pcma 字0 2010-07-24 16:34:51
🙂cocktail party problem 2 永远的幻想 字321 2010-07-24 16:32:06
🙂对,就是这个词 奔波儿 字46 2010-07-24 17:18:08
🙂(六)对几本经典著作的评注2
🙂一直很奇怪的, 柯镇恶 字86 2010-07-21 21:01:03
🙂界限哪有那么清楚? 晨枫 字204 2010-07-22 08:26:55
🙂计算机系也学这个,不过 永远的幻想 字617 2010-07-21 23:06:31
🙂计算机研究的模式识别更偏向于算法,比如他们很少 老石头 字173 2010-07-26 03:39:46