五千年(敝帚自珍)

主题:【原创】搭积木 -- 喜欢喝冰茶

共:💬37 🌺69
全看分页树展 · 主题 跟帖
家园 果然是行家,俺的把小斧头收起来了

说明非常准确,但是诚如你所说的,生物系统的规模和复杂度远远大于一般的化学系统,所以当研究生物系统时,能量函数不仅包括基于物理的能量函数,还包括来自于知识学习的“能量函数”。基于计算成本的考虑,巨大的生物系统很难使用计算化学中所有的能量函数。至于你所举的例子,诸如LJ计算原子间的相互作用,倒是计算生物学中的另外一种方法在使用,但是即使对一个不大的生物系统,运算量都是惊人的。不过行家果然是行家,ab initio方法的关键就在于Potential Function的定义,Casp里有两个组非常厉害,他们的成功之处就是不仅使用了常规的基于物理的function,更重要的是develop了几种基于已知生物知识的Knowledge based potential function。而且在具体使用上,例如氨基酸链的空间位置和移动限制,就有Lattice Model和Non-Lattice Model。在生物计算中,ab initio现在基本上还是属于Coarse-grained Model,至于像计算化学中那种比较精细的模拟,则被另外一种计算生物学方法所采用,不过目的不同。

呵呵,行家说得很对,如果概率能量因子是Boltzmann因子的话,这个方法的学名就是Metropolis-Hastings Monte Carlo方法,典型的(一阶)老马链。原文中只是不想引入太多的数学名称讨人嫌,估计大家对Monte Carlo比较感兴趣,对方法不感兴趣(其实俺也挺喜欢那车的,特别是红色儿的)。

正是因为Potential Function的复杂性,所以这种方法有一个问题就是,没有人知道,它的中间构象对应什么。看起来,大多数人不认为这些中间构象是真实的Protein Folding中的构象,虽然这种方法其实就是生物计算里面Protein Folding的基础。

至于原文的例子嘛,当然用最简单的了,便于了解,毕竟是科技版面,不是学术论文。ab initio的名字嘛,呵呵,这方法就是前两种都fail掉了,没辙了,只好这种了,死马当活马医吧。毕竟即使准确率只有20-30%,也比坐那儿干猜强得多。举个极端的例子,假设我可以猜对每个氨基酸相对于另外一个的相对空间位置的概率是99%(事实上是瞎掰,根本做不到),而这个概率是独立的,那么对于101个氨基酸的小蛋白链,准确率就只有(0.99)^100=36%,如果是201个话,准确率就降至13%,可是200个残基的蛋白真得不大。要是一个含501个残基的蛋白质,这个概率是0.65%,就跟没做一样了。所以发展这种方法还是很有意义滴

顺便问一句,老兄玩儿什么的?amber, qsar 还是 charmm?

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河