五千年(敝帚自珍)

主题:关于大数据 -- jent

共:💬18 🌺118
全看分页树展 · 主题 跟帖
家园 在年头上回看这个帖,有点意思啊

非常非常有意思:

在信源,信道,和信宿之间的数据,成了新的信源,而得到这个新信源的人,成了新的信宿,获取这个新信源中的信息/数据的过程/通道,成了新的信道。

我之前看的时候,理解这话的意思是,大数据的通信系统中,存在一个类似叠代的过程。但是具体如何迭代,当时并没有想法。

最近做一个课题,忽然想到一点,那个“在信源信道和信宿之间的数据成了新的信源”这话可以深入理解:首先,这些数据原来只是保存在信源中,然后在信宿中被再现。这是一个“小数据”的通信过程。但是要想成为大数据的通信过程,就要让这个数据动起来,也就是在传输中的数据才可能成为了信源,换句话说小数据的信道特征在这里是至关重要的。

小数据传输的是信息,信道特征用互信息来描述,而当小数据迭代形成大数据时,小数据传输过程成为新的信源,描述其信道特征的互信息成为大数据信源向大数据信宿传递的那个东西。

我的课题是把一个远离平衡态系统的演化过程描述为祖先系统和新系统间通信的过程。现在的问题是信源符号概率用shannon信息量描述总是不如互信息形式的描述更符合实验结果。这个大半年前的回帖给了我启发。这样的情况下,就是应该用互信息来描述,因为祖先系统被传输的的确不是简单的信息量,而是内部子系统间的通信方式。后代系统被重现和变异了的是祖先系统内部的子系统间通信方式。

有意思。

通宝推:sywyang,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河