主题:【原创】说一说我对透明计算的疑惑 -- 鸿乾
先看一些链接:
张教授2005年的报告:
Intel关于透明计算的文件:
关于科学奖的百科:
就这些资料来看,张教授的工作的确是在Intel那里获得了一定的反响。但是,说是有什么重大影响,就谈不上了。在国家科技奖一等奖空缺若干年后,大家可能都期望一些能够给这个奖带来品牌效应的东西。我感到透明计算可能不能达到品牌效应,负面的品牌效应或许可能。下面括号中的应该删去,这个话说错了,谢谢下面pseudo河友的指正,但是还是保证原文在这里更好。(不过,回顾过去的那些奖,例如1989年的“基于时序逻辑的软件工程环境的理论与设计”,也不至于太过突兀。)不过,我们对于如何选取奖项的完全不知道,也就没有办法评论。我感到困惑的是一些技术上的事情。说来和大家讨论。
先看新浪的新闻评论:
有这些话:
这些引起我的问题。新浪这样报道,显然不是这些记者的话,而是评委的话。如果真是评委的话,我的问题就来了。我自己感到,张教授的这个东西,远远不能称为突破冯诺曼结构,恐怕连突破的边都没有沾上。作为对比,看下面的IBM的这个文章:
外链出处 IBM的工作,的确是在企图实现高度平行化计算的一些最核心的东西,就是如何把需要计算的思想平行分散到极大的网络上(上百万个格点)。就是说,人家一个实验室的一个小组在做实在的工作,但是并不大吹。而并没有做实在工作的,竟然敢大吹突破冯诺曼结构。须知,这个结构不是那么好突破的。几十年前,日本倾国力搞过,但是,这种不符合科学规律的做法使得日本完全走错了,在互联网前面完全失去了方向。在信息工业上,日本没有跟上美国的发展,一个颇重要的原因在此。
回过来讲,我对张教授的东西的理解是这样的:他企图建立一个东西,他们叫做MetaOS,或者说是一个箱子,这个箱子可以容纳现有的和未来的OS,因此这个东西,可以称为超级OS。如果这个东西能够实现,那么,有可能消费者手中的一个手机,就可以同时很容易地运行各种不同OS的软件。
这个思想是好的。但是,直言之,也是简单和浅表的。没有理论的内核,也没有技术实现的难度(但是工业界的大规模应用极难,超级难)。不过呢,也完全可能是好东西,是划时代的好东西,例如集成电路,例如鼠标,等等。这种思想,很多人都可以想到。如果成功了,是恰逢其盛的思想,如果失败了,那是非常多的科技史上的这种思想的又一个。总之不能代表如同中国这样的大国的科技水平。
那么是否这个超级OS会成功呢?恐怕很难。要成功,需要两个因素的其中一个,或者干脆两个:一是整个信息工业界的全力拥戴,二是国家的全力扶持。这可能吗?请记住,美国才是推动信息工业的原动机,他们会采用?如果信息工业界不拥戴,国家全力扶持也是可能的,例如中国国家要求所有中国境内运行的手机全部装。好像中国政府有这种权力。不过他们会用吗?如果中国政府不准备做这种大力度的支持,那么为什么发这个奖呢?这些评委们在想什么?为什么他们竟然敢说突破冯诺曼结构这样的话?这些就是我的疑惑。
这难道是趋势?
某单位某工科方向有5、6支研发力量,玩得最虚的拿了个自然科学二等奖。哈哈
应用虚拟化(application irtualization)出现已经至少五年了。微软的appv,vmware的thinapp,citrix的xenapp,都是很成熟的产品。软件被打包,放在服务器上,客户机在应用启动时从服务器下载软件,然后在本地运行。客户机上有agent。对OS,或者说对OS提供的API有依赖。
如果不要求在客户端运行,则远程界面协议(remoting protocol)像RDP,X,VNC,ICA,PCOIP之类就都更是历史悠久了。
也可以把OS和中间件层也像应用层一样,打包放在服务器上,需要的时候就下载。最粗糙的实现就是用网络存储来代替本地硬盘。从服务器到网吧里的游戏机都早就能从网络启动了。
本来从应用到硬件之间的几个分层就是为了易于设计和实现。张教授的提法要每个应用自带中间件和OS层,能够直接使用硬件。这件事得先把其间的每个层都搞定了才能重新组合。对微软这样的全stack服务商而言,可能只要增加编译器功能就能让office2015出现带OS内核的版本。每个应用启动都是相当于机器重启再加载应用。
要多个应用同时运行的话就要有多个OS并存。这又带来了hypervisor这一层。
他的这个透明计算的着眼点还不仅是你说的这些功能层次的东西。如果的确能够搞一个MetaOS出来的话,还是有很多好处的,尤其是对推动这个事情的国家和公司。其实,本来就是一个计算芯片,为了管理计算的方便,搞了一个OS,因此拥有OS的就成了大地主。如果能够把地主圈起来,就可能成就超级地主。这样的想法自然有其合理性。
但是是否可以做得到?才是问题。你讲到的,这样一来,每一个应用的启动,就要动员全部的网络通讯,几乎全部的内存重组,恐怕可以搞死人。因此,各种协议,各种妥协,各种工程上的乱七八糟,都必然出现。这样一来,就没有了很清晰的MetaOS。这些问题,作为研究者,起码应该提及和提出应对方法。但是好像没有。
不过,我更看重的是,怎么评委们可以得出“突破冯诺曼结构”这样的评判?如果这些话真是评委们说的,或者至少是同意的,应该打他们几板子。这个事情,可以用我最近学得的土话:脏班子,来形容了。
从工业界的情况看,其实搞这些东西,就是跑马圈地的行为,所谓的病毒流行,其实很大一部分是有意为之。张教授这个东西,可以为跑马圈地贡献力量吗?其实更重要的是跑马圈地的决心。
我看到的公示时名称叫"网络计算的模式及其基础理论的研究",这个名字根本不会引起我的注意。获奖时我突然看到加上"透明计算-",内容竟然有突破冯诺依曼体系,真的晕掉了。他的MetaOS难道真的不要CPU,存储器,寄存器输入输出接口这类常规的称之为冯氏结构?
用户可以通过客户机上的功能和网络服务器协同,(透明地)指定所要加载的镜像文件。配合一些缓冲存储,即时同步之类的手段来减少对流量的需求。经常换OS的话对网络应该有很高的要求。
TransOS, The first cloud operating system
http://www.ocn.com.cn/zhengjing/201501/zhaoraoxue091416.shtml
把云计算和虚拟桌面两个东西搞在一起了。据他们项目中的某参与过的人说,用开源软件改了一下,即使这样运行还有问题。
最近IT的科研领域总是爆出丑闻,我觉得主要是因为IT发展得太快,让一群年龄大知识陈旧的老人们来做评审,很容易就出问题。他们既有经验已经不适应现实IT发展,容易被骗子们骗。
评审团制度不适合这种发展很快的领域,推荐开源+商业运行。国家投资的IT,一律开源,开放模式地让业内人士评头论足。
摘自 Intel 关于透明计算的文件 第三页:
“透明计算阔展了统治计算领域几十年的冯诺曼结构。。。。”
Regarding the enhancement of computer architecture, TC extends the novel Von-Neumann architecture that has dominated the field for decades by sending permanent storage to remote—either in logical partitions of a huge storage server, or in virtual partitions composed of free disk space from thousands of computers. Most importantly, the “bus” here is the high-speed computer network to which the central process unit is connected. TC infrastructure can be viewed as a huge PC dynamically bound by different peripherals to different virtual processors.
抛开“突破冯诺依曼结构”等等吹牛皮的宣传,这项研究课题的成果里干货少的可怜。
论理论突破,他们发表的论文在计算机科学领域没什么影响。论应用技术创新,我不知道这个东西跟一个增强版的PXE有什么本质区别。
无非是把存储空间换了物理位置,对于整体的逻辑结构,没有也不可能做任何变动,这不能称为突破,最多可以称为稍有延展(如果大家认同这个的话,但是,恐怕没有人会认同这是值得提到的有价值的工作)。冯诺曼的结构的突破,有待于全面的努力,例如我前面所引的IBM的那些小组的工作。
我的理解是这样的: 原来的计算机是孙大圣;云计算是孙大圣发力,小猴们看热闹,活还是要孙大圣干的。透明计算是孙大圣猴毛变出来的一群小大圣,由大圣指挥,各自发力。孙大圣神力如何传到小猴身上,如何答应小猴的召唤,不光是简单的存储空间换了物理位置吧?俺是打酱油的,插两句嘴。
之前的网络模型,是将一个个功能完整的主机联结在一起,解决的是主机之间的通讯问题,主机与主机大体同构,主机之间则是低耦合关系。
而透明网络,不知道我理解的是否正确,给我的感觉是将原先单机的架构平移到网络上,主机开始有分工,比如数据中心相当于单机上的硬盘,超级计算机相当于单机上的CPU,而网络本身则相当于主板,这样,整个网络在概念上就变成一个超级的分布式的计算机。
也许是我太孤陋寡闻,这个概念对我来说是非常新颖也非常有趣的,说“突破了冯诺依曼架构”或许有一点争议(关键是“突破”这个词带有一定的感情色彩),但这个“超级”计算机在架构上确实与冯氏架构有区别是肯定的。这里面有太多可做的事情,比如数个超级计算机群之间如何协作,如何提高通讯效率和"I/O"效率等。
记得有人发起过大规模分布计算的项目,号召世界各地的网友贡献出一部分自己机器上的计算能力,然后同样是通过网络通讯来实现协调共享,但那是个完全开放的项目,全世界的网友都可以参与,大家的硬件配置、网络连接五花八门,协调分享的难度恐怕要比张教授这个模型要高出许多。
俺承认俺无聊,就去查了查这个1989年的自然科学一等奖“基于时序逻辑的软件工程环境的理论与设计”怎么回事。结果是唐稚松教授和Amir Pnueli对时序逻辑这个领域作出了重要贡献,而Amir Pnueli因此在1996年获得图灵奖。