五千年(敝帚自珍)

主题:CrowdStrike 世界范围Windows蓝屏题外话 -- 铁手

共:💬50 🌺274 🌵2
全看分页树展 · 主题 跟帖
匿名 该ID及献宝那稻,属于啥都不懂,啥都敢胡咧咧的典型

居然还能扯到“新冠后遗症”。还好,没有习惯性的扯到一尊的责任。。。

我公司也算是下图中某一家吧,算是有点发言权吧

点看全图

一句话回答:CrowdStrike对其网络安全软件某版本的例行更新部署前,没有经过充分的QA,导致被更新的用户计算机终端系统发生大面积崩溃。

软件行业,即使再详细的QA,也不见得会cover所有的corner case,这是行业的基本常识,也是客观事实。

真正懂行的人会问:为什么会造成如此大面积的影响?

答案很简单:近年来各大公司从Dev到QA到Ops各部门,越来越多的采用CICD嘛,提高从开发到测试到部署的效率嘛,特别是基于云端应用,无论是华尔街几大行,还是美国的各实体行业大公司,还包括欧洲譬如德国最大的那几家车厂,甚至包括美欧军方(是的,还有乌克兰)

譬如我手上一个美国XX大客户,为它定制的自动部署技术在短短两年内,都更新三代了(还不是一种技术的不同版本,而是三种完全不同的技术产品----你没看错,新产品本不负责兼容前产品,别问我,要问就问美国政府)。

一方面,如此高节奏的产品更新,大客户都被搞崩溃了。。。我单位分管该项目的Account manager,Field principal更是走了几茬了

另一方面,不搞新产品不行呐。你想想啊,动辄以万数的终端,一年N次更新部署(别问我,要问就问Kubernetes为毛总喜欢更新),如果不开发自动化部署,都靠人去爬那么高的塔台上的机箱,怎么可能来得及?

更不用说美国这届政府拼了命的跟中国竞争,监管部门给大客户规定严格的验收期限(误了一天罚X百万美元)。逼得该客户CEO时不时打电话逼我司CEO(都是美国大公司),然后压力一层一层向下传导、加码。

所以,测试时间从来都没有够过。很多错误就是这么从行政部门逼出来的。无非是补丁摞卜丁啰,不崩溃就行。

就是这么的卷,卷跑了Amazon之后,Google & Microsoft打破脑壳想往里挤,更不用说韩国日本那几大家。

哪里不卷?哪一行不卷?美国也一样。只有不懂行的人,才以为只有中国卷。

通宝推:青青的蓝,桥上,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河