五千年(敝帚自珍)

主题:CrowdStrike 世界范围Windows蓝屏题外话 -- 铁手

共:💬50 🌺274 🌵2
全看树展主题 · 分页首页 上页
/ 4
下页 末页
家园 CrowdStrike 世界范围Windows蓝屏题外话

周五,世界范围内有巨量微软的视窗系统蓝屏显示,不少航空公司停飞。原因是 CrowdStrike 推送了升级,导致系统问题。

CrowdStrike 具体干什么的,我不清楚,大概类似自动系统管理员,保护系统免受黑客攻击。

这次错误升级导致的大面积系统瘫痪,情节严重。不过我这里说的是一个相对比较神奇的“巧合”。

在事件发生前几个小时,有人在 reddit WSB 版发文,说CrowdStrike 不值那个价,重点理由之一,是认为它是占据了市场的大部分份额。帖文发出后,不少人笑话他的帖,一部分认为市场份额大,当然是说竞争对手没法比,常识当然也是市场份额越大越好。他的观点则是市场份额太大,就越容易出问题。

结果,几小时后,CrowdStrike 的升级推出,大量windows 系统开始蓝屏。之前是大量的笑话,然后是大量的膜拜。事情变化之戏剧化,我没见过这么夸张的。

前后对比,看的我乐坏了。

唯一的遗憾,这位仁兄虽然买了 put ,但是数量不多,时间久远,(2015年11月到期),标的太低(他发文时 300多的股价,他的标的是185),这个“巧合“给他带来的收益也就有限。

倒是有人运气到了,几分钱的涨到7多。

只能说,这世界神奇的时候总是有。

通宝推:陈王奋起,凤城,燕人,dfindy,
家园 近年来难以置信的失误越来越多

比如这个蓝屏,比如飞机飞到一半门没了,比如狙击手在附近唯一的屋顶上却视而不见等。

我感觉有下面几个因素:

1、人才凋敝

2、现代管理体系有某些重大缺陷,比如:

- 过于精细的分工导致大家都不知别人在干嘛,让风险无法被发现

- 有问题的人被选拔上去,比如保护特朗普的特勤里,看着不那么健康的女性。

3、信任链过长、过于集中,导致有时候一个小小的纰漏会导致巨大的后果。

4、新冠后遗症

我估计不久的将来,会有一个专门的领域,来研究现代体系下的此类缺陷。

通宝推:达雅,
家园 123

第一

不值那个价……理由之一是认为它是占据了市场的大部分份额。

市场份额大到一个临界点,它就已经不再是一家做生意的企业了,而是“基础设施”,基础设施值多少钱?医院学校值多少钱?任意。自来水3元5元一吨也可以,300-500一吨难道你可以拒绝?所以美股五朵金花涨到天上去也是有道理可说的。

我看有点物极必反的意思,例如支付宝公司已经成为基础设施,地位更加重要了,但是不值钱了——你买下这间公司的股份拿不到多少利益,不允许你自来水卖500元一吨,不允许你卖自来水的搞花样(设最低消费、设开瓶费、设有奖用水、搭售配售……)

二,世界上每天都有人中奖,百万大奖。

家园 很简单的事让你说复杂了,印度码工挑大梁就是这结果
家园 衰退时代的日常

我们被教科书灌输了一种错觉:人类社会是高歌猛进的,从一个胜利走向另一个胜利。

但真实情况是,螺旋式上升波浪式前进。而我们现在就在一个局部下降螺旋中。

环球同此凉热。我们也没好到哪里去。

123
家园 基础设施要想赚钱比什么互联网金融可快多了

要不李嘉诚到了英国咋想着投资基础设施呢,只是他终究是忘了他是一个黄皮。

例如支付宝公司已经成为基础设施,地位更加重要了,但是不值钱了——你买下这间公司的股份拿不到多少利益,不允许你自来水卖500元一吨,不允许你卖自来水的搞花样(设最低消费、设开瓶费、设有奖用水、搭售配售……)

印度信实的小公子最近结婚,花了35个亿,整个好莱坞几乎让人给打包过来捧臭脚。人家转手涨点电价就全部收回来了。

家园 这个理由太单薄

印度人又不是刚刚开始在美国登堂入室,纳德拉上任微软CEO是10年前的事了,当高管时间更长,为何以前没这么拉胯?

特勤局放了几个胖女子保护特朗普,以及对近在咫尺的步枪刺客视而不见,比这次微软蓝屏的事件离谱多了,和印度人更是八竿子打不着。

-

甩锅印度人,作为一种扰乱对手的宣传策略,我是支持的,虽然我估计没啥用;但要国人都这么看,从而高枕无忧,那未必是好事。

因为类似的现象,我们自己身上也并非不存在。

匿名 该ID及献宝那稻,属于啥都不懂,啥都敢胡咧咧的典型

居然还能扯到“新冠后遗症”。还好,没有习惯性的扯到一尊的责任。。。

我公司也算是下图中某一家吧,算是有点发言权吧

点看全图

一句话回答:CrowdStrike对其网络安全软件某版本的例行更新部署前,没有经过充分的QA,导致被更新的用户计算机终端系统发生大面积崩溃。

软件行业,即使再详细的QA,也不见得会cover所有的corner case,这是行业的基本常识,也是客观事实。

真正懂行的人会问:为什么会造成如此大面积的影响?

答案很简单:近年来各大公司从Dev到QA到Ops各部门,越来越多的采用CICD嘛,提高从开发到测试到部署的效率嘛,特别是基于云端应用,无论是华尔街几大行,还是美国的各实体行业大公司,还包括欧洲譬如德国最大的那几家车厂,甚至包括美欧军方(是的,还有乌克兰)

譬如我手上一个美国XX大客户,为它定制的自动部署技术在短短两年内,都更新三代了(还不是一种技术的不同版本,而是三种完全不同的技术产品----你没看错,新产品本不负责兼容前产品,别问我,要问就问美国政府)。

一方面,如此高节奏的产品更新,大客户都被搞崩溃了。。。我单位分管该项目的Account manager,Field principal更是走了几茬了

另一方面,不搞新产品不行呐。你想想啊,动辄以万数的终端,一年N次更新部署(别问我,要问就问Kubernetes为毛总喜欢更新),如果不开发自动化部署,都靠人去爬那么高的塔台上的机箱,怎么可能来得及?

更不用说美国这届政府拼了命的跟中国竞争,监管部门给大客户规定严格的验收期限(误了一天罚X百万美元)。逼得该客户CEO时不时打电话逼我司CEO(都是美国大公司),然后压力一层一层向下传导、加码。

所以,测试时间从来都没有够过。很多错误就是这么从行政部门逼出来的。无非是补丁摞卜丁啰,不崩溃就行。

就是这么的卷,卷跑了Amazon之后,Google & Microsoft打破脑壳想往里挤,更不用说韩国日本那几大家。

哪里不卷?哪一行不卷?美国也一样。只有不懂行的人,才以为只有中国卷。

通宝推:青青的蓝,桥上,
家园 每次觉得我国要亡的时候

看一下太平洋彼岸的他国,信心又回来点了。

家园 有毛泽东思想和稻学,怎么会亡

不要胡思乱想啦

家园 海峰兄,这算不算后发优势?

@达雅 河友,我就说,你明明什么都知道。

家园 你是方平吧
匿名 周五出事那天,单位同事开玩笑

这下子,很多人有活干了哈。那么多机器,得一台一台手动重启,估计不是几天能搞完的。弄不好,还得找一大堆的Contractor公司帮着干。

匿名 你也是被方平弄魔怔了

记得方平几年前说过,在美国绝不碰安全领域。

人家这才是聪明人。

家园 稻学领先一百年

毕竟稻说了百年不变😂😂至于教员思想早就被稻抛弃了

全看树展主题 · 分页首页 上页
/ 4
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河