7月19日,微软在全球多地出现“蓝屏故障”,大量用户无法正常操作系统,其中不少出现了“csagent.sys”错误。

有网络工程师表示,本次蓝屏现象的“罪魁祸首”是杀毒平台 CrowdStrike。随后这一说法得到了微软官方客服的确认。微软支持中心客服人员表示,对于电脑出现批量蓝屏的情况,目前了解到大部分蓝屏都是公司电脑安装了三方杀毒软件之后出现的。客服人员还称,这种情况如果修改驱动文件名称无效,只能联系公司IT进一步处理。

对此,CrowdStrike在其支持平台发布消息称,公司收到大量关于Windows电脑出现蓝屏的报告,公司工程部已确定该问题与“内容部署(content deployment)”有关,目前已恢复了这些更改。建议受影响的用户将电脑启动到安全模式或恢复环境,导航至C:\Windows\System32\drivers\CrowdStrike目录,找到与“C-00000291*.sys”匹配的文件并将其删除,即可正常启动电脑。

微软的“大故障”并非只从今日的蓝屏开始。

从昨夜以来,已经有部分用户无法访问微软的365订阅功能,甚至还有位于一些美国中部地区的用户,无法正常使用微软的Azure云服务功能。

根据用户爆料,微软昨晚对他们的电脑界面发出警告,称Microsoft 365订阅用户将无法访问SharePoint Online、OneDrive for Business、Teams、Intune、PowerBI、Microsoft Fabric、Microsoft Defender和Viva Engage。Azure的状态页面也显示,自7月18日协调世界时(UTC)大约 21 点 56 分以来,“部分客户可能会遇到Central US服务区的多个Azure服务出现的问题,包括服务管理操作和服务的连接性或可用性遭遇故障。”

对于无法使用Microsoft 365的用户,微软的工程师在第一时间连夜修复了问题。截至7月19日UTC时间01:30,Microsoft 365的状态页面已更改为“经过我们的流量重定向工作,服务可用性正在逐渐恢复到健康状态”。微软方面表示,对于本次故障,已经“确定了可能导致影响的潜在根本原因。团队目前正在验证这些发现和我们的缓解策略,以确保尽快解决问题。”

对于无法使用Azure云服务的用户,微软的修复策略是将流量路由到其他未受影响的区域尝试恢复。对于事故发生的原因,微软方面称,一个后端集群管理工作流程部署了一处配置更改,因而导致一部分 Azure 存储集群和美国中部服务区的计算资源之间的后端访问被阻止——这导致了与虚拟磁盘失去连接时自动重新启动计算资源。截至目前,针对所有 Azure存储集群采取的缓解措施已得到确认,大多数服务已恢复正常。

本次“大故障”影响的范围甚广。根据网站故障追踪软件 Downdetector 7 月1日数据,日本用户报告 Microsoft 365 出现了问题。截至当地时间下午1:35左右,共有2,800多份故障报告,其中69%的报告与Onedrive有关。另外,西日本旅客铁道公司(JR西日本)列车行驶位置信息因Windows系统故障导致无法获取,澳大利亚航空公司、银行、政府网络、企业、超市自动收银机等也受到影响。

从7月18日到19日,微软在24小时内出现了三次重大故障。截至目前,仍有部分用户的Microsoft 365应用处于降级状态。

追加内容

本文作者可以追加内容哦 !