导读

2024年7月19日,全球多地的Windows用户出现了大量电脑崩溃、蓝屏死机、无法重新启动的事件。故障发生后,全球多个国家和地区的航班、医疗、银行、交通等重要行业均受到不同程度的影响。

事件经过

2024年7月19日凌晨4点09分,CrowdStrike公司向其Windows用户发布了一项终端安全传感器的配置更新。不幸的是,这次更新中包含了一个错误配置,导致更新被安装后,受影响的Windows设备开始出现系统崩溃并显示蓝屏错误。此外,许多云服务客户的Windows虚拟机也安装了CrowdStrike安全产品,这些虚拟机在接收到错误的配置更新后同样遭受了蓝屏故障,影响相比PC蓝屏更加严重。

解决方案

方案1:建议受影响的用户将电脑启动到安全模式或恢复环境,导航至C:WindowsSystem32driversCrowdStrike目录,找到与“C-00000291*.sys”匹配的文件并将其删除,即可正常启动电脑。

方案2:在安全模式下访问C:WindowsSystem32driversCrowdStrike路径,找到csagent.sys文件,通过在其文件名后增加数字和字母的方式进行重命名,以暂时禁用该驱动程序。此方法目的是绕过有问题的驱动程序,从而避免蓝屏问题。

方案3:通过官方补丁进行更新与修复。

我们要如何避免此类突发事件?

本次微软服务的大规模中断事件再次强调了:在复杂系统环境中,Agent稳定运行的重要性。Agent要稳定运行,不仅需要其内部结构设计得当,更要求其具备强大的驱动程序,同时测试过程也要非常严格和全面,确保能够发现所有的潜在风险,建立一个更加坚实和可靠的终端Agent软件系统。

天融信终端安全负责人表示:安全产品需要自主可控和更完善的本地化服务。这一事件强调了对终端安全产品持续审查和测试的必要性,并突显了国产安全产品的优势,尤其是在本地化服务方面。国产安全产品能够提供更快速、更贴近市场的客户支持,快速响应并解决客户面临的问题,这在全球化的技术依赖中提供了一个可靠的本土化替代选择。

天融信安全建议

构建数据备份机制:加强数据备份机制,并进行定期的恢复测试以验证备份的有效性,应对数据丢失、系统故障或其他安全威胁。

加强企业应急预案:建立全面的应急预案体系,确保在危机发生时能够迅速、有序地采取措施,最小化事件对企业运营和声誉的影响。

多元化供应商协作:通过与多个供应商建立合作关系,降低对单一供应商的依赖,从而提高供应链的弹性和稳定性,避免因供应商的不可预见问题导致生产中断或成本增加。

应用更新后置:延迟高风险应用更新时间,从而降低更新可能带来的风险,确保系统的稳定性和可靠性。

灰度升级:在进行产品大规模升级前,将新的软件版本部署给一小部分用户或系统,然后逐步扩大到更广泛的用户群体,减少新版本可能带来的风险,确保软件更新的平稳过渡和系统的稳定性。

加速国产化替代:减少对外部供应商的依赖,增强自主可控能力,同时快速响应本地市场的需求和法规变化,构建更为稳固的网络安全防线。

终端安全,一直是企业整体网络安全防护体系中的重要环节。多年来,天融信始终坚持技术攻关与创新,以轻量化理念进行终端安全产品设计,实现高效稳定的安全防护,通过轻驱或无驱模式简化部署,减少资源消耗,并避免与现有驱动的冲突,同时保持监控的灵活性和可靠性。

在开发过程中,团队遵循DevSecOps的高标准严要求,将安全融入每个开发阶段,构建起纵深的安全研运管理体系,提升产品的安全性和响应能力。此外,通过全面的自动化测试和细致的安全测试,如SAST(静态应用程序安全测试)、DAST(动态应用程序安全测试)和渗透测试,确保产品在发布前达到高质量标准,力求为客户提供稳定、高效、可靠的终端安全防御能力。

追加内容

本文作者可以追加内容哦 !