AWS中断:亚马逊主要美国大区地区之一的停机事件枯萎

2022-06-28 10:46:03来源:

亚马逊网络服务(AWS)用户正在等待公共云巨头的完整解释,即在其主要的美国主要数据周边地区的长期中断原因,这些地区于11月25日星期三,我们的时间。

已知停机事件的来源是在公司的USE-EAST-1 DataceRe地区内发起,并且由其实时数据流服务的应用程序编程接口(API)的缺陷引起,Kinesis数据流(KDS )。

已知该问题困扰着在事件中依赖KDS的高调互联网服务数量的可用性,其中许多人使用社交网站推特确认自己受到停机问题的影响。一个人说:

“Amazon AWS中断目前正在影响Adobe Spark,因此您可能会在访问/编辑项目时遇到问题。我们正在积极与AWS合作,并将在问题所消除时报告。 https://t.co/uohpf44hjl用于当前的火花状态。很抱歉给您带来不便! - Adob​​e Spark(@adobespark)11月25日,“

中断还介绍了更广泛的AWS组合中存在的相互依赖性,因为已知KDS API遇到的问题对其依赖它工作的许多其他AWS服务的性能产生负面影响。

该公司的云服务状态页面参考其他“受抚养服务”受中断影响的“依赖服务”,AWS首先在11月26日星期四上午2点左右提供了约2AM GMT时间。

例如,AWS支持的受访者支持Twitter Feed报告了其代码构建和测试提供,代码管道,其基础架构监控服务,Amazon CloudWatch和 - 中断期间的一个点 - 服务状态页面也不可用。

在撰写本文时,AWS服务状态仪表板确认该公司已解决此问题,并且服务已恢复到AWS组合的所有受影响的部分,但目前没有进一步详细信息,这些情况是关于这种情况导致停电首先发生。

“我们已经确定了Kinesis数据流事件的根本原因,并完成了即时操作以防止复发。Kinesis和CloudWatch正常运营,“AWS服务状态页面的声明说,今天上午9点后发布。

Liz Beavers,Head Geek在IT监控软件提供商Solarwinds表示,停电的规模表明AWS的中断管理策略留下了很多要求。

“如果没有强大的事件和问题管理策略,我们会看到广泛的中断像今天那样的高影响力,”她说。“对于通过AWS平台互联的许多不同的单位和客户,亚马逊合作伙伴具有IT服务台策略,用于简化和解决重复事件,这通常会像这样的大型IT中断。

“拥有战略服务台对中断的一部分响应的部分也将其与单数通信渠道为单位,以宣传整个组织的已知问题。这不仅有助于上下文的问题,它使它使其能够更有效地解决问题,并且在某些情况下发布潜在解决方法的文档。“

Mike Kiersey,戴尔技术拥有的集成平台的主要技术专家博马米(PAAS)提供商Boomi表示,这一事件亮点只是数字经济的大部分依赖性依赖于实时流数据。

“影响Kinesis的问题强调绝对需要流程和管理实时数据,”他说。“如果数据流停止运行,则辐射可能是巨大的,特别是对于云提供商来说。

“管理实时数据归结为有效的集成和监控,这允许无缝过渡到更现代化的数据结构网络。通过响应综合平台,数据点变得更加访问,敏捷,透明,以了解应用程序的通信。“

凯斯蒂补充说:“组织需要考虑如何架构和将流媒体平台集成到其企业架构的核心面料中,通过主数据管理,具有跨部门和地理边界的潜力。”


返回科技金融网首页 >>

版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“科技金融网”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场,如有侵权,请联系我们删除。


相关文章