BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース ほとんどの企業が毎週障害を経験:The State of Resilience 2025 Report

ほとんどの企業が毎週障害を経験:The State of Resilience 2025 Report

原文リンク(2025-02-16)

Cockroach Labsが発表したThe State of Resilience 2025 Reportによると、ほとんどの組織で障害は日常的に発生しており、55%の企業で毎週、14%の企業で毎日障害が発生していると報告している。驚くべきことに調査参加者の100%が障害による収益損失を経験しており、過去12ヶ月間で100万米ドル以上の損失を報告した企業(8%)もあった。

1000人の上級幹部を対象にITシステムのレジリエンスと組織が直面する課題について調査した後、Cockroach Labsは2024年10月に「 The State of Resilience 2025:障害、ダウンタイム、組織の準備に対峙する」(ダウンロードにはフォームの記入が必要)というタイトルのレポートを発表した。

このレポートではほぼすべての技術リーダーが障害とその影響を懸念しているが、多くの場合、彼らの組織は運用上の弱点に対処するために十分な対策を講じていないことを強調している。調査回答者はクラウドプラットフォームや第三者サービスの信頼性の問題、サイバー攻撃とともに、ネットワークとソフトウェアの障害がダウンタイムの主な原因であると報告している。

ダウンタイムの一般的な原因(出典:The State of Resiliency 2025 Report)

レポートの著者は、参加者が共有した課題をまとめている:

最近のCrowdStrikeのグローバル停止後の影響により、多くの組織が行動を起こすきっかけとなりました — この調査では94%の技術系幹部が、この出来事が自社の運用レジリエンスを再評価する触媒となったと述べています。同時に調査対象となったグローバル企業のリーダーたちは[...] 変化に対する根強い抵抗、内部の優先順位の不一致、時代遅れのシステム、予算の行き詰まりが意味のある -ときには切実に必要とされる- 運用レジリエンス対策の実施を妨げていると報告しています。

障害につながるような運用上の弱点があるにもかかわらず、組織はレジリエンスを向上させる上で多くの障害があると報告しており、主要なエリアとして優先順位付けと予算の制約が挙げられ、次いでシステムの複雑さ、不十分なトレーニング、人員レベルが続いている。

レジリエンス向上のための主な課題(出典:The State of Resiliency 2025 Report)

別の2024年DORA Accelerate State of DevOpsレポートでは、ソフトウェアデプロイメントに起因する問題を取り上げ、ソフトウェアデリバリの安定性に関する主要なデリバリパフォーマンス指標を分析している。今年のレポートでは変更失敗率(CFR)が他のDORAメトリクスよりも際立っている理由を理解するために、チームは新しい指標を導入した。リワーク率と名付けられたこの新指標は、ユーザーに影響するアプリケーションの問題に対処するための計画外のデプロイメント数を追跡し、変更失敗率と共にソフトウェアデリバリの安定性因子を形成した。

デリバリーパフォーマンスレベル(出典:DORA State of DevOps Report 2024)

例年通りState of DevOps レポートはソフトウェアデリバリのスループットとプラットフォームの安定性との関係について議論し、リリースの頻度と変更失敗率の低下との間には強い相関関係があるものの、組織的および技術的な課題のため、より頻繁にリリースすることで企業がより高い安定性を達成できる保証はないと結論付けた。レポートはソフトウェアデリバリパフォーマンスの改善を認識する必要性を強調しており、必ずしも絶対的なパフォーマンスレベルだけに注目するべきではないと述べている。

作者について

関連するコンテンツ

BT