Waroomオープン β 提供の背景
2016年に Google から Site Reliability Engineering(以下、SRE) が提唱され、多くの IT 企業が SRE を用いてシステム管理やサービス運用の改善と効率化を実践するようになりました。しかし、インシデント対応の分野においては未だ改善の余地のあるワークフローから脱却できずにいる企業が数多くいます。
インシデントが発生すると事業の機会損失を産むだけではなく、ブランドイメージの低下や、開発の進行の遅延など様々な問題に繋がります。事業の機会損失があるにもかかわらず今日まで改善が進んでいません。
理由は、インシデント対応がそもそも難解な作業であり、且つ素早く的確な意思決定を迫られる作業だからです。インシデント対応が行えるエンジニアは希少で、多くの企業で熟練のエンジニアによってインシデント対応が行われています。業種によっては深夜問わず対応を迫られることもあり、精神的にも体力的にも疲弊した状態でメイン業務にも追われる日々を過ごしています。そういったエンジニアのリソースは常に逼迫しており、インシデントに対する備えや対応フローの改善にまで手が回わっていません。
私達は多くのインシデント対応の経験とSREの知見を軸に、このインシデント対応の「つらい」をソフトウェアの力で払拭し、 本来やりたかったことに向きあえる世界を作るためWaroomの開発をはじめました。今回の Waroom オープンβ はその第一歩目となります。
Waroom オープン β で提供する機能
Waroom は、インシデント対応の準備から対応中、対応後すべてのフェーズで、SRE のベストプラクティスに基づいたワークフローを提供します。オープン β では、以下の5つの機能を無料で提供します。
1. Slack コマンドからインシデントを作成・共有
Slack コマンドから簡単にインシデントの宣言ができ、メンバーやチャンネルに共有します。
2. インシデントに紐付けたRunbook(対応手順書)をステップごとに表示
予めインシデントに Runbook を紐付けておくことで、インシデントが作成されると自動的に対応した Runbook を Slack へ表示します。
3. 重篤度の自動更新、アクションの自動実行
重篤度の設定に迷った時は、Waroom が重篤度を判断します。時間経過やあらゆる情報から重篤度を自動更新します。さらに重篤度毎に設定されているアクションを自動実行します。
4. ポストモーテムの作成・保存機能
インシデントが収束した場合は、そのインシデントのポストモーテムの作成、保存が可能です。
5. インシデントレスポンスの計測・可視化・分析 [近日公開予定]
MTTR などの時間の計測だけでなく、Runbook カバレッジや、重篤度毎のインシデントの集計などインシデントレスポンスに関わるあらゆるデータを計測し可視化します。
詳しい内容は、弊社までお問い合わせください。
■ 株式会社Topotalについて
Topotal は 「ソフトウェアで余裕を生み出す」をミッションに掲げ、SREを基軸に事業のボトルネックを解決するサービス・プロダクトを提供するテクノロジーカンパニーです。