2021年12月10日 bookendサービス障害報告
2021年12月10日(金)にbookendサービスで発生いたしました障害により、お客様ならびにご関係の皆様には多大なご迷惑をお掛け致しました事、深くお詫び申し上げます。原因ならびに再発防止策を下記のとおり報告させていただきます。
1.障害発生日時
2021年12月10日(金)15:35頃 ~ 同日16:05 (約30分)
2.障害の内容
アイドックの管理するサーバ内で作動しているbookendサービスにおいて、外部からのリクエストに対して応答に非常に時間がかかっており、一部タイムアウトしてしまう状態でした。
3.影響範囲
障害によるサービスの影響範囲は以下の通りです。
<bookendご契約社様の影響範囲>
・bookendへのAPIリクエストの応答に非常に時間がかかる状態でした
・データの破壊等はありませんでしたが、かなりのAPIリクエストに対しレスポンスできない(タイムアウトエラーとなる)状態でした
<bookendご利用ユーザーの影響範囲>
●bookend-view(ブラウザ閲覧)
・問題なく閲覧できておりました
●bookendアプリ
・アプリケーション起動時にエラーが発生する場合がありました
・閲覧については、新規にダウンロードする場合も、ダウンロード済みのコンテンツを閲覧する場合もアプリケーション側でエラーが発生してしまい、閲覧できない場合がありました
4.障害発生からの経緯
2021年12月10日(金)
15:35 – アプリケーションサーバよりアラートメールを受信
15:40 – 社内のスタッフが確認作業に入り、アプリケーションサーバの再起動を行う
15:45 – 一時的にサーバの台数を増やし対応するが効果は認められずDBに問題があると判明
16:00 – DB側で対策を実施
16:09 – お客様へご連絡のメールを送信
16:15 – 正常に動作していることを確認
16:30 – アラートがすべて解消したことを確認し、お客様へご連絡のメールを送信
5.障害原因
当時、本番サーバにて閲覧ログの集計作業を行っており、その中でDBサーバに大きな負荷がかかってしまいました。
6.今回行った復旧対策
サーバ負荷の原因となっていたコマンドを無効とし、負荷を解消することで対応を行いました。
7.再発防止策
本件で行っていた作業は先にステージング環境でも同様の操作を行い、確認した上での作業でしたが、本番サーバとのデータ量に差があり、負荷確認になっておりませんでした。今後、負荷がかかることが予想される操作については本番と同程度のデータ量で事前に確認を行うように徹底いたします。