記事公開日:2022/11/1
平素はSmartDBをご利用いただきありがとうございます。
去る2022/8/19 に発生した 約1時間に渡りメール送信不可となった障害の対応について、ご報告します。
障害概要
対応
大量のメール送信によって、1日あたりの上限を大幅に超えてしまったため、事象が発生しました。
上限を引き上げることで暫定対応としていますが、メールおよびその他通知の送信数を減らす仕組みをアプリケーションで対応することを計画しています。
上限の引き上げ
1日あたりの送信数上限を4倍に引き上げました。(2022/8/19 実施済み)
1日あたりの送信数は監視しており、十分であることを確認しています。
秒間送信数の削減
大量送信がされた場合に、秒間の上限に抵触する可能性があることから、
メールキューからの送信処理を遅延させ、秒間送信数を削減しました。(2022/9/30 リリース済み)
メール送信数の削減
宛先として所属ユーザが多いグループが多数指定される場合、アドレス毎にメールが分割される仕様です。これを見直し、特定条件を満たした場合は、自動で複数の宛先をまとめて送信することで送信数を削減します。この際、他の送信先は公開されません。詳しい仕様は仕様変更として別途アナウンスします。(2022/11/11 予定)
送信履歴とリトライ
Webhookと同様、メールやその他通知についても、送信履歴の確認、およびリトライを可能にします。
万が一障害が発生した場合に追跡を可能にします。(2023/1 予定)
同一バインダの大量通知の検知
同一バインダや同一プロセスにおいて、大量のメールキューがエンキューされた場合に検知可能にします。これらは処理の優先度を落とし、処理を遅延させ、取り消しを可能にします。(2023/1 予定)
上記の他、内部的な処理の見直しも予定しています。
以上