System Activity Grapher - ギャラリー その2

SAGを使用してシステムの動作状態を取得した例を示します。

これは、とあるメールサーバでメールのループが引き金となり、大量のトラフィックが 発生したことでシステムに過大な負荷がかかってしまった様子をとらえたものです。


0001net.gif
ネットワークトラフィック
大量にメールが送信されたため、通常発生し得るピークより一桁多いトラフィックが発生しました。

0001la.gif
ロードアベレージ
大量のメール送信プロセスが動作したため、ロードアベレージが10を越えています。

0001ps.gif
プロセス起動回数
ピーク時には一分間あたりのプロセス起動回数が毎分2000回程度まで上昇しています。これはsendmailのプロセスが大量に生成されたためと推測されます。

0005mem.gif
メモリ
プロセスの大量生成により、実メモリ、スワップ共リソースをほとんど使い尽くしました。これは、いわゆる「スラッシング」とよばれる状態です。使用率がほぼ飽和しているため、過負荷でのサーバの動作はメモリの状況により律速されていたものと思われます。
ちなみに、このような状況では、リモートからのログインなどに非常に時間がかかり(最悪の場合は、タイムアウトにより接続できなくなります)、ログインできてもコマンドの実行やシェルのプロンプト表示までに非常に時間がかかるので、事態を収拾させるのはかなり困難です。

0100df.gif
ディスク使用率
メール送信キューに数千通のメールが滞留したため、使用率が急上昇しました(ディスクがパンクする程ではありませんが)。

recent(50)
2024-03-01 2024-02-17 2024-01-31 2023-12-24 2023-12-20 2023-11-05 2023-10-04 2023-08-28 2023-06-21 2023-06-19 2023-06-03 2023-05-30 2023-05-20 2023-05-01 2023-04-30 2023-04-23 2023-04-13 2023-04-12 2023-03-17 2023-02-24 2023-02-23 2023-02-22 2022-12-23 2022-12-13 2022-11-17 2022-11-15 2022-11-14 2022-11-13 2022-11-05 2022-09-28 2022-08-08 2022-04-11

Attach file: file0100df.gif 1465 download [Information] file0005mem.gif 1671 download [Information] file0001ps.gif 1624 download [Information] file0001la.gif 1670 download [Information] file0001net.gif 1649 download [Information] file0005time.gif 928 download [Information]

Front page   Edit Freeze Diff History Attach Copy Rename Reload   New Page list Search Recent changes   Help   RSS of recent changes
Last-modified: 2023-06-03 (Sat) 17:35:33