New Relic Infrastructureで何ができるのか ~分析編~

New Relic Infrastructureとは

New Relic Infrastructure はパブリッククラウド, コンテナ, OS,ミドルウェア, Network, OSS等の情報を収集することができるNew Relic のサービスです。

 

インフラ監視の基礎

インフラ監視ツールでは以下の4要素が共通する要素として存在します。

リソース監視、プロセス監視、機器監視、アプリケーション監視、ログ監視など世の中でシステム監視と呼ばれるものには複数の意味がありますが
システム監視を行う目的はシステムの安定稼働およびシステム稼働効率の最適化を行うことです。

今回はNew Relic Infrastructureでの「分析」について解説します。

 

ITシステム監視での分析の意味

分析では、収集されたデータや判定の頻度を元にシステムの現状および将来状態を推測、検討します。
リソースの時系列的な変化や異なる収集データ同士の相関関係などを読み取る事が重要です。
適切な分析を行う事でシステムのボトルネックポイントの判断や、ボトルネック対策を行った場合のボトルネック移動の予測インフラコストの最適化などが可能となります。

 

New Relic Infrastructureを利用したシステム分析

一つのグラフでの分析

New Relic Infrastructure では複数のホストからデータを収集した場合、自動的に1つのグラフに複数ホストのデータをプロットします。

そして、自動的に平均値の値も表示されます。

これにより、アプリケーションクラスタを構成しているホストの負荷アンバランス分析などを追加設定を行うこと無く簡単に見つける事ができます。
平均や特定のホストを消したい場合は要素名をクリックするだけで非表示にすることができます。

凡例からも消したい場合にはフィルター設定をおこないます。
フィルター設定では、ホスト名の他ホスト上で動作しているアプリケーション名(APMとの連携)やOS、
メモリ量やCPU数などのハードウェア構成でも設定が行えるので、
マルチノード構成システムで同一スペックのホストの情報だけを表示するような設定も行えます。

New Relic InfrastructureではCPUやMemoryといったハードウェアメトリクスだけではなく、プロセス毎のリソース利用状況も確認できます。
CPUやMemoryの利用量変化が見つかったら、そのままプロセスの利用状況を確認することでプロセスの暴走やメモリリークを把握することができます。

複数のグラフでの分析

New Relic InfrastructureではSystem(CPU+Memory)、Network、Storage、Processという切り口で
トラフィックとパケット数やIO回数とディスク利用時間など関連するグラフを表示するので、メトリクス通しの関連性を理解しやすくなっています。

イベントとメトリクス

New Relic Infrastructureでは、ミドルウェアのConfig変更やバージョンアップなどをイベント情報として収集してます。

このイベント情報は時系列データとして、画面上部のイベントブロックに表現されます。

このイベントが記録された時間スライスにマウスオーバーすると、それと対になる時刻位置がリソースグラフ上で表示されます。
この機能を利用することで、ミドルウェアやOSの設定変更やバージョンアップがリソース使用量に対してどのように影響をしたのか、あるいは影響しなかったのかを確認することができます。
例えばメモリリークの不具合が報告されているミドルウェアをアップデートしたタイミングで実際にメモリリークが解決されたのかどうかを的確に確認することができます。

同一時刻の確認

New Relic Infrastructureでは、グラフ上の特定のスパイクについて調べたたい場合にそのグラフ範囲をドラッグすることで、
表示する時間範囲をしていできます。

このときに選択した時間範囲設定は、画面遷移しても維持されます。
これによって、CPU情報やProcess情報で疑わしい挙動を確認し、Third Party Servicesでその時のミドルウェアのリソース情報を確認するということもできます。

New Relic Infrastructureを使うことでハードウェアリソースからOS、ミドルウェアまでの設定やリソースなど
関連性を見ながら分析を行う事ができるので、インフラに関わる問題を迅速に把握することが可能になります。

ダッシュボードによる一覧とレポート

New Relic Infrastructureでシステム状況分析を行う場合、いくつかのタブやフィルターを利用して表示を切り替える必要があります。

この調査結果を報告する場合や障害対応作業での進捗確認、改善状況確認を行う場合には調査によって関連性が見つかった複数のグラフを同時に表示する必要があります。

その場合にはNew Relic Oneのダッシュボード機能を利用します。

フィルターを適用したり、表示期間を変更した複数のグラフを1つの画面に表示することができます。

New Relic Oneを開くために「New Relic|🏠」のアイコンをクリックします。

New Relic Oneの画面が表示されるので、Dashboardをクリックします。

+CreateDashBoardボタンをクリックして新しいダッシュボードを作成します。
ダッシュボード名には日本語を利用することもできます。
複数のNew Relicアカウントを利用している場合はダッシュボードを作成するアカウントを選択します。

ダッシュボードが作成出来たら、New Relic Infrastructure でダッシュボードに追加したいグラフを選びます。

グラフの右上の「・・・」をクリックします。

リソースグラフの場合は[View query]-[View in insights]からグラフ設定を行い[Add to Dashboard]で先ほど作成したダッシュボードを選択して[Copy]を行います。

MySQLやApacheのようなThird party Servicesのグラフの場合は[Add to insights dashboard]からそのままダッシュボードが選択できるので、ダッシュボードを選択して[Copy]をクリックします。

こうすることで、複数の画面で確認する必要があったグラフを1画面に集約して表示することができます。

また、ダッシュボードにはテキストパネルを追加することができます。
画面右上の「+」ボタンをクリックし[Add text,images,or links]をクリックする事でMarkdown形式のホワイトボードパネルが追加されます

このパネルはMarkdown書式で内容を記述できるので、レポートコメントや障害対応中の申し送り事項などを記載することができます。

レポート先がNew Relicにログイン出来る場合はそのままダッシュボードを表示することもできます。
また、システムレポートなどとして出力が必要な場合にはコメントを含めてダッシュボードのPDF出力ができますので、
そのままシステム分析レポートとすることも可能です。

New Relic Infrastructureでの分析

New Relic InfrastructureはMELTそして、APMとしての経験に基づきイベントとメトリクス
アプリケーション基盤としてのインフラを分析する事にフォーカスしています。

そして、エンジニアが分析を行った結果をレポートする際には、Excelなどにグラフを貼り付けるのではなく
New Relic Oneでプレゼンテーション化し、コメントを添えてレポートとすることができます。

New Relic InfrastructureとNew Relic Oneでインフラ分析の高度化をご検討ください。


無料トライアル

New Relic株式会社 シニアテクニカルサポートエンジニア OSSの運用監視ソフトウェアの日本におけるテクニカルサポート、テクニカルトレーニングの立ち上げを行い、VMwareベースのクラウドサービス開発、AWSテクニカルサポート、クラウドアーキテクトを経て現職。 テクニカルサポート、テクニカルトレーニング、運用コンサルを専門領域としてお客様の運用負荷軽減を目指す。得意分野は運用設計、クラウド設計、OSSソフトウェア。 View posts by .