New Relic Logsの新機能による障害復旧時間(MTTR)の削減

この記事はReduce MTTR With Recent Innovations in New Relic Logsの翻訳記事です。

ウェブサーバからデータベース、インフラストラクチャホストまで、アプリケーションスタックのすべての部分がログデータを生成します。注意を怠ると、システム管理者、DevOps エンジニア、開発者は果てしないログの濁流に直面することになります。


ソフトウェアスタックがより複雑になるにつれ、管理者や開発者はすべてのデータをふるいにかけなければなりません。
デバッグやトラブルシューティングを行う際に、1行のログだけでも平均解決時間 (MTTR) を短縮するのに役立ちます。

New Relicは、オンプレミスでもクラウドでも、テキストベースのデータをサポートする最新のクラウドロギングソリューションを提供する事で、このような作業のストレスや苦労をなくすことを目標としています。

この目標を達成するために、また可観測性プラットフォームをさらに強化するために、New Relic Logsを拡張する3つの新機能をリリースしました。

  1. Live tail for New Relic Logs:ログデータをリアルタイムでストリーミングします。
  2. Log Forwarding from the New Relic Infrastructure agent:独自のログフォワーダーを管理する負担を軽減します。
  3. Infrastructure in Context:インフラストラクチャ・ダッシュボードから関連するログに直接アクセスして、簡単に根本原因を分析できます。

 

Live tail for New Relic Logs

日常業務では、ほぼ確実にログデータを使用して本番環境のデバッグやトラブルシューティングを行っているとおもいます。そして多くの場合、ログデータは何かが正しくないことを示す唯一のシグナルを提供します。しかし残念ながら、このデータは後追いのシグナルでもあり、インシデント発生から検出までの時間を短縮することは困難です。

New Relic Logsのライブテール(Live tail)を使用すると、ログメッセージをリアルタイムで確認することができます。
新しいホストやサーバーをデプロイしたり、その他のアプリケーションに変更を加えたりした場合、ログの結果をリアルタイムで見ることができるので、変更に対するシステムの反応をすぐに確認することができます。

ライブテールを利用するのは、ボタンを押すだけの簡単な操作です。New Relic Logsで「Play」をクリックして、ログのストリームを確認します。また、リアルタイムでNRQLクエリを実行して、表示される結果をフィルタリングすることもできます。

クリックするとアニメーションが再生されます。

Log Forwarding from the New Relic Infrastructure agent

以前Bata版としてご紹介したNew Relic Infrastructure Agent からのログ送信がGAとなりました。

複雑なインフラストラクチャの問題をトラブルシューティングする際には、メトリクス、イベント、ログの組み合わせに頼って根本原因を突き止めることがよくあります。
このような作業を迅速化するために、Infrastructure AgentからFluentBit経由でログを転送できるようになりました。

エージェントでログ転送を有効にすると、ファイル、systemd-journald、Syslog、およびホスト上で実行されている TCP サーバからログを送信できるようになります。
この機能により、ホストのパフォーマンスとそのログメッセージの間でより迅速な関連性を把握することができるようになります。また独自のログフォワーダを管理するためのオーバーヘッドと工数を軽減し、平均検出時間 (MTTD) と (平均復旧時間)MTTR を高速化します。

Infrastructure エージェントからのログ転送の構成、互換性と要件の詳細については、New Relic のドキュメントを参照してください。
また設定手順については以前ご紹介したBlog記事も参考にしていただけます。

Infrastructure in Context

Log in contextは、New Relic InfrastructureとNew Relic APMのメトリクス、ダッシュボード、データの可視化、イベントの相関関係、その他のリソースを活用して、環境の全体像を統合した形で提供します。

以下の機能が含まれています。

  1. コンテキストデータをロギング体験に移行する
    Logs in contextは、他のNew Relic Oneコンポーネントから流れるデータと自動的に関連づけます。
    他のコンポーネントとは、KubernetesクラスターエクスプローラーやLambda(サーバーレス)テレメトリに加えて、New Relic InfrastructureやNew Relic APMからのデータも含まれます。
  2. データを相関させて、意味のあるパターンや傾向を明らかにする
    Logs in contextは、アプリケーション、インフラストラクチャ、Kubernetes、Lambdaのエラーやイベントのデータとログメッセージを関連づけます。これによりチームがサイロ化されたログデータソースを使用して作業する場合には得られない深さと詳細さを提供し、チームにエンドツーエンドの可視性を提供します。
  3. ロギングデータにコンテキスト属性を持ち込む
    Logs in contextは、アプリケーション、サーバーレス、および Kubernetes クラスタから価値が高いコンテキスト属性をログデータに追加します。ポッド ID、サービス名、アプリケーション名などの識別子をログに追加する機能により、データを分析したり、有用な関連づけを行ったり、問題がアプリケーションの健全性やパフォーマンスに影響を与える可能性のあるその他の領域を特定したりすることがより簡単になります。

Infrastructureモニタリングから「See Logs」をクリックする事で、挙動が異なるホストなど調査対象のログを素早く確認することが出来るようになりました。

クリックするとアニメーションが再生されます。

New Relic Logsを利用していただくことで、大量のログを集約した藁の山から針を探すようなログ分析、ログ運用ではなく目的のサーバーやアプリケーションを絞り込んだ、ピンポイントでのログ分析を行って頂く事ができるようになります。


デモリクエスト

 

 

New Relic株式会社 シニアテクニカルサポートエンジニア OSSの運用監視ソフトウェアの日本におけるテクニカルサポート、テクニカルトレーニングの立ち上げを行い、VMwareベースのクラウドサービス開発、AWSテクニカルサポート、クラウドアーキテクトを経て現職。 テクニカルサポート、テクニカルトレーニング、運用コンサルを専門領域としてお客様の運用負荷軽減を目指す。得意分野は運用設計、クラウド設計、OSSソフトウェア。 View posts by .