現代のエンタープライズ環境において、「グリーンフィールド(更地)」のような理想的な新規構築はほぼ存在しません。

多くの組織は、長年蓄積されたレガシーシステムと最新のハイブリッドクラウド、さらには急速に拡大するAIインフラが混在する「ブラウンフィールド」の複雑性に直面しています。

サイロ化したチームや分断された監視ツールは、障害の予兆を捉えることを困難にし、人手不足に悩む運用チームやSRE(サイトリライアビリティエンジニアリング)に過度な負荷を強いています。

こうした課題に対し、Hewlett Packard Enterprise(HPE)は、AIエージェントを活用して「オーケストレーション」「オブザーバビリティ」「レメディエーション(修復)」を統合するクローズドループ運用という新たな指針を提示しています。

ハイブリッドクラウドの複雑化と「AIスプロール」の脅威

エンタープライズのインフラは今、かつてないほど不安定かつ不確実な状況にあります。

クラウドネイティブな構成が進む一方で、オンプレミスの資産も依然として重要な役割を果たしており、これらが複雑に絡み合うことで可観測性(オブザーバビリティ)の欠如が深刻化しています。

さらに、昨今の「AIスプロール(AIの無秩序な拡散)」が追い打ちをかけています。

AIモデルを動かすためのコンピューティング資源の爆発的な需要は、運用チームにとって管理対象の増加を意味します。

しかし、リソースや人員は限られており、従来の「壊れたら直す」というリアクティブ(後手に回る)な対応では、ビジネスの継続性を維持することが不可能になっています。

HPEのシニア・ディスティングイッシュド・テクノロジストであるPhanidhar Koganti氏は、Day 1(構築)とDay 2(運用)を個別のフェーズとして分けるのではなく、継続的なフィードバックサイクルの中に統合する必要があると指摘しています。

エージェンティックAIによる「クローズドループ運用」の実現

HPEが提唱する「エージェンティックAI(Agentic AI)」は、単なるチャットボットや補助ツールに留まりません。

これは、インフラの現状を理解し、高度な意図(インテント)に基づいて自律的に行動するエージェント群を指します。

自律的な意思決定を支えるインテントベースの自動化

従来、インフラの展開や設定変更には詳細なスクリプトや手順書が必要でした。

しかし、HPE OpsRamp Softwareが提供する「エージェンティック・オペレーション・コパイロット」では、運用者が「何を達成したいか」というハイレベルな意図を入力するだけで、AIがデータセンター、ネットワーク、ストレージにわたる詳細なデプロイ計画を自動生成します。

クローズドループを構成する3つの要素

  1. オーケストレーション:ハイブリッド環境全体にわたるリソースの最適配置とプロビジョニング。
  2. オブザーバビリティ:メトリクス、ログ、トレースを相関分析し、ノイズの中から真の異常信号を抽出。
  3. レメディエーション:予測分析に基づき、障害が発生する前に自己修復プロセスを実行。

このように、プロビジョニングしたものがどのように動作しているかを常に監視し、そのデータを次の運用計画に反映させるサイクルこそが、クローズドループの本質です。

運用メトリクスの再定義:MTTRから「潔白証明時間」へ

AIを運用に導入することで、評価すべき指標(メトリクス)も変化しています。

従来重視されてきた平均修復時間(MTTR)だけでは、複雑化したスタックの健全性を測るには不十分です。

ネットワークの「無実」を証明する平均潔白証明時間(MTTI)

フルスタックの環境では、アプリケーションのタイムアウトという「症状」に対し、その「原因」が全く別のレイヤー(例えばネットワークのパケットロスやストレージの遅延)にあることが多々あります。

多くの場合、最初に疑われるのはネットワークですが、実際には無実であることも少なくありません。

そこで重要になるのが、平均潔白証明時間(Mean Time to Innocence: MTTI)という考え方です。

AIツールが各レイヤーを自己診断し、「ネットワーク層に異常はない」と即座に証明できれば、運用担当者は真の原因究明にリソースを集中させることができます。

指標名定義と役割AIによる最適化の効果
Time to Correlate分断された信号を単一の推奨アクションに紐付ける時間ログとトレースの相関分析を自動化し、根本原因を特定。
MTTI特定のコンポーネントが「原因ではない」と証明する時間各レイヤーの自己診断により、無駄なトラブルシューティングを排除。
Predictive Accuracy障害や容量不足を事前に予測する精度の割合予測に基づく予算策定とハードウェア調達の最適化。

HPEの戦略的プラットフォーム:CloudOps Softwareの展開

HPEは、買収したOpsRampやMorpheus、さらにはApstra Data Center Directorを統合し、次世代のハイブリッド・マルチクラウド運用モデルを構築しています。

これらのツール群は、単にインフラを管理するだけでなく、インフラがビジネス目標にどのように寄与しているかを可視化する「運用コントロールセンター」として機能します。

予測分析によるキャパシティ管理の高度化

現在のサプライチェーンの不確実性を考慮すると、ハードウェアリソースの調達には正確な予測が欠かせません。

HPEのAI Opsプラットフォームは、例えば「特定のスイッチが6週間以内に故障する可能性」や「リソースが枯渇するタイミング」を予測します。

これにより、運用チームは場当たり的な対応から脱却し、計画的なハードウェア更新と予算配分が可能になります。

現在、HPEのプラットフォームによるトラブルシューティングの精度は約40%に達しており、2026年末までには70%以上を目指しています。

これは、100年近いエンタープライズ経験をAIの学習データ(エージェンティックスキル)として注入しているからこそ到達できる数値といえるでしょう。

まとめ

HPEが推進するエージェンティックAIによる運用改革は、単なる自動化の延長線上にあるものではありません。

それは、人間が複雑すぎるインフラに振り回される現状を打破し、AIエージェントを信頼できるパートナーとして共存させる新たな運用文化の提案です。

クローズドループ運用が定着すれば、運用チームは絶え間ないアラート対応から解放され、より戦略的なIT投資やビジネス価値の創造に時間を割くことができるようになります。

AIスプロールが進む2026年において、システムの複雑性を「ノイズ」として排除するのではなく、AIによって「制御可能なシグナル」へと変えていくアプローチこそが、企業のDXを真の成功へと導く鍵となるでしょう。