主なポイント

✓ エージェントAIは、企業のビジネスシステムに直接接続されており、タスクを実行する権限が与えられています。
✓ マルチターン攻撃が成功率92%を記録しており、AIモデルの脆弱性が懸念されています。

社会的影響

! AIの導入が進むことで、企業の業務効率が向上する一方で、新たなセキュリティリスクが社会全体に影響を及ぼす可能性があります。
! 特に、サプライチェーンの脆弱性が悪用されると、広範な影響を及ぼす可能性があるため、企業は慎重に対策を講じる必要があります。

編集長の意見

エージェントAIの導入は、企業にとって業務効率を大幅に向上させる可能性を秘めていますが、その一方で新たなセキュリティリスクも生じています。特に、AIシステムが自律的に行動することで、攻撃者がこれを悪用するリスクが高まります。例えば、エージェントが他のエージェントと通信する際に、信頼関係を悪用される可能性があります。これにより、データの流出や不正なコマンドの実行が行われる恐れがあります。さらに、サプライチェーンにおける脆弱性も無視できません。オープンソースのリポジトリには、悪意のあるコードが埋め込まれるリスクがあり、これが企業のセキュリティを脅かす要因となります。企業は、ゼロトラストの原則を導入し、最小特権アクセスを実施することで、これらのリスクに対処する必要があります。また、AIシステムのセキュリティを評価するための指標を明確にし、組織のAI成熟度に応じた対策を講じることが重要です。今後、AIの導入が進む中で、企業はセキュリティ対策を強化し、リスクを最小限に抑える努力を続ける必要があります。

解説

自律エージェントAIが本番権限を握りはじめた——多段攻撃とサプライチェーンで“静かなSRE事故”が起きる前に、設計をやり直すべきです

今日の深掘りポイント

生成AI「アシスタント」から、権限を持つ「エージェント」への移行が一気に進み、チケット、コード、チャット、クラウド運用の各面が自動化の実行面（data plane）に直結しはじめています。
しかし多くの現場は、最小特権・境界・監査の三点セットが未整備のまま接続しており、誤作動でも攻撃でも“本番の連鎖障害”に直結する設計負債を抱えています。
マルチターン（多段）攻撃は、プロンプト1発では起きない事象を会話の積み重ねで誘導し、メモリやツール呼び出しを経由して影響を拡大します。報道ベースでも高い成功率が観測されており、過小評価は禁物です。
境界を越えるAPI委託・SaaS連携・依存パッケージの自動更新が攻撃面を指数関数的に広げ、エージェントが「望まぬ実行権限のハブ」になり得ます。
原則論（ゼロトラスト、最小特権）をエージェント設計に翻訳すると、「ワークロードIDのきめ細かい権限スコープ」「行為ベースのポリシーゲート」「観測可能性（可監査性）by default」が実装の核になります。

はじめに

生成AIは「検索と要約の支援者」から、「外部ツールを呼び出し、チケットを書き換え、コードにPRを出し、クラウドのメトリクスを見てアクションする自律エージェント」へと不可逆に進化しています。Help Net Securityは、エージェントAIが企業のチケッティング、ソースコードリポジトリ、チャット、クラウド運用に直結し、最小限の人間の関与でタスクを実行する現場が急増している一方、準備が整っていない組織が多数派であると指摘します。また、多段の対話を通じて脆弱化を誘発する「マルチターン攻撃」が極めて高い成功率を示した事例が報告され、サプライチェーンの脆弱性も重ねて警鐘が鳴らされています。ゼロトラストと最小特権の原則を「AIワークロード」にどう落とし込むかが差のつく分岐点になります［出典: Help Net Security］です。

参考: Help Net Securityは、Ciscoの年次報告に基づき、エージェントAIの現状とマルチターン攻撃の高成功率、サプライチェーンの懸念を報じています［参考リンク参照］です。

深掘り詳細

事実整理（報道のポイント）

エージェントAIが業務の中核システム（チケット、コード、チャット、クラウド）に直結し、自動でタスクを実行するケースが増加しています。
組織の備えは追いついておらず、特に以下が脆弱点として挙がります。
- 多段会話での脆弱化（マルチターン攻撃）
- ツール権限の過剰付与（特にクラウドとVCS）
- サプライチェーン（依存パッケージ、プラグイン、外部API）での混入リスク
対応として、ゼロトラスト原則・最小特権アクセス・監査強化が推奨されています［出典: Help Net Security］です。

出典:

Help Net Security: “Enterprises rush to secure AI agents as new risks emerge”［https://www.helpnetsecurity.com/2026/02/23/ai-agent-security-risks-enterprise/］です。

編集部インサイト：エージェントに権限を与えることは「新しい社員を入社させる」ことです

エージェントは「ユーザー権限を持つ自動化ユーザー（サービスアカウント）」として企業ネットワークの一員になります。つまり、ゼロトラストの文脈では「新しいワークロードID」が増えるのと同義です。人間と違って休まないうえに高速で連鎖操作できるため、権限設計の誤りは被害面積と速度の両面で増幅します。
プロンプト1発に強い制御策（入力検査、出力フィルタ）だけでは、会話の履歴・メモリ・RAG・ツール呼び出しを横断する「状態管理の安全性」を担保できません。マルチターン攻撃は、この“状態”に付け入る攻撃です。安全化はNLPガードレールだけでは不十分で、「行為（Action）に基づく権限ゲート」と「監査可能なトレーサビリティ」が不可欠です。
クロスボーダーなAPI連携・委託運用が進むほど「信頼の継承」が増え、Trusted Relationshipの濫用が起きやすくなります。人間のSoD（職務分掌）に相当する「エージェントSoD」を設計しない限り、意図せぬ権限合算が恒常化します。

実務の落とし穴：多段攻撃×サプライチェーン×ChatOpsの三重苦

多段攻撃は、内部Wikiやチケット、PRコメント、外部サイトの断片を経由して「命令化」されたテキストがメモリやRAGに取り込まれると成立しやすくなります。これにツール実行権が紐づくと、SSH/CLI/APIなどの実行面まで到達します。
ChatOpsとIaC（GitOps）を介した本番変更フローにエージェントを入れるなら、2段階以上のゲート（たとえばPR作成までは自動、マージとデプロイは人手）を徹底しないと、誤作動や誘導での本番変更が“静かに”走ります。
依存パッケージやプラグイン、外部AIツールの自動更新を許容すると、サプライチェーン混入がそのままエージェントの実行権限で走る危険があります。更新は署名検証・ピン留め・ステージング・カナリアを必須化すべきです。

脅威シナリオと影響（MITRE ATT&CK準拠の仮説）

以下は仮説に基づく代表シナリオです。自組織の実装・権限設計に照らし合わせ、検知観点と制御点を洗い出す起点として提示します。

シナリオA：内部Wiki/チケット経由のプロンプト注入でクラウド権限が濫用される
- 流れ（例）
  1. 攻撃者が社内Wikiや課題コメントに巧妙な指示文（誘導テキスト）を混入（ATT&CK: Data Manipulation, T1565）です。
  2. エージェントがRAG/メモリで当該文脈を取り込み、クラウドCLIツールを呼び出して権限変更（Account Manipulation, T1098）やシークレット参照（Unsecured Credentials, T1552）を実行します。
  3. データ探索（Cloud Service Discovery, T1526; Data from Information Repositories, T1213）からの取得データを外部に送信（Exfiltration Over Web Services, T1567）します。
- 影響
  - 本番IAMの逸脱、キー漏洩、ストレージの広域列挙・流出、コスト爆発（暗号通貨マイニング/API濫用）です。
シナリオB：依存パッケージ/プラグイン更新に乗じたサプライチェーン混入
- 流れ（例）
  1. 攻撃者が人気パッケージの所有権乗っ取りや似名ライブラリで汚染（Supply Chain Compromise, T1195）です。
  2. エージェントのランタイムやツールが自動更新で取り込み、実行時に外部C2へ接続（Command and Control: Web Protocols, T1071相当）です。
  3. 署名トークンやセッションを窃取（Valid Accounts, T1078; Steal Application Access Token, T1528相当）し横展開します。
- 影響
  - 署名付き悪性PR、CI/CD乗っ取り、アカウント乗っ取りによる持続化です。
シナリオC：ChatOps/エージェント間の「信頼関係」を悪用した権限合算
- 流れ（例）
  1. 攻撃者が低権限のサードパーティエージェントを経由してメッセージを注入し、別エージェントを誤誘導（Trusted Relationships, T1199）です。
  2. 高権限エージェントが誤認した指示でPRを自動承認し、パイプラインを起動（Exploitation of Trusted Channels）です。
- 影響
  - SoD崩壊、重大変更の無審査実行、広範な設定改変による可用性低下です。
シナリオD：ベクトルDB/RAGのデータ汚染
- 流れ（例）
  1. 公開ソースやOSSのREADME、FAQに命令化テキストを混入（Data Manipulation, T1565）です。
  2. エージェントが安全でないコンテキスト分離のまま取り込み、ファイアウォールやSaaSの設定変更を自動実行します。
- 影響
  - 認可緩和やデータ公開設定の誤変更、外部データの整合性毀損です。

注: 技術IDはATT&CK Enterprise準拠の代表例です。組織環境（クラウド/SaaS/オンプレ）により該当IDは変わり得ます。

セキュリティ担当者のアクション

アイデンティティと権限の再設計（ゼロトラストをエージェントに適用）
- エージェントを「非人間ワークロードID」として登録し、クラウドIAM/IdPで人間と分離します。OIDC/短期トークン/スコープ限定/時間限定の「エフェメラル資格情報」を標準にします。
- 権限は「データアクセス」と「行為（ツール実行）」を分離し、用途ごとに最小特権を再定義します。特にVCSの「PR作成」と「マージ」「タグ付け」「リリース作成」を別権限に割り、マージ以降は原則人手ゲートにします。
- Trusted Relationshipの棚卸しを実施し、エージェント間メッセージ経由での高権限アクションを禁止・制限します。
行為ベースのポリシーゲート（PEP/PDPの設計）
- すべてのツール呼び出しをポリシーエンジン（例: OPA/Cedar）経由で評価し、リソースタグ・業務時間・変更窓・リスクスコアに応じて「許可/要承認/拒否/シャドウ実行」を切り替えます。
- 高リスク行為（IAM変更、ネットワークACL、データ削除、外部送信）は二者承認とカナリアを義務化します。ChatOpsからの一発デプロイは禁止します。
コンテキスト分離とプロンプト防御を「状態」に拡張
- メモリ/RAG/外部ソースを「命令」と「参考データ」に強制分離し、データ面の文字列を命令として解釈しないルールを実装します（コンテキストファイアウォール）です。
- 未信頼ソースからのテキストは明示的に無害化（エスケープ/タグ除去）し、RAGは信頼度メタデータとともに提示します。多段会話の間に安全ゲートを差し込みます。
実行面のサンドボックス化とネットワーク制御
- エージェントのツール実行環境をコンテナ/VMで隔離し、明示的な宛先許可リスト（egress allowlist）を適用します。外部アップロード先は限定し、CASB/DLPと連携します。
- OSコマンド/ファイル操作/ネットワーク送信は事前宣言制にし、逸脱時は即ブロック・即アラートにします。
監査と可観測性（Observability by default）
- すべての「プロンプト」「メモリ変更」「RAGソース」「ツール呼び出し」「レスポンス」を構造化ログ化し、改ざん耐性（署名/タイムスタンプ）を付与します。SIEMに連携し、MITRE ATT&CKマッピングのユースケースで検知します。
- 安全性KPIを運用指標に昇格します（例：高リスク行為の人手承認率、拒否/遮断率、未信頼ソース混入率、シャドウ実行の乖離率）です。
サプライチェーン衛生の強化
- 依存・プラグイン・エージェント間APIは、署名検証（Sigstore等）、バージョンピン留め、SBOM管理、ステージング/カナリアを標準化します。自動更新は「観測とロールバック」が整うまで無効化します。
- プロンプトやツール定義（スキーマ）は「コードとして管理」し、レビュー・静的解析・シークレット検査のパイプラインに乗せます。
段階導入とレッドチーミング
- まずは「シャドウモード（提案のみ）」で導入し、実行前後の結果差分を可視化します。次に「低リスク行為のみ自動化」、最後に「高リスクは人手ゲート＋二者承認」で段階的に広げます。
- マルチターン攻撃、RAG汚染、ChatOps経由の誤誘導、プラグイン汚染をカバーするジェネレーティブAI特化のレッドチーム評価を定期化します（MITRE ATT&CK視点のTTP駆動でシナリオ化）です。
インシデント対応の刷新（エージェント特化）
- エージェントの「キルスイッチ」「資格情報ローテーション即応」「会話/メモリのフォレンジック保全」手順を用意します。人間アカウントとは別の封じ込めフローを整備します。
メトリクスに基づく運用判断
- 今回のスコアリングが示唆するのは「確からしさが高く、現場で即手当可能で、設計不備が直撃する」類のリスクです。楽観や待ちの姿勢ではなく、「権限スコープの縮小」「人手ゲートの挿入」「観測可能性の先行整備」を先にやるのが費用対効果の高い順序です。

参考情報

Help Net Security: Enterprises rush to secure AI agents as new risks emerge（2026-02-23）
https://www.helpnetsecurity.com/2026/02/23/ai-agent-security-risks-enterprise/
NIST Special Publication 800-207: Zero Trust Architecture
https://csrc.nist.gov/publications/detail/sp/800-207/final
NIST AI Risk Management Framework 1.0
https://www.nist.gov/itl/ai-risk-management-framework
OWASP Top 10 for Large Language Model Applications
https://owasp.org/www-project-top-10-for-large-language-model-applications/
MITRE ATT&CK Enterprise（テクニク参照のため）
https://attack.mitre.org/

編集後記：エージェント導入は、DevOpsが到達した「自動化の完成形」をAIが引き継ぐ壮大な挑戦です。ただし、安心して任せられるのは、権限・境界・監査がそろってはじめて、です。まずは「エージェントを一人の同僚として入社させる」覚悟で、ID、職務分掌、オンボーディング、評価、監査を設計し直すところから始めるのが近道です。エレガントなNLPの先にあるのは、とても現実的で堅牢なセキュリティエンジニアリングそのものです。

背景情報

i エージェントAIは、タスクを自動化するために設計されており、企業の業務プロセスに深く統合されています。これにより、限られた人間の介入で多くの業務を効率化できますが、同時にセキュリティリスクも増大しています。
i 特に、マルチターン攻撃は、AIモデルが長時間の対話を通じて不正なコンテンツに誘導されるリスクを高めています。これにより、企業はAIシステムのセキュリティを強化する必要があります。