ニューヨーク・タイムズがPerplexityを著作権侵害で提訴
ニューヨーク・タイムズは、AI検索スタートアップのPerplexityに対して著作権侵害で訴訟を提起しました。この訴訟は、Perplexityが同社のコンテンツを無断で使用し、商業製品を提供していると主張しています。タイムズは、AI企業との交渉を進める中で、訴訟を通じてコンテンツの正式なライセンス契約を求める戦略を取っています。Perplexityは、参加メディアに広告収入の一部を分配するプログラムを導入していますが、タイムズはその使用方法に異議を唱えています。訴訟は、AI技術の進展に伴う著作権問題の重要性を浮き彫りにしています。
メトリクス
このニュースのスケール度合い
インパクト
予想外またはユニーク度
脅威に備える準備が必要な期間が時間的にどれだけ近いか
このニュースで行動が起きる/起こすべき度合い
主なポイント
- ✓ ニューヨーク・タイムズは、Perplexityが同社のコンテンツを無断で使用していると主張し、訴訟を提起しました。
- ✓ この訴訟は、AI企業との交渉を進める中で、コンテンツの正式なライセンス契約を求める戦略の一環です。
社会的影響
- ! 著作権侵害の訴訟は、AI技術の発展に伴い、メディア業界の収益モデルに影響を与える可能性があります。
- ! この訴訟は、AI企業がコンテンツをどのように使用するかについての重要な法的前例を形成する可能性があります。
編集長の意見
解説
NYTがPerplexityを著作権侵害で提訴──AI検索とメディアの交差点が“規範”を要求し始めた件
今日の深掘りポイント
- 争点は「学習」だけでなく「再提供」による代替効果まで及ぶ可能性が高く、AI検索の設計原則(クローリング、キャッシュ、出典提示、要約の範囲)を再定義する局面です。
- 企業側のリスクは「法的(著作権・契約)×技術的(スクレイピング/ペイウォール回避)×収益モデル(代替・無断再利用)」の三層が連動します。CISO主導のデータガバナンスと法務・広報との横断体制が必須です。
- 短期的にはウェブ資産のスクレイピング防御と証跡管理、並行してAIベンダーとの契約条項(学習禁止・出典義務・検査権・補償)を平時から整備すべきです。
- 中期の国際波及は避けられず、米国の判断はライセンスの相場観や出典表示の「実務標準」形成に直結します。日本企業も対外提供するコンテンツ/データの扱いを米法域前提で見直す必要があります。
- セキュリティ観点では、スクレイピングの高度化、ペイウォール回避、データ流出(社内からAIサービスへの無自覚な送信)などをMITRE ATT&CKで具体化し、検知・阻止・証拠化の運用を今日から始めるべきです。
はじめに
ニューヨーク・タイムズ(NYT)がAI検索スタートアップPerplexityを著作権侵害で提訴したと報じられました。NYTは、同社コンテンツの無断利用による商業製品提供を主張し、過去18カ月にわたり使用停止を求めてきた経緯があるとされます。Perplexity側は参加メディアへの広告収益分配プログラムを導入している一方、NYTはその使用方法に異議を唱えています。AIと報道機関の利害が真正面から衝突し、ライセンスと補償の前例形成が問われる局面です。
本件は真偽性が高く、短中期に組織の意思決定(契約見直し、技術対策、対外コミュニケーション)を迫る可能性が高いテーマです。過度な期待や悲観は避けつつも、実務としてすぐに手を打てる論点が多く、現場にとって「準備しておくと効く」案件と言えます。
参考:報道(TechCrunch)に基づく既報の把握です。The New York Times is suing Perplexity for copyright infringement(TechCrunch, 2025-12-05)
深掘り詳細
事実(既報の整理)
- NYTはPerplexityが自社コンテンツを無断利用し商業製品を提供しているとして提訴したと報じられています。
- NYTは過去18カ月にわたり使用停止を求めてきた経緯があるとされています。
- Perplexityはメディア参加者への広告収益分配プログラムを導入していますが、NYTはその使用方法に異議を唱えています。
- 訴訟の文脈は、AIの学習・要約・提示(検索体験)の各段階での著作権の扱いと、ライセンス・補償の枠組みに関わるものです。
(出典:上記TechCrunch)
インサイト(何が本当の争点で、どこに実務影響が出るか)
- 争点の射程は「学習の適法性」だけではない
実務でより影響が出るのは、AI検索が生成回答で一次ソースの閲覧を代替する「置換効果」と、要約・抜粋が著作物性のコアを再提供していないか、です。エンタープライズ側は「何が学習に使われ、何が再提供され、どれが代替を生むか」を分解し、契約・技術・運用で別々に管理すべきです。 - ライセンスは「出典義務・粒度・キャッシュ・検査権」が勝負
実装の現場では、(1)出典の常時提示、(2)引用/要約の文字数や粒度の制限、(3)キャッシュ保持期間・再配布の禁止、(4)監査・検査権(どのデータを学習/保持しているかの検証)と補償条項(第三者請求に対する損害填補)が重要になります。法務だけに閉じず、CISO責任範囲にまで落とし込むことで初めて実効性が出ます。 - 収益モデルは「リンク送客」から「回答内収益化」へ
検索体験が回答完結型になるほど、媒体側のPV収益は減衰します。広告分配プログラムが導入されても、配分の妥当性・測定可能性・監査性が鍵です。測定のための出典トラッキングと署名付きリンクの実装検討は、技術側の宿題になります。 - 国際波及は不可避、米国判例が事実上の標準に
米国の判断がライセンスの価格帯、生成結果の出典・粒度の実装標準に影響します。日本企業も米サービスと取引する限り、その標準に沿った社内方針・契約・技術対策を前倒しで整えるのが効率的です。
(注:上記インサイトは既報と一般的な実務論からの分析であり、個別の訴状内容や裁判所の判断は今後の公開情報に依存します。)
脅威シナリオと影響
AI検索と著作権の論争は直接のサイバー攻撃ではないものの、現場で直面する脅威は加速します。以下は仮説シナリオとMITRE ATT&CKの観点からの整理です。
-
シナリオA:高機能スクレイピングとペイウォール回避の高度化(媒体・会員サイト向け)
- 振る舞いの仮説
- 大量のクローリングによるコンテンツ収集(robots指示の無視、ヘッドレスブラウザ・モバイルUAの偽装、プロキシ回転)
- 会員専用記事への不正アクセス(流出資格情報の購入、セッションクッキーの窃取、打鍵なしログインの濫用)
- 取得データのクラウド保管・学習パイプライン投入
- MITRE ATT&CK(例)
- Reconnaissance: T1596(Open Websites/Domainsの検索)
- Resource Development: T1583(インフラ取得)/ T1608(能力のステージング)
- Initial Access/Credential Access: T1078(有効アカウントの悪用), T1539(Webセッションクッキー窃取), T1550(代替認証情報の悪用)
- Defense Evasion/C2: T1090(プロキシの利用)
- Exfiltration: T1567(Webサービス経由の流出、.002 クラウドストレージ)
- 影響
- 帯域・原価の増大、法的対応コスト、会員価値毀損、測定不能な「静かな代替」
- 振る舞いの仮説
-
シナリオB:社内からAIサービスへの無自覚な送信(ナレッジベース/ドラフト原稿の漏えい)
- 振る舞いの仮説
- 社員が外部AIツールへ下書き・内部資料を貼り付け
- ブラウザ拡張・サイドカーアプリが自動でページ内容を送信
- MITRE ATT&CK(例)
- Collection: T1213(情報リポジトリからのデータ取得)
- Exfiltration: T1567(Webサービスへの流出), T1020(自動的流出)
- 影響
- 政策非遵守に起因する権利侵害・守秘違反、将来のモデル出力からの「再露出」リスク
- 振る舞いの仮説
-
シナリオC:データポイズニング/ブランドなりすましでAI検索品質を劣化させる攻撃
- 振る舞いの仮説
- コンテンツファームや偽ブランドサイトで誤情報を大量公開し、AI検索への混入を狙う
- 偽アカウントで拡散して信頼シグナルを偽装
- MITRE ATT&CK(例)
- Resource Development: T1585(アカウント作成)
- Reconnaissance/Collection: T1596(公開Webの利用)
- 影響評価補足
- 本件は機械学習の対敵手法(データポイズニング)の文脈にも関わり、MITRE ATLASの知見も参考になります(補完的枠組みとしての位置づけです)。
- 振る舞いの仮説
これらは仮説ですが、既に多くの媒体・SaaSが同種の振る舞い(高度スクレイピング、会員ページの自動収集、拡張機能の無自覚送信)を観測しており、検知・抑止・証拠化の整備は喫緊の課題です。
セキュリティ担当者のアクション
CISO/法務/広報/収益管理を含む横断タスクフォースで「法的統制×技術的統制×運用監査」を同時に回すのが最短経路です。
-
ガバナンス・契約(AIベンダー/検索ベンダー/ツール事業者)
- 訓示ポリシーを文書化:学習禁止/制限(Do-Not-Train)、再配布禁止、キャッシュ保持期間、出典義務の最低要件。
- 契約条項テンプレートを整備:データ出所の表明保証、学習データの監査権、第三者権利侵害の補償、緊急遮断(Kill Switch)、リージョン固定とサブプロセッサ管理。
- ベンダーリスク審査に「データ出所(provenance)の証跡提供」「クローラの識別・遵守メカニズム」を追加。
-
ウェブ/アプリ防御(スクレイピング対策の現実解)
- ポリシー提示:robots.txtとメタタグで明示的なAI学習・要約のオプトアウト方針を表明(技術的強制力は限定的ですが、法的主張の基礎になります)。
- 識別・遮断:既知のAIクローラUA・ASNのブロック/減速、JA3/JA4やHTTP指紋でのヘッドレス検出、速度・振る舞いベースのレート制御。
- 会員保護:トークン境界の厳格化(短寿命・DPoP/MTLS等)、スクリーンスクレイピング耐性(動的レンダリングの乱数化、一次テキストの遅延ロードは可用性と相談)。
- API優先:有料API/Feedでの正規アクセスを提供し、スクレイピングの誘因を下げる。アクセスポリシーに用途(人間閲覧/学習)別ライセンスを明記。
-
検知・証拠化運用(後の交渉・法務対応を見据えて)
- ログの完全化:UA/JA3/ASN/リファラ/コンテンツID/レスポンス長/キャッシュHITを長期保全。特定クローラのアクセスは専用バケットで分離保管。
- シグナルの監視:ペイウォール直後URLの高頻度アクセス、クッキー未同意での記事本文取得、夜間帯の異常スパイク、同一指紋のIP回転。
- カナリア導入:会員記事に微小・無害のカナリア文を埋め、外部生成物や検索回答に出現した場合は証拠化(法務と事前合意の上で実施)。
-
エンドユーザ対策(社内からの無自覚流出を止める)
- ブラウザ拡張/デスクトップAIの許可リスト制御、SSO連携必須化、プロキシでのLLMエンドポイント検知・遮断/監査。
- DLPでの貼り付け/アップロード検知、会議録の自動要約ルートに社内専用モデルを優先適用。
-
出典と収益の測定可能化
- 出典リンクに署名/トークンを付与し、AI回答経由のトラフィックを可視化。将来の分配交渉の根拠にする。
- フィードにライツメタデータ(利用条件、再配布禁止、学習可否)を埋め込み、契約と実装を一致させる。
-
インシデント/リーガル・プレイブック
- スクレイピング/無断再利用を検知した際の「通知→交渉→技術的遮断→法的措置」手順を定義。広報メッセージも雛形化する。
参考情報
本件は、単なる法廷のニュースではなく、AI時代の「データガバナンス実装」を企業がどこまで主体的にやれるかの試金石です。技術と契約を両輪で回し、検知・遮断・証拠化の運用を今日から積み上げることが、交渉力と防御力の双方を底上げします。
背景情報
- i 著作権侵害の訴訟は、AI技術の進展に伴い、メディア業界で増加しています。特に、AIがコンテンツを生成する際に、元の著作物を無断で使用するケースが問題視されています。ニューヨーク・タイムズは、Perplexityが自社のコンテンツを無断で使用し、商業製品を提供していると主張しています。
- i Perplexityは、情報を収集し、ユーザーの質問に対して応答を生成するために、ウェブサイトやデータベースから情報を取得する手法を用いています。この手法は、著作権で保護されたコンテンツを無断で再利用する可能性があり、メディア企業との間で法的な対立を引き起こしています。