生成AIの進化と法整備の課題
いまや生成AIは生活の中に浸透し、スマホアプリやWEBサイトなど手軽に利用できるツールとなっています。
生成AI(人工知能)ブームのきっかけとなった対話型AI「ChatGPT」を米オープンAIが2022年11月30日に公開し、わずか数年の間に爆発的に開発が進み、一般のコンシューマーが利用できるまでになりました。
しかし、技術の進歩に法整備やルール整備が追い付いていないというのが実態で様々なトラブルも発生しています。
生成AIに関するトラブル例
- イラストレーターが作成したイラストについて、生成AIに学習データとして利用され、酷似したイラストが作成・公開された
- 作家の著作物が、作家の許可なく学習データとして利用された
- 生成AIで作成された動画に騙され、お金をだまし取られた
また例えば、大学において生徒にレポート課題を出したところ、生成AIを利用してレポートを作成しているのが問題になった、など、法に触れるまでではないけれども、日常生活におけるトラブルにつながる例も多数発生しています。
生成AIの出力結果における著作権の扱いは、非常に複雑で議論の途上にありますが、現時点での一般的な見解や文化庁の指針などを踏まえると、以下のようになります。
現時点での生成AIと著作権の関係について
生成AIを利用した生成物(コンテンツ)については、その作成方法によって著作権の発生有無が分かれます。
AIが完全に自律的に生成したコンテンツ
- 著作権は発生しないとされるケースが多い
日本の著作権法では、「著作物」は「思想又は感情を創作的に表現したもの」と定義されており、「人の創作」が要件となっています。
AIは法的な人格を有せず、人間の創作意図や感情を持つとはみなされないため、AIが完全に自律的に生成したコンテンツには、原則として著作権が発生しないと解されています。 - 具体例
- 株価や気象データから自動生成された予測レポート
- 監視カメラの映像から自動で異常を検知し、生成された報告書
人間が創作的に関与しているコンテンツ
- 著作権が発生する可能性がある
AIが生成したものであっても、人間がプロンプト(指示)の内容や与え方、生成された結果の選定、加筆修正、組み合わせなどに「創作的な寄与」をしていると認められる場合には、その部分について著作権が発生する可能性があります。 - 具体例
- 複雑で詳細なプロンプトを工夫し、その指示に基づいてAIがユニークな画像を生成した場合
- AIが生成した複数の素材を人間が編集・構成し、新たな作品として昇華させた場合
(例:AI生成のイラストを組み合わせて絵本を作成し、構成やセリフに創作性がある場合) - AIの出力結果に人間が大幅な加筆修正を加え、人間の創作性が強く反映されている場合
著作権侵害のリスク
生成AIの出力結果を利用する際には、以下の点に注意が必要です。
- 既存の著作物との類似性
AIが学習に用いたデータに既存の著作物が含まれている場合、その出力結果が既存の著作物に酷似してしまう可能性があります。
もし既存の著作物との「類似性」と「依拠性」(その著作物を認識した上で創作したか、または学習データとして使用されたか)が認められれば、著作権侵害となる可能性があります。
たとえAI利用者が元の著作物を知らなくても、AIが学習に用いていた場合は依拠性が推認されることがあります。 - 学習データの著作権
AIの開発や学習の段階で著作物が利用される場合、原則として著作権者の許諾は不要とされています(著作権法第30条の4)。
しかし、享受目的での利用や著作権者の利益を不当に害する場合は、許諾が必要となることがあります。 - その他権利(肖像権、商標権など)
著作権以外にも、AI生成物の中に特定の人物の肖像や企業の商標が含まれている場合、肖像権や商標権の侵害となる可能性もあります。
著作権侵害を防止する方法
例えば、イラストレーターがSNSなどにイラストをアップすることがあるかと思います。
閲覧者に自分のイラストを見てもらうという目的の反面、自分のイラストが生成AIの学習データに使われることを望まない場合も多々あります。
そのような場合、アップロードする画像に「ウォーターマーク」を付与するなどで自衛する場合があります。
ウォーターマークとは
ウォーターマーク(透かし)とは、著作物(画像、イラスト、写真、文書など)の表面に、所有者や作成者の情報(ロゴ、署名、ウェブサイト名など)を半透明で重ねて表示する技術です。

主に以下のような目的で使用されます。
- 著作権表示と無断転載防止
著作物の無断使用や不正利用を抑止し、誰がその著作物の権利者であるかを明確に示します。
ウォーターマークがあってもダウンロードやスクリーンショットは可能ですが、美観を損ねるため商用利用やSNSでの無断転載をためらわせる効果が期待できます。 - 出所の明示
作品の出所を明確にし、作者の認知度向上にもつながります。 - 真正性の証明
正規の作品であることを示すためにも用いられます。
ウォーターマークは、完全に透けて見えるものから、ある程度視認できるものまで様々な濃度があり、デザインもロゴや文字、パターンなど多岐にわたります。
ウォーターマークの課題
ウォーターマークについては、生成AIに対する著作権侵害防止の自衛手段と言えますが、その効果については万全ではないといわれています。
ウォーターマークを消去する技術もあり、また生成AIの学習データ防止の効果は薄いという意見もあります。
Webサイト/SNS側の対応
例えば、X(旧Twitter)の生成AIであるGrokでは、ユーザーが投稿した画像が生成AIの学習データに利用できないようにする設定が可能です。
このように、Webサイト/SNS側で対策が設けられている場合もあります。
まとめと今後の動向
現時点では、AI生成物の著作権に関する法的な明確な基準はまだ確立されておらず、日本含む各国で議論が進行中です。
日本では文化庁が「AIと著作権」に関する考え方を公表するなど、具体的な指針が示されつつありますが、今後の判例や法改正によって見解が整理されていくことが予想されます。
※文化庁がAIに対してどのような認識・検討をしているかが分かるため、お時間があればぜひ下記リンク先をご参照ください。
生成AIを利用する際は、上記の点を踏まえ、著作権侵害のリスクを理解し、慎重に利用することが重要です。
特に商用利用を検討する場合は、弁護士などの専門家に相談することも有効な手段です。
【参考】文化庁|AIと著作権について
https://www.bunka.go.jp/seisaku/chosakuken/aiandcopyright.html
おまけ:Googleの生成AI「Gemini 」の例
Googleの生成AI「Gemini 」について、どのような学習データを利用しているか、法的リスクに対応しているか、をGemini本人?に聞いてみました。
プロンプト:「Geminiが利用する学習データについて教えてください。」
Google の大規模言語モデルである Gemini は、多様なデータセットを学習して構築されています。
その学習データは、Google の公開されている情報や関連するドキュメントから総合すると、以下のような特徴を持っています。Gemini の学習データの種類Gemini は、そのマルチモーダルな特性を活かすため、様々な種類のデータを学習しています。
- テキストデータ:
- ウェブ上の公開文書(ウェブサイト、ブログ、ニュース記事など)
- 書籍
- コード(プログラミング言語のコード)
- 科学論文など
- 画像データ:
- 画像やイラストなど
- 音声データ:
- 音声データ(YouTube動画の文字起こしデータなどを含む可能性があります)
- 動画データ:
- 動画データ
これらのデータは、Gemini がテキストだけでなく、画像、音声、動画といった複数のモダリティ(形式)を同時に理解し、処理できるようにするために使用されます。
著作権について生成AIの学習データにおける著作権の扱いは、現在も世界中で議論が活発に行われている分野です。Google もこの点について言及しており、以下の点が挙げられます。
- 公開されているデータが主 Gemini の基盤となるモデルは、公開されているデータセットで事前学習されています。
- 著作権侵害のリスク軽減への取り組み: Google は、生成AIが既存のコンテンツを長尺で直接引用することを制限するようなシステムを設計し、継続的に改善していると述べています。
- 引用元の表示 Gemini for Google Cloud など、一部のサービスでは、ウェブページやオープンソースコードから直接引用する際に、引用元情報(出典)を提供することがあります。これにより、ライセンス要件への準拠を支援しています。
- 法的リスクへの対応 Google は、Gemini for Google Cloud によって生成されたコンテンツを使用した後に著作権の問題が発生した場合、関連する潜在的な法的リスクに対して一定の責任を負う可能性があることを示唆しています(詳細についてはサービス固有の規約を参照のこと)。
しかし、AIが学習に用いたデータに著作権保護されたコンテンツが含まれる可能性は高く、その利用が著作権侵害にあたるか否かは、個別のケースや各国の法解釈によって異なる可能性があります
。プライバシーについてGemini の学習データや利用データにおけるプライバシー保護については、Google は以下の点を明確にしています。- ユーザーのプロンプトや生成された応答の取り扱い:
- Gemini Apps (コンシューマー向け)
あなたが Gemini Apps に入力したプロンプトや、Gemini からの応答は、モデルのトレーニングデータとしては使用されないとされています。ただし、製品改善のために、人間のレビュアーが会話を読み、注釈を付け、処理することがあると明記されています。このため、機密情報を会話に入力しないよう注意喚起されています。 - Gemini for Google Cloud (企業向け)
Gemini for Google Cloud では、ユーザーのプロンプトや生成された応答は、基盤となるモデルのトレーニングやファインチューニングには使用されません。データはリクエストに対する応答の提供に厳密に使用され、指示がない限り保存されません。
- Gemini Apps (コンシューマー向け)
- データ削除とオプトアウト:
- Gemini Apps のアクティビティ設定から、過去の会話履歴の保存をオフにしたり、データを削除したりすることが可能です。これにより、以降の会話が人間のレビューに送信されたり、生成モデルの改善に使用されたりするのを防ぐことができます。
- 企業向けプランやAPIサービスでは、有料プランの場合、入力データがモデル改善に使用されない旨が明記されています。
- ユーザーのプロンプトや生成された応答の取り扱い:
- 機密情報の入力に関する注意喚起 ユーザーに対して、機密情報や、レビュアーに見られたくないデータ、Googleのプロダクト改善に使用されたくないデータをGeminiに入力しないよう繰り返し注意喚起しています。
このように、Gemini は多様な公開データを基に学習されていますが、著作権やプライバシーに関しては、現行の法的枠組みやユーザーのプライバシー保護の観点から様々な取り組みが行われています。
しかし、利用者自身も、AIが生成するコンテンツの利用や、AIに入力する情報の取り扱いについては、常に注意を払う必要があります。