AI(人工知能/ディープラーニング)

Soraの知財制限が厳格化?「首の短いキリン」の動画生成できなくなった件から見るAIの現在地

この記事は約11分で読めます。

「首の短いキリン」の動画生成動画生成AI「Sora」が世界に衝撃を与えてから、しばらくが経ちました。私もその驚異的な性能に魅了され、様々な動画生成を試みています。しかし本日、ごく普通のプロンプトで動画を作ろうとしたところ、思わぬ「壁」にぶつかりました。
この経験は、Sora、ひいては生成AI全体の方向性における重要な変化を示唆しているように思えます。今回は、私が実際に体験した流れを共有しながら、AIの進化と規制のバランスについて考えてみたいと思います。

首の短いキリン事件

発端:空想の動物「首の短いキリン」を作ろうとした

ことの始まりは、一本の短い動画のアイデアでした。「キリンなんだけど首が短くて、ポニーぐらいの大きさの可愛い生き物」が、夜空を飛んでいく、というシンプルなものです。特定のキャラクターを模倣する意図は全くなく、純粋な創作です。

これは以前「首の短いキリン」の画像を生成するために「問いを立てるチカラを磨こう」という記事を書いたことがあり、そのアイデアを動画で試してみようと思ったからです。

「首の短いキリン」をうまく描いてもらうという試行錯誤でプロンプトの工夫の重要性に気づきました(画像生成AI活用ポイント)
画像生成AIを利用すると、自分のイメージしたものを簡単にビジュアル化できます。しかし、「思い通りの画像が作れない…」と感じたことはありませんか?その原因の一つとして、AIへの指示(プロンプト)の内容が適切でない可能性があります。事例として「首の短いキリン」を生成AIにうまく描いてもらう試行錯誤を例にして、プロンプトの工夫と改善のポイントを紹介します。画像生成AIとのプロンプト実験実際にやってみた事...

上記の記事では「首の短いキリン」を生成AIにうまく描いてもらう試行錯誤を例にして、プロンプトの工夫と改善のポイントを紹介しています。

プロンプトはGeminiで英語にリライトしました

soraに詳細なシーンごとの動きを指示するためにはプロンプトを英語にしたほうがよいみたいです。まずは日本語で自分が思うプロンプトを書きました。

空想上の動物を生成してください。それはまるで首の短いキリンです。体のサイズはポニーのように小さく身体中にキリンのような模様があり顔はキリンです。その首の短いキリンのアップが0.5秒、そしてその首の短いキリンの周りをカメラが回っているように身体全体を撮影し、そのあとその首の短いキリンは夜空に飛び出します。空を飛ぶときは体から羽が生えて羽ばたいています。そして空を飛んでいるときに表情のアップがあり、その首の短いキリンはにっこりと笑います。

このプロンプトをGeminiを使い英語でリライトしました。いくつかの案をだしてくれたのでまずは最初の案でSoraに以下のようなプロンプト(指示文)を入力しました。

【最初に試したプロンプト】
A cinematic shot of a whimsical fantasy creature: a pony-sized giraffe with a comically short neck. It has the distinct face and patterned coat of a classic giraffe.
The scene begins with a 0.5-second extreme close-up on the creature’s gentle face. The camera then quickly pulls back and smoothly orbits around the creature, revealing its full body standing in a magical, glowing meadow at twilight.
Suddenly, it looks up, crouches, and leaps powerfully into the starry night sky. As it ascends, magnificent feathered wings sprout from its back, and it begins to fly gracefully.
The final shot is a close-up on the creature’s face as it soars through the clouds, it turns to the camera and gives a wide, joyful smile, its eyes twinkling with delight. Photorealistic, highly detailed, cinematic lighting.

内容は「コミカルなほど首の短い、ポニーサイズの空想の生き物。顔や模様はキリン」といった、かなり詳細なものです。Soraの性能なら、きっと素晴らしい映像を返してくれるだろうと期待していました。

しかし、返ってきたのは動画ではなく、冷たいエラーメッセージでした。

このコンテンツは、サードパーティのコンテンツとの類似性に関する当社の安全基準に違反している可能性があります。

これは一体、どういうことなのでしょうか。

Just a moment...

エラーの原因は「知的財産(IP)」への過剰配慮か

このエラーメッセージは、要するに「あなたが作ろうとしているものは、ディズニーや任天堂のような第三者のキャラクター(知的財産)に似てしまうかもしれないので、作れません」という意味です。

正直なところ、私は戸惑いました。「首が短いポニーサイズのキリン」なんてキャラクターが、ディズニーや任天堂の作品にいただろうか?

この出来事から推測できるのは、OpenAIの戦略変更です。Soraが登場した当初は、有名キャラクターや映画のスタイルを模倣したような動画が次々と生まれ、その自由度の高さが話題になりました。しかし、それは同時に著作権侵害のリスクと隣り合わせの「無法地帯」でもありました。

おそらくOpenAIは、巨大IPを保有する企業との無用な摩擦を避けるため、知的財産保護のフィルターを大幅に強化したのでしょう。ビジネスとして当然の判断であり、調整局面に入ったこと自体は理解できます。

行き過ぎた制限は創造性の足かせになる

しかし、今回のケースは「行き過ぎた制限」と言わざるを得ません。

私のプロンプトは、特定のキャラクターの再現を狙ったものでは全くありません。「キリン」という既存の動物をモチーフに、特徴を少し変えてオリジナルの生き物を描こうとしただけです。これがブロックされるのであれば、今後クリエイターはどのような空想上のキャラクターを生成できるというのでしょうか。

動物の特徴を組み合わせるような、ごく自然な創作活動までもが「IP侵害のリスク」として弾かれてしまうのであれば、それはAIが持つ創造性を大きく損なう「足かせ」になってしまいます。

AIの安全フィルターは、明確なIP(ミッキーマウスやポケモンのピカチューなど)を名指しした場合だけでなく、「特徴の組み合わせ」から類似リスクを判断しているようです。今回は「キリン」というモチーフと「デフォルメされた体型」の組み合わせが、何らかの既存キャラクター(例えばポケモンの『キリンリキ』など)との類似性をAIに連想させたのかもしれません。

ですが、それはあまりにも過敏な反応です。

解決策:より抽象的なプロンプトへの変更

ちなみに、この問題はプロンプトを修正することで回避できました。何度かプロンプトを修正し特定のキャラクターを連想させないよう工夫し、以下のように変更したのです。

【修正して成功したプロンプト】
An adorable fantasy creature, a baby giraffe with a very short neck and the size of a small pony. The video opens with a flash 0.5-second close-up of its cute face. The camera circles to show its full body in an enchanted forest. Then, the creature joyfully leaps into the beautiful night sky. Gorgeous wings emerge from its body, and it flies majestically. The final scene is a heartwarming close-up of the creature’s smiling face as it flies, expressing pure happiness and wonder. Whimsical and magical atmosphere.

日本語だと、以下のような感じです。

かわいらしい空想の生き物 ― 首のとても短い、子どものキリン。大きさは小型のポニーくらいです。
動画は、まず0.5秒ほどの一瞬のアップで、そのかわいい顔から始まります。
カメラがゆっくり回り込み、魔法の森の中でその全身を映し出します。そのあと、この生き物はうれしそうに夜空へと飛び上がります。
体から美しい翼が現れ、堂々と空を舞い上がります。
最後のシーンでは、空を飛びながらにっこり笑う顔のアップ。
純粋な幸せと驚きに満ちた表情で、見る人の心を温かくする映像です。
全体は幻想的で魔法のような雰囲気に包まれています。

このように、より抽象的な表現にすることで、無事に動画を生成させることができました。しかし、本来なら不要なはずの「言葉遊び」をユーザーに強いるのは、健全な姿とは言えないでしょう。

生成できた動画

▼soraで生成した動画

Just a moment...

ちなみに同じプロンプトを使ってGoogleGeminiの「veo3」でも動画生成してみました。

▼veo3で生成した動画

soraもveo3もすばらしい動画を生成してくれます。しかし性能の差がでてきていますね。soraが最初に出た時はすごいと思いましたがその後に出たveo3だと音声がついて映画のようになったことでびっくりしました。そして、現在のsora2だと明らかにveo3を上回る動画生成能力ですよね。この進化の速さには驚きます。

さて…

「道具に罪はなく、問題は使う人間にある」

こんな考え方があります。

「道具に罪はなく、問題は使う人間にある」

有名な作品を模倣してスケッチすることは違法ではありません。個人で楽しむ自由があります。問題が起きるのは、あまりにも本物にそっくりな作品が公開されたときです。それは元の作品の知的財産の権利に抵触するでしょう。
ですがそのような問題の原因は「公開した人」にあり、スケッチを書いた道具である筆に罪はありません

これは、コピー機、ビデオデッキ、そしてインターネットのP2Pソフトに至るまで、新しい技術が登場するたびに繰り返されてきた議論です。個人が私的利用の範囲で楽しむ限りは、著作権法上の「私的複製」として許容されるべきだ、という考え方です。

しかし、AIの登場によって、その「道具」の性質が根本的に変わってしまい、OpenAIのような開発企業が「筆を作っただけ」では済まされない、と自ら判断せざるを得ない状況が生まれています。

絵を描く道具である「筆」とのアナロジーを基に、なぜOpenAIが予防的な制限に踏み切らざるを得ないのか、その背景にはいくつかのAI特有の事情があります。

「学習データ」という原罪

  • 筆: 筆や絵の具は、それ自体にミッキーマウスの情報を含んでいません。
  • AI: 一方、Soraのような生成AIは、インターネット上の膨大な画像や動画(その中にはディズニーや任天堂の著作物も含まれているでしょう)を学習データとして「摂取」して作られています。

この「学習行為」そのものが著作権侵害ではないか、という訴訟が世界中で起きています。AI開発企業は、「AIは著作物から表現の『スタイル』を学んだだけで、作品そのものを記憶しているわけではない」と主張していますが、法的な決着はまだついていません。

この状況で、もしユーザーがAIを使ってミッキーマウスそっくりのものを生成できてしまったら、「ほら見ろ、やはりお前たちのAIは我々の著作物を無断で複製しているではないか」と、IPホルダー側(ディズニーなど)に訴訟を有利に進める材料を与えてしまうことになります。それを防ぐために、そもそも「生成させない」という自主規制をせざるを得ないのです。

「規模と質」の問題

  • 人間と筆: 一人の人間が手で描けるスケッチの量と質には限界があります。
  • AI: AIは、プロンプト一つで、誰でも、本物そっくりの作品を、大量に、しかも瞬時に生成できてしまいます。

この圧倒的な「規模と質」は、IPホルダーにとって、これまでの技術とは比較にならないほどの脅威です。海賊版が市場に溢れるスピードと量が桁違いになるため、問題が起きてから対処する(公開した人を訴える)のでは追いつかない、という懸念があります。

プラットフォームの責任問題

最終的な責任は公開した個人にあるのが基本です。しかし、あまりにも多くのユーザーがAIを使って著作権侵害を行った場合、「そのような行為を容易にするツールを提供したプラットフォーム側(OpenAI)にも責任がある(幇助犯)」として訴えられるリスクが高まります。

YouTubeがContent IDというシステムで著作権侵害動画を自動的に検出・削除しているのと同じように、OpenAIも自社プラットフォームが無法地帯にならないよう、予防的な措置を講じる責任があると判断しているのでしょう。

まとめ:AIは新たな「試行錯誤の時代」へ

「道具に罪はない」という考え方は、個人の自由な創作活動を守る上で非常に重要です。

しかし、現在の生成AIは、

  1. 成り立ち(学習データ)に著作権のグレーゾーンを抱え
  2. 生成物の規模と質がこれまでの技術と桁違いであり
  3. プラットフォームとしての法的・社会的責任を問われる

という、従来の「道具」とは全く異なる性質を持っています。

これらの複合的なリスクを考慮した結果、OpenAIは「個人の自由」よりも「IPホルダーとの法的紛争を避ける」ことを優先し、過剰とも思える予防的フィルターを導入している、というのが現状だと考えられます。これは、AIという新しい技術が社会に受け入れられるための、避けられない産みの苦しみなのかもしれません。

今回の「首の短いキリン」事件は、生成AIが無法地帯の黎明期を終え、社会との共存を模索する新たなフェーズに入ったことを象徴しています。IP保護の重要性はわかりますが、そのための制限が創造性の芽を摘んでしまっては本末転倒というあらたな問題も生まれました。

ユーザーと開発者の双方が試行錯誤を繰り返す中で、AIが「安全」と「自由」の最適なバランスを見つけ出していくことを期待しています。私も、AIの可能性を信じ、一人のユーザーとしてこれからも様々な試みを続けていきたいと思います。