AI(人工知能/ディープラーニング)グーグル(Google)

Googleの動画生成AI「Veo 3」がGeminiの画面から使えました、このマルチモーダル感はすごい!

この記事は約4分で読めます。

フランス人夫婦が食べる越前そばGoogleの動画生成AI「Veo 3」がGeminiProの画面から使えるようになっていました。試しに生成した動画のクオリティがすごい。音声もついているのでまるで映画の1シーンのようです。
作成したのは「フランス人夫婦が食べる越前そば」です。プロンプトなどは以下のとおりですが、日本語で簡単なプロンプトです。この動画生成の精度はすさまじいですね。OpenAIのChatGPT/SORAよりはるかにすごいです。おどろきました。

Googleの動画生成AI「Veo 3」

Geminiの画面から動画生成ができました

昨日課金してPro版になったGemini。

ついにGoogleのAIにも課金、Workspace+Geminiで月額1900円Pro版の利用を開始しました
ついにGoogleのAIもPro版(有料版)にしました。これまで生成AIは、有料版ではChatGPTとPerplexityを使っていました。これまではGoogleのGeminiやNotebookLMは無料版しか使っていませんでした。ここにきてGoogleのAIの性能アップがすごいので、いよいよ潮時かなと感じ、Googleも有料版のProに移行することにしました。

本日Geminiを開いたら「動画生成もできるようになりました」という告知が表示されました。試しに動画を生成してみました。

入力したプロンプトは「越前蕎麦は、大根おろしをかけた「おろしそば」という冷たい蕎麦です。その越前おろしそばを美味しそうに食べるフランス人の夫婦の画像を生成してください。」です。
※画像と書いてしまいましたが動画生成をさせています

フランス人夫婦が食べる越前そば

いやーなかなかすごいですね、これは。この動画内で話しているのは英語ですが、これがフランス語や日本語だともっとびびりますよね。そしてびびりました(笑)

動画をYouTubeにて公開しました

この動画をダウンロードしたらMP4形式でした。そのままYouTubeにアップしてみました。

こんな感じです。

これはこれですごいのですが、ふたりとも話しているのが英語です。そこで、日本語と英語で会話しているようにリクエストしなおしてできた動画は次のこれです。

修正依頼したプロンプトは「このふたりが話しているのは英語ですね。ご主人が英語を話し、奥さんが日本語を話すということにできませんか?」です。

この動画で本当にびびりました。

どうですか?
これは本当にすごいでしょ。

本当に英語と日本語の会話になっています。ちょっとたどたどしい外国人女性の日本語がリアル感がありすぎます。ふたりとも胸にピンマイクがついているので「食レポ」をしているシーンですね。

Googleの最新動画生成AIは「Veo 3」と呼ばれ、2025年5月に発表されたばかりの最先端モデルです。以下、Veo 3および関連ツール「Flow」について詳しく解説します。(以下の解説内容は生成AIで作成しました)

「Veo 3」とは?

  • 「Veo 3」は、テキストや画像のプロンプトから高精細な8秒間の動画を自動生成できるAIモデルです。

  • 最大の特徴は、映像だけでなく音声(BGM、効果音、会話のセリフなど)も同時に生成できる点です。

  • 生成された動画は、キャラクターやカメラワークの一貫性を保ちつつ、物理的なリアリティやリップシンク(口の動きとセリフの同期)にも優れています。

主な機能と特徴

  • プロンプト入力による生成
    テキストや音声で「どんな動画を作りたいか」を指示するだけで、AIが映像と音声を自動生成します。

  • 音声付き動画
    BGMや環境音、キャラクターの会話も自動で作成。映像と音声が自然に同期します。

  • カメラワークやシーン編集
    カメラの動きやアングル、シーンの連続性も指定でき、複数のクリップを組み合わせて一貫した作品を作れます。

  • 画像から動画生成
    画像をもとに動画を生成することも可能です。

  • 商用利用や編集も対応
    Flowという専用ツールを使えば、生成した動画の編集やカット、素材管理も直感的に行えます。

利用方法と料金

  • 利用には「Google AI Pro」(月額2,900円)または「Google AI Ultra」(月額36,400円)プランの契約が必要です。

    • Proプラン:月10本まで生成可能

    • Ultraプラン:月125本まで生成可能

  • GeminiアプリやFlow(ウェブアプリ)から利用でき、今後はモバイルアプリにも対応予定です。

  • プロンプトは現在「英語のみ」ですが、日本国内からも利用できます。
    →本日使ったケースでは日本語入力でしたので、これからは日本語での利用も可能になっていくと思われます。

代表的な活用シーン

  • SNS用ショート動画や広告動画の素早い作成

  • プロトタイピングやアイデア出し

  • ストーリーボードやプレゼン資料用の映像生成

  • ミュージックビデオや短編映画の制作

まとめ

Googleの動画生成AI「Veo 3」は、テキストや画像から音声付きの高品質な動画を自動生成できる画期的なAIです。Flowなどのツールと組み合わせることで、直感的な動画制作や編集も可能になり、映像制作のハードルを大きく下げています。商用利用も視野に入れた本格的なツールであり、今後の映像制作の在り方を大きく変える可能性があります。