Googleの画像生成AIが大幅に性能アップしました。画像生成AIというと、ステーブルディフュージョンやミッドジャーニーやアドビファイヤーフライなどの専用AIでないと本格的な画像生成が難しかったです。しかも入力するプロンプトがけっこうややこしかったので、画像生成は難易度が高い分野でした。
それが今度のGoogleが発表した画像生成AIでは、簡単な自然言語でいい感じの画像を生成ができるようになっていて驚きました。その機能を実例をあげて紹介します。
Googleの画像生成AIが大幅に性能アップしました
Geminiの画像生成に使われている最新技術
グーグル「Gemini」の画像生成に使われている最新技術は、「Nano Banana(ナノバナナ)」 というコードネームで知られていました。
より正確に言うと、「Nano Banana」はGoogleが開発した最新の画像生成・編集モデルの開発コードネームであり、正式なモデル名は「Gemini 2.5 Flash Image」 とされています。
「Nano Banana」とは何か?
この技術は、単にテキストから画像を生成するだけでなく、以下のような点で非常に強力で新しいと注目されています。
- キャラクターの一貫性: 同じキャラクターを、異なるポーズや背景で何度も生成することができます。従来は生成するたびに顔や服装が微妙に変わってしまうという課題がありましたが、この点が大幅に改善されました。
- 対話形式での高度な編集: 生成した画像に対して、「帽子を加えて」「背景を夜景に変えて」といった自然な言葉で指示を出すだけで、非常に精密な編集が可能です。
- 複数の画像の合成: 複数の異なる画像を組み合わせて、一つの新しい画像を創り出すことができます。
- 高速な処理: 指示を出してから画像が生成・編集されるまでの時間が非常に短いのも特徴です。
最近、AIの性能を比較するベンチマークサイトに突如「Nano Banana」として登場し、その性能の高さからAIコミュニティで大きな話題となりました。その後、Googleから正式に「Gemini 2.5 Flash Image」として発表され、そのコードネームが「Nano Banana」であることが公になりました。
この最新技術が、GoogleGeminiの入力画面で簡単に使えるようになっていました。
遠田幹雄の写真で試してみました
まず、遠田幹雄の写真でどれくらい一貫性を保ったまま洋服を変更できるかどうかを試してみました。スマホのGeminiアプリで実施しています。
元の写真はピンクの洋服です
元の写真はピンクのシャツです。「着ている服を赤に変更してください」というプロンプトで画像生成してみました。
赤いシャツになりました
すると出来上がった写真はこれです。あまり違和感なく生成されてますね。すごいです。
縦ストライプのシャツに変更
グレーの縦ストライプのシャツにしてもらいました。
紺で大柄な格子のシャツに変更
白ベースのシャツに大柄の格子で紺色というような簡単な指定でしたが、このような自然な画像に生成されました。
極彩色なアロハシャツに変更
極彩色のアロハシャツという指定だけでこんな画像が出力されました。これはすごいですね。
ラメラメな金色のシャツに変更
まるでマツケンサンバでも踊れそうな雰囲気に仕上がりました。いぇーい。
東京ぼんたの風呂敷のような昭和感満載のマーク(模様)のシャツに変更
若い人は東京ぼん太を知らないでしょう(笑)
でもGoogleは知っているのかな。なんだか微妙ではありますが、出来上がったシャツの画像としてはけっこういい感じになりました。
未来が来た!Geminiの画像生成AIが「別次元のパートナー」に進化した話
今回は、Googleの最新画像生成AI、通称「Nano Banana」(正式名:Gemini 2.5 Flash Image)をご紹介しましたが、その「すごさ」をまとめると、もはや単なる「お絵かきAI」ではない、まったく新しい次元に到達したと言えるでしょう。
これまでの画像生成AIが抱えていた「ちょっと惜しい」部分をことごとく解消し、私たちの創造性を拡張してくれる、まさに「クリエイティブ・パートナー」と呼ぶにふさわしい存在へと進化を遂げたのです。
ここが革命的!Gemini画像生成AIの「すごかった」3つのポイント
- キャラクターがブレない!驚異の「一貫性」 「同じキャラで別のポーズを…」とお願いしても、毎回別人のようになってしまう…。そんな悩みはもう過去のものです。Geminiは、一度生成したキャラクターの特徴を完全に記憶し、服装や表情、背景を変えても「ちゃんと、さっきのあのキャラ」を維持してくれます。これは、漫画や絵本の制作、企業のブランディングなど、あらゆる場面で革命を起こす可能性を秘めています。
- 「もっとこうして」が通じる!魔法のような「対話型編集」 生成された画像に対して、「この帽子を赤くして」「もっと笑顔にして」「背景を夜景に変えて」といった普段の会話のような言葉で指示するだけで、まるで魔法のように画像を編集してくれます。これまで専門的なソフトで何時間もかかっていた作業が、わずか数秒の「お願い」で完了してしまうのです。アイデアを即座に試せるこのスピード感は、試行錯誤の質を劇的に向上させます。
- 複数画像を「いいとこ取り」!常識を超えた「合成能力」 人物の写真と、背景の写真、小物の写真をそれぞれ用意して「この人物が、この背景で、この小物を持っている画像を作って」と指示すれば、違和感なく一枚の画像に合成してくれます。光の当たり方や影のつき方まで自然に調整してくれるため、まるで最初からそういう写真だったかのようなクオリティに仕上がります。
まとめ:創造性の主導権は、再び人間の手に
Geminiの進化は、私たちから仕事を奪うのではなく、むしろ面倒な作業や技術的な制約から解放し、人間が「何を創りたいか」という本質的な部分に集中できる時間を与えてくれるものです。
頭の中にしかない漠然としたイメージを、AIと対話しながらブラッシュアップし、一瞬で形にしていく。そんなSF映画のような未来が、もうすぐそこまで来ています。
今後、この驚異的な技術がどのようなサービスに組み込まれていくのか、目が離せません。ぜひ皆さんも、この「未来の片鱗」に触れて、新しい創造の可能性を感じてみてください。

この記事を書いた遠田幹雄は中小企業診断士です
遠田幹雄は経営コンサルティング企業の株式会社ドモドモコーポレーション代表取締役。石川県かほく市に本社があり金沢市を中心とした北陸三県を主な活動エリアとする経営コンサルタントです。
小規模事業者や中小企業を対象として、経営戦略立案とその後の実行支援、商品開発、販路拡大、マーケティング、ブランド構築等に係る総合的なコンサルティング活動を展開しています。実際にはWEBマーケティングやIT系のご依頼が多いです。
民民での直接契約を中心としていますが、商工三団体などの支援機関が主催するセミナー講師を年間数十回担当したり、支援機関の専門家派遣や中小企業基盤整備機構の経営窓口相談に対応したりもしています。
保有資格:中小企業診断士、情報処理技術者など
会社概要およびプロフィールは株式会社ドモドモコーポレーションの会社案内にて紹介していますので興味ある方はご覧ください。
お問い合わせは電話ではなくお問い合わせフォームからメールにておねがいします。新規の電話番号からの電話は受信しないことにしていますのでご了承ください。
【反応していただけると喜びます(笑)】
記事内容が役にたったとか共感したとかで、なにか反応をしたいという場合はTwitterやフェイスブックなどのSNSで反応いただけるとうれしいです。
遠田幹雄が利用しているSNSは以下のとおりです。
facebook https://www.facebook.com/tohdamikio
ツイッター https://twitter.com/tohdamikio
LINE https://lin.ee/igN7saM
チャットワーク https://www.chatwork.com/tohda
また、投げ銭システムも用意しましたのでお気持ちがあればクレジット決済などでもお支払いいただけます。
※投げ銭はスクエアの「寄付」というシステムに変更しています(2025年1月6日)
※投げ銭は100円からOKです。シャレですので笑ってご支援いただけるとうれしいです(笑)