【画像生成AIバトル】Gemini vs ChatGPT!仕事で使えるのはどっち?(Gemini 2.5 Flash Image, Nano banana)

【画像生成AIバトル】Gemini vs ChatGPT!仕事で使えるのはどっち?(Gemini 2.5 Flash Image, Nano banana)

今回は、新登場の画像生成AI「Gemini 2.5 Flash Image」(通称 Nano banana)と、ChatGPTの画像生成AIについて徹底比較していきます。文字入力に強いChatGPT、キャラクター編集、一貫性の維持、画像融合に強いGeminiの能力を比較しながら、その活用法を考えていきましょう。

▼目次
0:00 オープニング
0:17 最新画像生成AIバトル:Gemini vs ChatGPT
1:07 Geminiの画像編集力がすごい
2:15 GeminiとChatGPTの能力比較
3:18 Gemini 2.5 Flash Imageの概要と使い方
4:18 人物画像の一部の変更
5:05 画像を融合する
5:56 人物を動かすと別人になることが多い(セマンティックマスク)
7:22 Gemini vs ChatGPT 画像生成AI対決
8:06 ①広告風の人物生成
9:00 ②解説マンガ
9:48 ③グラレコ
10:31 ④議事録をLINEスタンプに
11:49 ⑤人物画像を編集
13:39 ⑥アニメキャラを編集
15:17 ⑦時間を経過させる
16:34 ⑧3つの画像を融合
17:39 ⑨ラフスケッチからポーズを生成
18:49 ⑩添付キャラとロゴを元にバナー作成
19:59 まとめ

▼文字起こし

こんにちは、AIキャンプの中村俊也です。今回のテーマは、最新画像生成AIガチバトル!ChatGPT vs Gemini!仕事で使えるのはどっち?ということで、Googleから登場した最新の画像生成AIとChatGPTの画像生成を比較していきます。2025年3月にはChatGPTの画像生成が社会現象と言われるほど話題になり、2025年8月にはGoogleの最新画像生成AI「Gemini 2.5 Flash Image」も公開されました。通称ナノバナナと呼ばれ、精度がものすごく高いとネットで大きな話題です。Geminiの強みは何と言っても画像の編集力。一貫性を維持した編集が得意で、例えばビールを持つ女の子の画像をベースに「海賊の帽子とバナナを持たせて」と指示すると、キャラクターのまま自然に変換してくれます。複数画像の融合も可能です。一方で弱点もあり、ゼロからテキストでキャラを生成する部分は突出しておらず、日本語テキスト入力はまだ弱め。純粋な“生成”ではChatGPTや画像生成AIで有名なMidjourneyの方が優れていると感じる場面も多いです。総じて、Geminiの画像生成AIは“生成ツール”というより“編集ソフト”に近い立ち位置。各種スコアでも画像生成そのものの能力はChatGPTと大差なく、文字入力はChatGPTが優秀という印象です。ただし編集・維持の能力は頭ひとつ抜けていて圧倒的。今回は特にここを中心に紹介します。ということで、10本勝負!Gemini vs ChatGPT!仕事で使えるのはどっちだ?最後までご覧ください。このチャンネルではChatGPTや生成AIに関する役立ち情報をお届けしています。よければチャンネル登録もお願いします。まず「Gemini 2.5 Flash Image」の概要と使い方。Geminiアプリでモデル「Gemini 2.5 Flash」を選択し、「犬の絵を描いて」などと入力して画像生成ボタンを押すか、プロンプト内で「画像を作って」または英語で「Generate an image」と指示すればOK。最初に試してほしいのは2つ。①人物画像の一部を変更する、②画像を融合する。AIキャンプのスタッフの写真を添付して「金髪にして」と送ると、元画像をベースに新しい画像を素早く高精度で生成します。ChatGPTと比べても非常に速くて精度が高く、現状最強AIの一角と感じます。髪色以外(顔・服・背景)はそのままで、一貫性が保たれているのが分かります。次に画像融合。写真とTシャツ画像の2枚をアップして「この女性にTシャツを着せて」と指示すると、AIキャンプのロゴ入りTシャツを自然に着せ替えてくれます。皆さんも手元の写真で編集や服装チェンジを試してみてください。なお、スタッフの許可を得て実演していますが、他人の肖像や著作物の無断使用はNGなのでご注意を。注意点が1つ。人物の向きやポーズを大きく変えると別人になってしまうことが多いです。「振り向いて」といった指示では顔が変わることがあります。これは新たに画像を“生成”し直すため、100%同一人物の再現は難しいためです。一方、向きを変えずに「髪色だけ変えて」など部分編集ならOK。「セマンティックマスク」という技術で、会話形式の指示から髪など特定部分だけを編集し、顔や服、背景はそのまま保つので一貫性が維持されます。ではここから「Gemini vs ChatGPT」画像生成AI対決・10本勝負!まずは画像“生成”系の4本。①広告風の人物生成:飲料広告風の画像を作成し、右側に日本人の若い女性、左側は空白と指示。Geminiは右に女性、左に余白という狙い通りの出力。ChatGPTも良好で、ここは好みの差レベル。引き分け。②解説マンガ:卵焼きの作り方を4ステップで、猫が日本語で可愛く解説する文字入り画像を生成。Geminiは日本語テキストが文字化けし、ステップも不足。ChatGPTは一部漢字の誤りはあるものの、4コマの流れで猫が可愛く説明。これはChatGPTの勝ち。③グラレコ(グラフィックレコード):指定文章を分かりやすく図解。Geminiはテキストが崩れ、イラストは良いが文字が使い物にならず。ChatGPTはシンプルで読みやすく、「大阪万博に行くベストの日」なども正確に図解。ChatGPTの勝ち。④議事録をLINEスタンプ風に:可愛い魚キャラが挨拶するスタンプ風画像をマンガ調2×2グリッドで、議事録の内容から短いメッセージ付きで生成。Geminiは4コマ風にはなるが文字が弱く、スタンプっぽさも不十分。ChatGPTは2×2でスタンプらしく、学びの要点も伝わる。ChatGPTの勝ち。ここまでの“文字入り生成”は総じてChatGPTが強い。一方で“編集”はGeminiの見せ場。続いて画像“編集”系の6本。⑤人物画像の編集:これは明らかにGeminiが強力。髪色変更など部分編集で一貫性が高い。⑥アニメキャラの編集:AIキャンプの社員キャラ「AIあおいさん」で、テニス・スノボ・居酒屋で乾杯などを指示。Geminiは躍動感ある可愛い出力。ChatGPTも元のイメージを保った良い結果で、ここは引き分け。⑦時間経過の表現:居酒屋の写真に「2時間後にして」と指示。Geminiは頬が赤くなり食べ物やビールが増えるなど、現実の推移を推論して自然に“2時間後”を表現。ChatGPTは雰囲気の変化が乏しく弱め。これはGeminiの勝ち。⑧3つの画像を融合:女性・猫・椅子の3要素を融合し「女性が猫を抱きかかえ椅子に座る」画像を生成。Geminiは人物と猫の一貫性を保ったまま自然に融合。ChatGPTは人物や猫の細部が少し変わってしまうことがあり、実写系はGeminiに軍配。アニメ調では両者とも優秀。⑨ラフスケッチからポーズを作る:Tシャツ画像+人物写真+スケッチのポーズを指定して合成。Geminiはほぼスケッチ通りの構図で、AIキャンプのTシャツを着せた一貫性の高い出力。ChatGPTは「お前誰だよ」状態でポーズの一致度が低い。これはGeminiの勝ち。⑩添付キャラとロゴでバナー作成:いわゆる「ヤムール風プロンプト」を使って、キャラ画像とロゴからバナーを生成。Geminiは文字化けや人物の変化、サイズ不整合が出やすく難易度高め。ChatGPTは文字入れが得意で一発で形になることが多く、ここはChatGPTの勝ち。以上、10種類の活用法を紹介しました。まとめると、テキストが入る生成物(解説マンガ・グラレコ・バナー・スタンプ風など)はChatGPTが強い。一方、人物写真の部分編集や一貫性維持、時間経過の表現、複数素材の自然な融合、スケッチ準拠のポーズ再現といった“編集・維持”はGeminiが圧倒的。使い分けは「テキスト生成ならChatGPT」「人物の編集ならGemini」。意外だったのはアニメ系の画像編集はどちらもとても優秀で、用途やプロンプト次第で選べるという点でした。今回は以上です。ありがとうございました。