ChatGPTの新しい画像生成AI「4o Image Generation」がめちゃ便利なので実演します!

ChatGPTの新しい画像生成AI「4o Image Generation」がめちゃ便利なので実演します!

今回はChatGPTに新しく登場した画像生成AI機能「ChatGPT 4o Image Generation」について紹介します!この画像生成AI機能は、以前の画像生成AI「DALL-E3」よりもはるかに高精度となり、リアルさ、文字の正確さ、画像の一貫性などが飛躍的に向上しています。簡単なプロンプトで4コマ漫画や解説画像が作れるため、とにかく「便利」になりました。今回はOpenAIのHPを参考に、様々な活用例を実演します。

▼目次
0:00 はじめに ChatGPT 4o Image Generation
0:37 基本的な使い方
4:12 画像の一貫性をキープ
5:27 リアルさ、文字、一貫性の向上
6:30 四コマ漫画・解説画像の作成
8:15 今回のアップデートの肝は「便利さ」の向上
8:55 アップ・生成画像を編集・加工できる
10:19 キャラクターを編集する
11:50 検索×画像生成の組み合わせ
13:29 細部に強くなった
15:05 AIが持つ知識を活用する
16:23 その他の活用例
18:10 弱点・補足
20:16 おわりに ChatGPT 4o Image Generation

▼OpenAIの公式ページはこちら

▼文字起こし

こんにちはAIキャンプの中村俊也ですChatGPTから新しい画像生成AIの機能が登場しました見てくださいこちらAIについて解説する4コマ漫画を日本語で書いてサイズは1対1と指示するだけでなんと一発でこのレベルの画像ができるということですね現在ChatGPT4を使える全ユーザーにこちらの新しい画像生成機能が登場しましたのでこちらを今日は解説させていただきますこのチャンネルではChatGPTや生成AIに関する役立ち情報をお届けしますよければチャンネル登録もお願いしますはいそしたらこちらがOpenAIのホームページになります2025年3月25日ChatGPT4.0イメージジェネレーションという名前で新しい画像生成AI機能が登場しました今回OpenAIからこの新しいイメージジェネレーションの機能についてものすごく詳細なウェブサイトが公開されていますのでOpenAIのこのサイト参考にしながらいろいろ試してみたいなと思いますはいそれでは読んでいきたいなと思います4.0画像生成の紹介ということです説明には正確で精密なフォトリアリスティックな出力が可能なネイティブのマルチモーダルモデルを利用して有用で価値のある画像生成を実現しますと書いてあります一言で言うとこの画像生成AIがめちゃくちゃ便利ですごくなりましたよということになりますこの画像生成の機能をGPT-4のモデルに組み込んだということになります美しいだけでなく便利な画像生成が実現しましたということですこういうのを待っていたんですよ単に美しい画像じゃなくてちゃんと仕事で使える便利な画像生成AIが欲しかったので今回は攻めてくれたということになりますでは早速見ていきましょう1個目の事例からもうとんでもないんですけどこれがChatGPTで作られた実際の画像になるそうですプロンプトはこんな感じでベイブリッジを見下ろす部屋にあるガラスのホワイトボードを携帯電話で撮影してるこの人が撮影してベイブリッジが映ってますねガラスのホワイトボードにOpenAIのロゴの入ったTシャツを着た女性がこんなものを書いているということになります実際にこのプロンプトを修正しながらやっていこうかなと思います使う時はこの3点ボタンから画像を作成するという新しいアップデートのあった機能を有効にした状態でプロンプトを打つといいかなと思います今回は背中の文字をAIキャンプの文字に変更してTシャツを着た日本人の女性にしてこれをやってみようかなと思いますテキストが結構長いのでこの辺は少し変えてAIは大量のデータを学習してなんとかかんとかっていう2行ぐらいの日本語の文章にしておこうかなと思いますではこの状態で生成をしてみたいと思いますはいそうするとこの画像生成結構時間がかかってじっくりと作り込んでくれていますこんな感じでモヤモヤの画像ができていて上からだんだん解像度を上げていくみたいな感じになってますねということで出てきましたちょっと見ていきましょうすごいですねベイブリッジを見下ろすガラスなんかちょっと物理的におかしいことになってますけどAIキャンプのテキストが書かれていた日本人の女性をカメラで撮影しているということですね文章はAIは大量のデータいいですね学習なんかちょっと文字が崩れてますねパターンをつけ人間のように判断や予測を予測ちょっとおかしくなってますねしますこの仕組みの中心にはニューラルネットワークと呼ばれるモデルがありますということですね一部変なところありますけど日本語もかなりいいんじゃないかなと思います多分英語のほうがいいかなと思うのでもう一息というところなんですけど日本語でもかなりいいですね今回さらにすごいのは単なるこの画像生成だけではなくてこの画像に対してさらに別の画像を作ることができるんですよね例えば彼女が振り返ってハイタッチをするカメラマンの自撮り写真って打っていくと上の元にある画像がこんな感じでハイタッチした写真に変わるっていうことでこれすごいですよね画像の一貫性がキープされたまま新しい画像を作ることができるということですじゃあこれでやってみましょう彼女が振り返ってハイタッチするカメラマンの自撮り写真と打ってみたいと思いますということでできましたいかがでしょうか先ほどのこちらの女性灰色のTシャツを着てAIキャンプって書いてあるショートカットのこちらの女性が撮影していたカメラマンとハイタッチをしてるって感じで画像の一貫性ができていますねかなりいいんじゃないかなと思いますちなみにこちらのテキストを真似して私実際に生成してみたところちゃんと似たようなのができましたのでかなりいいんじゃないかなと思いますすごいですねこれ本当に写実が高くなってるかなと思います英語はやっぱり素晴らしいですねこの時点で3つほど今までの画像生成AIと大きな変化が感じられるんですけどまずリアルな写真調の画像です実はChatGPTに搭載されていたDALL·Eという画像生成AIはリアルな写真を作るのが難しかったんですけどかなりリアルで本物に近い画像ができているかなと思います若干日本人の顔は多少苦手かもしれないですねあとテキストを生成する能力はものすごく高くなっています日本語ですらこのレベルなので英語に関してだともう本当に文句なしっていうレベルになってきたんじゃないかなと思いますそしてこの一貫性ですね単に画像を作るだけではなく事前にアップした画像とか先ほど生成した画像に対して同じ人物を登場させるとか同じシーンで作っていくみたいなこういう新しい使い方ができるということです本当素晴らしくなったかと思います続いて4コマ漫画みたいのも作れるっていうのがありますので実際にやってみますねAIについて解説する4コマ漫画を日本語で書いてサイズは1対1ってやりました今回テキストをお任せしようかなと思ってやってみたところちょっとした漫画なら一瞬で作れてしまうということで大変素晴らしいですね続いて科学実験のこんな感じの図も作れるそうですニュートンのプリズム実験を詳細に説明したインフォグラフィックスってやるとこんな感じの画像ができるそうです最近ClaudeとかGeminiでもすごく視覚的にわかりやすい画像が作れるっていうのがあったんですけどついにChatGPTでもこれが作れるようになったということですねこれすごいんですけど公園かなの丸いカフェのテーブルでノートにこの絵を書いている人の視点を生成しますってやると今の書いたこのプリズムの解説の図が若干しますけどノートで書いているさらにそこからプリズムを取り出しているとか同じシーンで作っていくみたいな一貫性のある画像を作ることができるそうですでは実際に私もやってみたいと思うんですけどこの画像に対して富士山が見える綺麗な公園のテーブルでノートにこの漫画を書いている日本人の若い男性の視点を生成しますと打ってみましたそうするといかがでしょうか先ほどの画像がここで書いている男性かどうかわからないですけど富士山が見える綺麗な公園のテーブルで日本人が漫画を書いてるということで完璧ですね素晴らしいですね今までこれできなかったのでかなり感動かなと思います便利な画像生成今日の生成AIモデルは超現実的で息を飲むようなシーンを思い起こせることができますが人々が情報を共有したり作成したりするために使用する主力のイメージには留意しています今までの画像生成AIってすごい綺麗なものを作るんですけど例えば情報を共有するチラシを作ったり漫画で何かを伝えたりとかそういうことができなかったんですよね今回ロゴとか図とか共通の言語や経験を示すシンボル追加するとイメージは正確な意味を伝えることができるようになったということですアップロードした画像を変換することもできると書いてありますのでこれですかねこの画像をアップしたらこんな感じで変換できるということですね例えば猫の画像をアップして帽子を被らせたりRPGのゲームのキャラクターにするとかゲームの中に登場させるみたいなこともできるそうですすごいこのカードをカメラで映した映像に変えていくとかそんなこともできるそうですステッカー熊のステッカーを作って灰色に変更させて豪快で口の周りを赤い汚れをつけるとかそんなこともできるそうですでは実際に私もやってみようかなと思いますOpenAIの説明でロゴをアップするみたいな話があったので私たちAIキャンプのロゴをちょっとアップしてこれを赤色に変更してくださいって指示を打ってみましたそうするとできました見てください皆さんこれはい青で書かれていたロゴが赤色に変更されましたしかもこのロゴの形はそのまま固定されていると思いますので文字に関してはちょっと新しく生成し直してるかなって印象ですね素晴らしいですねこんな感じで画像編集的な使い方Photoshopとかイラストレーター的な使い方がついにできるようになったということですねはいそしたら私たちAIキャンプにはAIあおいさんっていうキャラクターがいますのでこの画像のキャラクターをアップした状態で帽子を被せてと指示をしてみましたそうするとなかなか顔が変わってしまいましたけどだいぶいいですね一貫性のある感じになりましたいいですねこのキャラクターに帽子を被せるみたいなところがいいかなと思います個人的にはこの画像のキャラクターを固定する能力に関してはMidjourneyとかに比べてしまうとこの画像の表情とかキャラクターの顔を固定する能力は若干劣るのかなと思うんですけどある程度ならできるってこともわかりましたそれではこのキャラクターを使用してChatGPT画像生成と書かれたアイキャッチ画像を作って16対9って感じの横長がっていうふうに指示をしていますじゃあこれでできるでしょうかということでできましたいいですねちょっとこれ文字が切れてしまったのが残念なんですけどChatGPT画像生成文字も完璧ですね帽子をかぶって虫眼鏡を持ったAIあおいさんのキャラクターがこんな感じのアイキャッチ画像に変換することができるということですめちゃくちゃいろんなことできるなと思いました何度もお伝えしていますけど単なる画像生成AIというよりもPhotoshopとかイラストレーターとかCanvaとかそちらの使い方にかなり近いのかなと思いました今回面白いなと思ったのがこのマルチターン生成なんですけど単なる画像生成AIモデルだけではなくGPT-4.0のモデルにネイティブに搭載されているということなので例えばGPT-4の他の能力とか連動させて使うことができるということですね検索と一緒に使ってみようかなと思いますこれ検索機能をオンにした状態で画像生成オンにするとどっちかが消えてしまうので基本的には一つずつ使う感じになるかなと思います例えば私たちの会社のAIキャンプのウェブサイトをちょっと要約してもらおうかなと思いますということで私AIキャンプのサイトを要約してくれましたこの状態で画像生成を有効にしてこのサイトの情報を4コマ漫画でまとめてそしたらこの検索をして引っ張ってきた情報に対して4コマ漫画でまとめてって感じで画像生成を動かしてみたいなと思いますできるでしょうかいけますねこれすごい検索機能を使って回答させた後に画像生成するみたいなことができるのでこの組み合わせ次第では本当にできること可能性無限大なのかなと感じましたということで残念ながら微妙なところもありますけど漫画もこうやって作ることができるのでウェブサイトの情報を分析しつつそれを画像にしてしまうみたいなこともできるということです今回すごいですねGPT-4.0の画像生成は細部にまで注意を払っているということで最大10個から20個ぐらいの物体を処理できるということですねこれ結構すごいなと思ったんですけどこんな感じの物体を16個同時に生成できるということですねこれもやってみたいなと思いますせっかくなのでChatGPTに書いてもらおうかな赤い三角形青い星のような16個のオブジェクトを箇条書きでリストアップしてとお願いしました16個出てきたのかなこれを画像生成を有効にして音声入力でいきますねこの16個を4.0のホワイトボードにカラフルに記述してくださいということで音声入力でやりましたということで生成されました16個できてるかな1234567 15個ですね残念ながら16個はできていないのと4下4っていうふうにはなってくれなかったので一部破綻がありますけどこれだけたくさんの物体に対しての指示がある程度通っているってところがいいかなと思いますたくさん打つとやっぱ破綻も大きくなるんじゃないかなと思います他にはほんの少し赤ワインが入ったっていうここにちょだけワインが入っているとか見えない象を出すってことでここに象がいるんじゃないかみたいな映像が出てきたり数式のこんな感じのものもしっかりと書けるみたいなことになっていますChatGPT自体が知識を持っているのでいろんなことを解説もできるそうです例えばカクテルの解説を付け加えていったりすごいですねサンフランシスコがなぜ霧深いのかを説明するものを作成してくださいみたいな感じとそこの説明文が出てきたりクジラのガイドがこうやって出てきたり抹茶の説明とか作り方こんなこともできるそうですちょっと私もなんかやってみようかなと思います卵焼きの作り方をガイドした画像を作成してくださいと入力したらHow toメイク卵焼きってことで出てきました1番卵を割ってないね卵を溶いて巻いてくるくる巻いて焼くみたいなこれ多分1発で作ると画像生成AIにちょっと丸投げする感じになってしまうのでまずテキストは卵焼きの作り方を4つの手順で説明させてこのテキストを修正してから自分で画像生成するほうがいいのかなと思いますここは皆さんの使い方次第かなと思いました他の事例も見ていこうかなと思います道路標識ということでこんな感じの魔女が道路標識を見てるみたいな画像も作れるそうです他にはこんなメニューブックを作れたり結婚式の招待状を作れるみたいなものがありますではメニューブックのプロンプトせっかくなので英語でやってみようかなと思いますこのプロンプトそのままコピーさせていただいてということでできました見てください料理のメニューねちゃんと指示を出しただけでこんな感じの料理のメニューも勝手に画像も作ってきたということなので明らかにレベルアップしてることがわかるかなと思いますあとはユーザーがアップロードした画像を分析してさらに画像生成ができるっていうところの他にも事例がいっぱい出てましてこんな感じの画像をたくさんアップしてまた新しい画像を作るとか青いチェーンソーを作らせてそれをおばあちゃんが四面鳥を切り分けてキャッチフレーズを追加したりとかすごいな女性のこの画像に対して写真調にしてみたり建物のイラストここから写真調にしちゃうとかそんなこともできるということですあとはかなりフォトリアリズムということで本当に現実の映像にかなり近づいたということですこんな感じの男性とか猫で虎が水面に写ってますね人物と写真調とか面白い画像がいっぱいできるのでやっぱChatGPTの画像生成AIちょっと最近しょぼかったので本当にかなり他のAIと比べても遜色ないレベルになってきたかなと思います一応弱点もあるということですね例えば縦長のポスターやると下が切れちゃうよとか一部間違った情報が生成されたりこのぐらい数が多くなると破綻しちゃうよとかグラフが微妙に違う多言語で翻訳ってやるとちょっとできないところがあったり編集の精度にちょっと文字が限界があったりあまりにも小さい文字だとできないということですねこの辺り当然かなと思うんですけど今後はこの辺もどんどん改善されてくるそうです個人的には生成したこの画像を自分で手作業でちゃちゃっと編集できたらすごくいいなと思うんですけど私まだやり方がわからないんですけどそういうことができるようになってくると本当にいいのかなと思います他には本日より無料版ユーザーにも開放されているってこと動画生成AI空の上でも使えるということです今までの画像生成AIこれはDALL·EっていうんですけどDALL·EをGPTを通じて使うことができるということなのでGPTを探すってところからDALL·Eですねこれですねここを選択してもらうとOpenAIの昔の画像生成DALL·Eを一応ここで触れますよということですただ私今回のモデルを触ってて思うんですけどもうこのDALL·Eを使うことはないのかなと思ってました今後はAPI経由でいろいろ使えるということなのでこの辺りもとても楽しみですあとは透かしデータっていうメタデータがついているので画像生成で作られたものですよっていう識別マークがついていたり暴力的な表現とか性的なものに関しては出てこないみたいなことが出ていますね著作権については特に何も記載がなかったんですけど引き続き生成された画像が著作権侵害等にならないのかAI関係ないんですけど外部に発信して本当にいい情報なのかってところはよく考えながら使っていただけるといいかなと思いますということで今回は新しく登場した4.0イメージジェネレーションChatGPTの新しい画像生成AIについて紹介させていただきましたこれからこの生成AIの画像領域ってのはかなり進化して様々なユースケースが出てくると思いますので皆さんも引き続き情報を追いかけていただければなと思いますそれでは今回は以上ですありがとうございました