【新登場】Googleの新たな画像生成AI「Whisk」で画像を合成!?おしゃれな壁紙を作ってみた!【Gemini×Imagen3】

【新登場】Googleの新たな画像生成AI「Whisk」で画像を合成!?おしゃれな壁紙を作ってみた!【Gemini×Imagen3】

今回は、Googleから新しく登場した画像生成AI「Whisk」について紹介します!Whiskは、複数の画像を合成・融合して、直観的に新しい画像を作ることができるので、いままでの画像生成AIとはまた別の楽しさがあります。今回は、このAIを用いて壁紙を作成してみましたので、ゆるく紹介します。

▼目次
0:00 はじめに
0:45 Whiskを触ってみよう
1:28 GoogleブログによるWhiskの解説
3:14 Whiskで画像合成をしてみよう
5:56 カプセルトイスタイルで壁紙作成に挑戦!
8:42 まとめ

▼文字起こし

こんにちは、AIキャンプの中村です。今回のテーマはこちら、「Googleの新たな画像生成AI『Whisk』で画像を合成!?おしゃれな壁紙を作ってみた!」こんなテーマでお届けします。今回は、Googleから登場した新しい画像生成AI「Whisk」を使っていきます。これは、複数の画像を融合して新しい画像を作成できる、とても面白いモデルになっています。では、早速試してみましょう!スタイルとモデルを選択すると、画像を合成できる仕組みになっています。例えば、「カプセルトイ」「お弁当」「ぬいぐるみ」など、さまざまなスタイルで画像を作ることができます。では、まず「お弁当」にしてみましょう。うちには「AI社員 蒼井さん」というキャラクターがいるので、これをお弁当と組み合わせてみます。画像をアップロードすると、生成が始まります……できました!いかがでしょうか?お弁当とキャラクターが融合した、新しい画像が完成しました。最近、真面目な投稿が続いていたので、今回はこういった楽しい内容を紹介してみようと思います。今回紹介するのは、GoogleのAI「Whisk」です。コンセプトは「頭の中のアイデアをパッと形に」。2025年2月12日に公開された、新しい画像生成AIです。Googleの公式解説ページによると、Whiskは詳細なテキストプロンプトを入力しなくても、画像プロンプトとして活用できるのが特徴です。つまり、テキストから画像を作るのではなく、既存の画像をアップロードして、それをもとに新しい画像を生成するモデルですね。画像を選択してWhiskに入力するだけで、簡単に始めることができます。現在は英語での利用が推奨されているようですが、モデル・シーン・スタイルを組み合わせて画像を作成できます。たとえば、「猫のカプセルトイ」「ぬいぐるみ風の人物」など、さまざまなパターンが可能です。技術的には、GoogleのAI「Gemini」が詳細なキャプションを作成し、最新の画像生成AI「Imagen3」が実際の画像を生成しているとのこと。Imagen3は現実世界の画像を高精度で生成できるAIとして知られているので、その技術が使われているのは非常に魅力的ですね。では、さらに試してみましょう!次は「ぬいぐるみ」にして、女性キャラクターの画像をアップロードしてみます。……いいですね!こんな感じで、キャラクターがぬいぐるみ調になりました。さらに、Whiskには「サイコロ」ボタンがあり、押すたびに新しいアイデアを自動生成してくれます。では、クマの画像を生成し、ファンタジーの世界の背景を設定して、絵画風にしてみます。……できました!ファンタジーの世界に溶け込んだ、紙のイラスト風のクマの画像が完成しました。さらに、もっと実験してみます。燃えている猫、クマ、そして以前作った猫の画像、この3つをアップロードし、スタイルを「バーのような空間」、仕上がりを「ぬいぐるみ風」に設定してみます。……おお、すごい!猫とクマ、燃えているキャラクターがバーの中でぬいぐるみになりました。こういう無茶な指示でも、意外といい感じに仕上がるのが面白いですね。Whiskのもう一つの特徴は、テキストから画像を生成する機能です。試しに「Dog」と入力して犬の画像を作成し、それを他の画像と組み合わせてみます。……右側はいい感じですが、左側はちょっとミスっていますね。でも、犬の要素もきちんと含まれていて、面白い結果になりました。今回、一番面白いと思ったのは、実写の写真をモデルにできることです。試しに、自分の写真をアップロードし、背景を「バー」、スタイルを「ぬいぐるみ」に設定して、AI秘書「蒼井さん」の画像と組み合わせてみます。……おお、いいですね!私と蒼井さんが会話しているような画像ができました。さらに、いろいろ試してみます。カプセルトイのスタイルで、自分の写真をアップロード。……可愛くなりすぎましたが(笑)、しっかりカプセルトイに入っていますね。では、自分と蒼井さん、会社のロゴを組み合わせてカプセルトイに入れてみましょう。……おお、いい感じですが、ちょっと私の顔が2つに分裂していて不思議なことになっています(笑)。さらに、自分・副代表・ロゴの3つをカプセルトイに入れてみます。……いいですね!しっかりとカプセルの中に収まっています。では、さらに猫やAIの蒼井さんも加えてみましょう。キャラクターが増えると破綻しそうですが……あ、意外といけましたね!すごい!猫も、ロゴも、ちゃんと入っています。では、もっとキャラクターを増やしてみます。私、蒼井さん、ロゴ、副代表、猫、カメラを持っている蒼井さん、ビールを持っている蒼井さん……7人(?)も入れてみます。これはさすがに破綻するのでは?……あれ、ちゃんと作られていますね(笑)。ただ、人物が2人に増えたり、猫が女の子になったりしています。細部の破綻はありますが、全体の雰囲気はつかめていますね。試しにもう1回生成してみます。……今度はカプセルトイ感がなくなり、宇宙船っぽくなってきました。でも、特徴は捉えていますね。こういう風に、人数が増えていくと破綻しやすくなるようですが、3〜4人くらいなら安定して描写できそうです。ちなみに、私はWhiskで作った画像をデスクトップの壁紙に設定しています。セミナーなどで見せると、「これどうやって作ったんですか?」と聞かれるので、ちょっとしたAIの遊びとしても面白いですね。他にも、自分をチョコレートにしたり、ステッカー風にしたり、子どもたちの写真を加工したりと、いろいろ試してみました。本物の写真を使うときは注意が必要ですが、工夫次第でさまざまな使い方ができそうです。ということで、今回はGoogleの新しい画像生成AI「Whisk」を使って、画像を合成しながら壁紙を作ってみました。たまには、こんなゆるい遊びもいいですね。皆さんもぜひ試してみてください!それでは今回は以上です。ありがとうございました!