【衝撃体験】AIエージェントでAIエージェントを操作してみた!~マルチAIエージェントの時代へ~【OpenAI Operator、Genspark Mixture of Agent】

【衝撃体験】AIエージェントでAIエージェントを操作してみた!~マルチAIエージェントの時代へ~【OpenAI Operator、Genspark Mixture of Agent】

今回は、AIエージェントを使って、他のAIエージェントやAIを操作してみようというチャレンジです。複数のAIエージェントが共同で動く仕組みを「マルチAIエージェント」と呼び、これからのビジネスにおいて非常に重要な技術となっています。難しい用語は使わず、実演を通じて分かりやすく紹介します。
今回使用するAIエージェントは、ブラウザを操作できるCUA(Computer Used Agent)の「OpenAI Operator」と、複数のAIを操作できるMOA(Mixture of Agent)の「Genspark Mixture of Agent」の2つです。難しく感じるかもしれませんが、やっていることはとてもシンプルなので、ぜひ最後までご覧いただき、この威力を体感してください。

▼目次
0:00 はじめに マルチAIエージェント
2:07 マルチAIエージェントとは
5:40 実演1 OpenAI Operatorで他のAIを操作する
8:10 実演2 Genspark Mixture of Agentで複数のAIを操作する
10:34 実演3 AIエージェントでAIエージェントを操作する
13:23 まとめ マルチAIエージェント

▼文字起こし

こんにちはAIキャンプの中村です。今回のテーマはこちら。AIエージェントがAIを操作―マルチAIエージェント衝撃の実演3戦。今回の動画は、AIエージェントを使って他のAIやAIエージェントを操作しちゃおうという内容になっています。難しい原理の話ではなく、実践を踏まえて分かりやすく紹介します。このAIエージェントに関しては私もまだ勉強中なので、もし動画の内容に誤りなどあればコメントで教えていただけるとありがたいです。今回のこの「AIでAIを操作する」という考え方をマルチAIエージェントと言います。この技術はすぐに業務に役立つというものではないのですが、おそらく数年後には実用化されるのではないかと感じています。今後、皆さんのビジネスやキャリア戦略を考える上で非常に重要な基礎知識となると思います。今回使用するAIエージェントは2つあります。1つ目が、今話題になっているブラウザを操作できるOpenAI Operator、そして2つ目が、複数のAIを同時に操作することができるGenspark Mixture of Agentです。なお、OpenAI Operatorに関する動画やジェンスパークのエージェントに関する動画は、こちらにアップしていますので、そちらの2本の動画を先にご覧いただくとより理解が深まるかと思います。本日の流れになります。まず、マルチAIエージェントとは何かについて紹介し、その後、3つの実演を紹介します。1つ目は、OpenAI Operatorで他のAIを操作しちゃおうということです。2つ目が、Genspark Mixture of Agentで複数のAIを同時に動かしていこう。そして3つ目は、AIエージェントでAIエージェントを操作してしまうという、チャレンジな内容となっていますので、ぜひ最後までご覧ください。このチャンネルでは、ChatGPTや生成AIに関する役立つ情報をお届けしていますので、よければチャンネル登録もお願いします。では、まずマルチAIエージェントとは何かについて紹介します。マルチAIエージェントの話に入る前に、そもそもAIエージェントとは何かというところを復習します。簡単に言いますと、ユーザーが設定した目標に対して必要なタスクを自立的に計画実行するAIだと思ってください。単なるチャット型AIが、指示待ちで回答するのに対して、AIエージェントはある程度自立的に行動してくれます。実は最近、私も気づいたのですが、ChatGPTもAIエージェントの1つと言えるかと思います。2023年11月に、ChatGPTは必要なツールを自立的に判断するように進化しました。普通、ユーザーがChatGPTに質問すると、LLMを持っているモデルの知識をベースに回答してくれます。しかし、最近のChatGPTは、例えば「今日のニュースを教えて」と言うと、勝手にWeb検索を走らせてユーザーに回答を返してくれます。また、「y=xのグラフを書いて」と言うと、自動的にコードインタープリターという内部アプリケーションを呼び出して回答する仕組みになっています。つまり、ChatGPTもわざわざ検索やコードインタープリターの使用を指示しなくても、ある程度自律的に回答できるように進化しているということです。では、今日の本題であるマルチAIエージェントについて紹介します。これは、名前の通り複数のAIエージェントが一緒に動くというものです。先ほどのChatGPTはユーザーと1対1で対応しているのに対して、マルチAIエージェントは一度に複数のAIが動いているという感じになります。もう少しイメージすると、ユーザーはメインとなるAIエージェントと会話するのですが、このAIエージェントは他のAIエージェントや他のツールを呼び出しながら作業を進めます。上司に例えれば、その裏側にいるAIたちが部下のような役割を担います。そして、このマルチAIエージェントの良いところは、業務が非常に便利になるという点です。たとえば、リサーチをしてそれを資料にまとめ、スライドにして内容をチェックし、メールを送るといった作業が、全てAIに任せられるとすれば、人が行うと100時間かかる作業が、1時間で終わってしまうかもしれません。この全ての工程を監視するのが上位のAIエージェントです。これがマルチAIエージェントと呼ばれる仕組みです。もちろん、実用化に至るまでには制度面など様々な課題はあると思いますが、もし実用されれば社会は本当に大きく変わる技術だと思います。それでは、1つ目の実演です。OpenAI Operatorを使って他のAIを操作していきます。まず、やりたいことを紹介します。やっていることは非常にシンプルです。OpenAI Operatorというのは、ブラウザを操作できるAIエージェントです。私が使っているのは、OpenAI Operatorを使って、例えばGoogleのGeminiという対話型AIを操作してみるというものです。やっていることは簡単で、私のChatGPT Proのアカウント(月額220ドル)でOperatorを起動し、Google Geminiの対話型AIチャットの画面を開いて、「卵焼きと目玉焼きのどちらが好きか」と質問するように指示します。実行すると、画面が立ち上がり、Google Geminiを検索して画面に表示され、ログインが必要な場合は自分で操作し、ログイン完了後、Operatorから「卵焼きと目玉焼きのどちらが好きか」という入力が行われ、実行ボタンが押されることで、Google Geminiが操作されるという流れです。これにより、上位のAIエージェントがAIチャットを呼び出して実行させることが確認できました。次に、2つ目の実演です。Genspark Mixture of Agentを使い、複数のAIを同時に操作します。こちらは、複数のAIを組み合わせて回答させることができる仕組みです。日本語では「共同エージェント」とも呼ばれます。Genspark Mixture of Agentは、ChatGPT、Gemini、Claudeの3つのモデルを同時に動かすことができます。実際に触ってみると、Gensparkのページの左側にエージェントのボタンがあり、そこから共同AIエージェントシステムである「ミクスチャーオブエージェント」を選択すると、3つのAIモデルが同時に動作し、例えば「目玉焼きには醤油かソースどちらがいいか」といった質問に対して、それぞれが特徴を整理した回答を生成し、互いに評価を行いながら最適な答えを出してくれるのが確認できます。最後に、3つ目の実演です。これは、AIエージェントでAIエージェントを操作するというものです。ここまでの実演1と2を組み合わせたもので、OpenAI OperatorでGenspark Mixture of Agentを起動し、その下で3つのAI(GPT、Claude、Gemini)が同時に動作する仕組みを利用して、上位のAIエージェントが下位のAIエージェントを指示するというデモンストレーションです。具体的には、GensparkエージェントのURLをOperatorに与えてブラウザで検索させ、ログイン後に共同AIエージェントシステムを選択、そして「卵焼きと目玉焼きのどちらが好きか」というプロンプトを入力させると、3つのAIが同時に回答を生成し、全体の作業が連動して進む様子が確認できました。このように、AIエージェントが他のAIやAIエージェント、さらにはツールを手足のように動かしている仕組みを実演することで、将来的に働き方やビジネス戦略を根本から変えるほどのインパクトがある可能性を感じさせます。現在は制度面や技術面でまだ実用的ではないかもしれませんが、先端のビッグテック企業を中心に巨大な投資が進んでいることから、今後の進展に大いに期待できる分野です。今回は、AIエージェントがAIを操作するというテーマで、マルチAIエージェントの仕組みと実演を紹介しました。以上、今回は以上です。ありがとうございました。