【速報】MicrosoftがChatGPTとClaudeを組み合わせた最強リサーチAIを発表!「Critique」と「Council」実演|Microsoft 365 Copilot

今回は、2026年3月30日にMicrosoftが発表したマルチモデルDeepResearch機能、「Critique」と「Council」という2つの新リサーチAIツールについて徹底解説します。GPTとClaudeという最強のAIモデルを組み合わせることで、これまでになかった高精度かつ多角的なリサーチが可能になります。「モデルを組み合わせる」という手法は今後も強力な手段になりそうなので、ぜひ慣れておきましょう。
▼目次
0:00 はじめに:Microsoft 365 Copilotの最新リサーチAI機能
1:47 新リサーチ機能「Critique」と「Council」の概要
7:05 Critique機能の実演
13:10 Council機能の実演とCritiqueとの比較
18:45 まとめ
▼文字起こし
こんにちは、AIキャンプの中村です。今回のテーマはこちら、マイクロソフトから新発表、最強の新リサーチAIツールが誕生しました。ChatGPTとClaudeがまさかの夢の合体、こんなテーマでお届けさせていただきます。今回は2026年3月30日、Microsoft 365 Copilotに登場した2つのAIモデルを組み合わせた最強リサーチ機能を実演解説させていただきます。まさに私たちが待っていたような機能がついに登場したわけですね。生成AIで調べた情報ってどこまで信用していいの?とか、リサーチAIってどのモデルを使えばいいの?こんな悩みを持っている方って結構多いんじゃないかと思います。そこでMicrosoftは2つのモデルを組み合わせるという手段を用いることで、強力なリサーチ精度を実現しました。具体的には今最も注目になっている2つのモデル、OpenAIのGPTとAnthropicのClaudeという2つのAIのモデルが一緒に調査してくれるというモデルになっているわけです。そこで今回はMicrosoftの新リサーチ機能の解説と実際の使い方を紹介させていただきます。流れとしてはまず概要を説明させていただいた後、2つのリサーチ機能を紹介させていただきます。これはちょっと読み方が難しいのですが、1つはCritiqueという機能、もう1つはCouncilという機能がありますので、この2つのリサーチ機能を実演させていただきます。今回の動画を見ていただくと、現時点で最高性能を誇るMicrosoft 365 Copilotのマルチモデルディープリサーチの概要と活用法がわかるようになりますので、ぜひ最後までご覧ください。このチャンネルではChatGPTや生成AIに関する役立ち情報をお届けします。よければチャンネル登録もお願いします。それではMicrosoftの新リサーチ機能の概要を説明させていただきます。こちらがMicrosoft 365 Copilotのチャットツールになるのですが、このMicrosoft 365 Copilotのチャットの中には左から様々なエージェントを選ぶことができます。この中にはリサーチャーというのとアナリストという2つのリサーチエージェントがあるのですが、このアナリストというのがExcelみたいな数値分析、リサーチツールというところがテキストなどの情報を分析するのに適しているものということになります。このリサーチャーエージェントというものが日々すごく進化をしておりまして、いわゆるChatGPTとかGeminiでいうところのディープリサーチみたいな感じで、時間をかけて非常に高精度なリサーチを達成してくれるツールだと思ってください。このリサーチツールというのは単にウェブサイトの情報を見るだけではなくて、Microsoft 365の中にある例えばSharePointとか、チャットとか会議内容とか社内データも参照しながら回答することができるというところが非常に強力なツールになっているわけです。このリサーチツールというのはもともとマイクロソフトの裏側はGPTだったので、GPTをベースとしたリサーチ機能が走っていたのですが、2026年に入りAnthropicのClaudeというモデルも使えるようになったんですよね。ここで一つ疑問があって、GPTとClaudeってどっちでリサーチをかければいいんだろうというのが正直私のような人間からしても正直よくわからないというのが現実かと思います。そこで今回登場したのが、このGPTとClaudeのモデルを一緒に使っちゃおうという機能が2つ登場しています。この自動というところをまず押していただくと、ここに書いてあるのですが、これ見えますかね、GPTが応答しClaudeが改善しますと書いてあります。つまりGPT、つまりChatGPTのモデルであるGPTが検索リサーチをかけてClaudeがそれをチェックするみたいな感じで、まるで部下がチェックした内容を上司がチェックするみたいな、そういうのがこの自動モードということになります。一方でこのモデル会議という方は何かというと、GPTとClaudeがそれぞれリサーチをかけていくということです。つまり2人の調査員がそれぞれ調べ物をしてきて、それぞれを比較融合していくというそんな使い方になるということになります。現段階ではフロンティアモデルといって実験段階の機能になりますので、まだ性能は安定していないのですが、これからどんどん進化していくと考えられます。では公式の発表ページを見ていきましょうか。研究者向けマルチモデルインテリジェンスの導入ということで、GPTとClaudeの2つのモデル、マルチモデルでやっていこうというところが大きなポイントです。見てみましょうか。Microsoft 365 Copilotの業務向け高度調査エージェントであるリサーチャーというものがあります。これが大幅な進化を遂げましたということで、今回新たに2つのマルチモデル機能、CritiqueとCouncilを追加しましたということになります。このCritiqueというのが日本語の画面でいうとこの自動モードというものに該当します。1つのモデルが調査をして2つ目のモデルがそれをチェックするということで、現時点ではGPTがリサーチをしてClaudeでチェックをするという感じで、将来的にはこれ逆転もさせることができるようになるそうです。これイメージとしては一人目の部下が調査した内容を上司がチェックするということになるので、より高精度で最高レベルの回答を出すことができるということになるわけです。実際にこれMicrosoftさんが発表しているこのディープリサーチのベンチマークスコアになるのですが、圧倒的ですね。AI単体、例えばGeminiのディープリサーチとかClaude、あとPerplexityみたいなツールがあるのですが、これらと比較しても非常に精度が高いということになりますので、現時点で最も信頼性の高いデータが得られるんじゃないかと思います。もう一つのこのCouncilというのは批評とか議会会議みたいな意味合いみたいなのですが、こちらこのモデル会議というものを使っていただくとこれがCouncilの機能になります。先ほどのCritiqueと何が違うかというと、ClaudeとGPTモデルを同時に実行するということになります。つまり調査員、つまり従業員が実際に2人それぞれリサーチさせたものをやることで、より幅広い回答が得られるという。で、これ実際に同じなのですが、何かの調べ物をしようとした時に、実際にデータを見落としてしまったりとか、重要度を判断する時の重み付けというところが人によって違ったりしますよね。なのでそれを2つの違う人格みたいなところにやらせることで、2つのそれぞれ異なる意見をくっつけてそれを比較するということになります。で、これ正確には3つ目のモデルが起動して、2人が調査した内容を専用の審査モデルがレポートを評価して要約するということになりますので、実質的にはモデルが3つ動いて回答してくれるということになるわけです。ということでまとめると、複数のAIモデルにリサーチをさせることで、より高精度で幅広い検索が可能になったと思っていただいて大丈夫です。ではここから実演を実際にしていきましょう。それでは一つ目、新リサーチ機能Critiqueを実演させていただきます。ではまず初めにこのリサーチエージェントのこの自動モードCritiqueを実演させていただきます。GPTが応答しClaudeが改善するというものになっています。ではこんな質問をしてみましょう。2026年1月から3月における生成AIニューストップ10を調べて重要度の高い順にランキングにしてくださいという、こんなプロンプトを打ってみましょう。そうするとリサーチが走ります。このディープリサーチ機能はどれも一緒なのですが、こういう最初のプロンプトを打った後にまずAIからこうやって質問が来て、追加で指示をしてさらに正確な調査をするみたいなことになっています。例えば生成AIニュースとはどういうことにしますかとか、重要度の判断基準はどうやってやりますかみたいなことをプロンプトでさらに詳しく打っていただくと、よりリサーチの対象が絞られていいものになるかと思います。で、特に希望がなければこのまま進めてと打っていただいて、今回レポートの長さは短いと長いのどっちかから選べるようになるので、今回は長いにしてこのまま進めてもらおうかと思います。そしたらリサーチ結果が出てきましたのでちょっと見ていきましょうか。まず推論が104ステップで完了しましたということで出てきました。めちゃくちゃ長く途中で考えてくれたみたいで、とにかくたくさんリサーチもかけてくれたようです。そうすると2026年1月から3月の生成AIニューストップ10というものが出てきまして、今回は社会的経済的インパクトとか業界への影響とか報道の件数が多いみたいなところ、特に政治とか企業とか法制度にどのように関係するかみたいな視点でリサーチをかけてくれたそうです。ランキング1位ということで、米ホワイトハウスがAIとの新たな分岐点報告書を公表したというのがこれが一番です。面白いですね。なるほど、これ個人でAI使ってる人の視点とは結構違う面白い視点が出てきましたね。確かにこれは世界的には非常に大きな影響があるんだろうなと思います。で、2番はフロンティアAIモデルの大量リリースということで、GPTとかGeminiとかGrokみたいな、そうですよね。最先端モデルが23日に4つの主要モデルが公開された、確かにこのあたりもすごかったですね。ChatGPTの広告が出てくるようとか、半導体への関税問題、確かにこれ非常に大きな問題ですね。EUの理事会とかウェアラブルデバイスの発表とかいろいろ出てきましたね。オープンAIの動画生成AI Soraの終了みたいな感じで、いろんな特に世界的に大きなニュースになったようなものができてきたんじゃないかなと思います。これ私初めて見るのは面白いですね。ベネッセ進研ゼミ生成AI活用で約10年ぶりの大規模リニューアルということで、進研ゼミの通信教育を10年ぶりにリニューアル。そうですよね、やっぱりAI教材とかもどんどん更新したり、アバターが学習アドバイスや添削を行うというのはもうこれは時代の流れだと思いますので、これ非常に大きなニュースかと思います。ちなみに一番下のソースというボタンを押すと、このあたりどういうニュースを引用したかとかも出てくるそうですし、ここからWordとかPowerPointとかPDFとかそういうものに変換することも可能だそうです。ではもう1個今回ちょっと日常利用なものを使ってみようかなと思います。またこの自動モデルでゴールデンウィークにおすすめの日本の観光地旅行スポットトップ30を上げてくださいとしました。今回家族構成ということで6歳と3歳の子供が1人いるので、静岡駅を起点として近いほどいいけどせっかくなので遠方でもいいよみたいなちょっと曖昧な指示を投げながら、車、電車、飛行機どれも可動みたいな条件を与えて打ってみました。で、本当は旅行日数とかアクティビティの希望とかも書いた方がいいのですが、今回ちょっと適当にお任せをしてみました。トップ30のやつが出てきました。2016年は最大12連休が可能ということで、そうですね。3日間休むのか12日間休むのかでだいぶ違いますので、本当はちゃんと指示した方が良かったかもしれないですね。ゴールデンウィーク中は連休初日と最終日が特に混雑しやすい傾向があると、可能であれば日付をずらしたり、航空券とか早めに確保することが重要というゴールデンウィークで遊ぶための戦略が提案されていましたね。私は静岡空港、富士山静岡空港からの直行便だとここもありますよということで、例えば福岡とか鹿児島なんかはいけるんじゃないかみたいなこともわかりますね。素晴らしいですね。おすすめ旅行スポットトップ30ということで、第1位東京ディズニーリゾート、第2位ユニバーサルスタジオジャパン、第3位国営ひたち海浜公園、沖縄、ハウステンボス、旭山動物園とか、確かに有名どころがちゃんと出てきてますね。例えばレゴランドとか宮島とか富士急ハイランドは私も知っていましたが、なんだこれ、ノルン水上フラワー関連とか市原ぞうの国とか、この辺は私もあんまり見たことがないので面白いですね。キッズアニア甲子園、シャトレーゼなんとか、ちびっこ忍者村とか、なるほど面白いですねこれ。これなんかすごいな、今までChatGPTのディープリサーチとかでもここまでちゃんと出てきたことってないんじゃないかな。すごいですね、ちょっとこの渋いところが出てくるところはなんかとっても面白かったですね。素晴らしいですね。各スポットの詳細が紹介されているということになります。いいですね、ちゃんと30個までちゃんとトップ30が紹介されています。あとおまけでゴールデンウィーク家族旅行を成功させるためのポイントみたいな感じで、小さなお子様連れの場合は片道3時間の移動が安心ラインですよみたいなことも書いて、なかなかこれは素晴らしいリサーチ結果が出てきてよかったんじゃないかなと思います。ということでAIのニュース、そして観光スポットみたいな感じのところを調べさせていただいたので、皆さんも真似してみてください。続いては2つ目のリサーチ機能Councilを実演させていただきます。先ほどと全く同じようにAIのニューストップ10とおすすめの観光スポットトップ30というところの2つのプロンプトを打たせていただきました。先ほどと違うところは、先ほどがこの自動のモードであったのに対して、今回はモデル会議ということで、GPTとClaudeがそれぞれ独自に調べて回答を出すという方法を使わせていただきました。では見ていきましょうか。生成AIニューストップ10ということでまず調べてくれました。これ面白いのですが、リサーチ結果を見ていくとまずGPTと、そしてClaudeの結果がそれぞれ出てきて、その下に回答を融合したものがここに出てくるという風になっています。GPTの方ちょっと覗いてみましょうか。そうするとGPTの方はニューストップ10ということで調べてくれていますね。一方でClaudeという風に切り替えていくと、Claudeは重要度評価の可視化みたいなこともやってくれながら調べてくれて、トップ10を調べてくれているそうです。これがどうやって融合されるんですかね。そうすると生成AIニューストップ10ということで、それぞれのまとめとか要約の解説がありました。モデル間の競争激化とか資金調達とか、そんなところの記載があったということを要約としてまとめてくれています。それぞれGPTとClaudeの2つの結果をこうやって比較してくれていますね。例えばGPT-4の重要性というところは、GPT、Claudeともに1位として上げていますが、AppleとGoogleの連携に関してはGPTの方は2位に上げているのに対して、Claudeは第4位に上がっていますみたいな感じで、若干評価の軸が違うんじゃないかと思います。あとは医療AI参入みたいなところが一方で8位に上がっている一方で、Claudeの方は全くそれを書いていないみたいな感じの比較も出てきています。このあたりは順位に違いはあれど、2つのモデルがどちらも重要だということを言ってくれているニュースになるということがわかりますね。一方でこちらがDisagreementということで、GPTとClaudeの重要度の違いが一致していないというところになります。例えばDeepSeekの重要度に関してはClaudeは3位に上げていますが、GPTはランキング外ということで、評価の軸によっては全く違う回答が出てくるというところも面白いですね。これ面白いですね。やはり2つのAIのモデルとか、あるいはプロンプトの与え方とか使い方次第によって、調査の結果って全然変わるんだなというのがよくわかるので、こういう比較してリサーチするというところが標準機能に入ってきたのはとても素晴らしいことだなと感じました。検索の精度申し分ないですね。ではもう一つ、ゴールデンウィークにおすすめの観光スポットを調べてもらいました。では2つのまとめと比較を見ていきましょうか。静岡県内近隣エリアではこの辺がいいよとか、新幹線利用でこういうところにも行けるよとか、ゴールデンウィーク対策とか、飛行機利用で北海道とか沖縄も行けるよみたいなことをやってくれています。GPTとClaudeが両方出してくれたやつというところはこのあたりになります。富士サファリパーク、東京ディズニーリゾート、ユニバーサルスタジオジャパンとか、ぐりんぱ、行きましたけどめっちゃ面白い。素晴らしいですね、この辺が出てきてますね。子連れの適正評価をやってくれている、混雑対策とか交通手段をやってくれている、動物の触れ合い体験なんかも入れてくれていたり、雨天対応とかそんなこともやりましたね。全く同じプロンプトをかけているのですが、GPTはどちらかというと全国をカバーしてくれるのに対して、Claudeはどちらかというと静岡周辺をやや重視してくれているということですね。料金に関してはClaudeはちゃんと費用を出してくれていて、混雑度も出してくれているということで、Claudeの方がいろいろ細かく出してくれているみたい。面白いですね。福井恐竜博物館とか日光江戸村はClaudeには含まれないでGPTに含まれていたみたいな結果が出てきて、これはこれで面白いですね。ちなみに今回、GPTとClaudeどっちの方が良かったかというところなのですが、個人的にはClaudeの方が良かったなと思います。GPTはこのテキストがダーッと出ているような感じで、ちょっと読みにくいのにに対して、Claudeは結構リッチなデザインなんかもつけてくれながらリサーチ結果を出してくれています。まずこの表形式のものがあって、その後この中で1位から10位ぐらいの詳細の説明があった上で、エリア別のおすすめスポットみたいな感じで、こんな見やすいデータも出してくれつつ、この関東エリアだとか中部エリアだった場合とかでこれを出してくれています。ゴールデンウィーク混雑回避快適旅行のコツみたいなものも上げてくれていますし、持ち物チェックリストなんかも作ったり、宿泊施設の選び方とか、こんなこと私言ってなかったのですが、いろいろやってくれて、モデルプランみたいなものも作ってくれて、本当に旅行会社さんみたいですよね。よくある質問なんかもやってくれてますね。包括的なリサーチ結果で、実際に使えるものになっているかという視点では、このClaudeの方が今回素晴らしかったかなと思うのですが、結論、2つの結果を合わせることでさらに良くなっているんじゃないかと思います。早速いろいろ使いそうなので、ぜひ皆さんもゴールデンウィークの遊びスポットなんかもちょっと調べながらやっていただくと面白いかなと思いました。それではまとめます。今回はMicrosoft 365 Copilotに登場した2つのAIモデルを組み合わせた最強リサーチ機能を実演解説させていただきました。リサーチ機能の概要説明させていただいた後、Critique、GPTが調査してClaudeがチェックするという2段階のモデル、そしてCouncil、2つのモデルが並列で動くというところを紹介させていただきました。どちらも素晴らしかった、ちょっと正直甲乙つけがたいのですが、ディープリサーチというもの自体が情報量があまりにも多くなるので、2つのモデルが並列でやるとさらに情報量が多くなりすぎるので、私的には1本にまとめてくれたCritiqueみたいな情報がいいんじゃないかと感じました。どちらにしても私の感想としては非常に精度が高く、調査範囲も広くて良かったかと思います。ただ時間が非常にかかるモデルになるので、本当にサクサク検索するというよりは、放置して後で結果を見るという使い方が必要になりますので、このあたりは通常の検索と使い分けをしていくと必要になるかと思います。最後になりますが、複数のモデルを組み合わせて良い回答を作るという、こういうAIの使用手法というのは今後も様々なシーンで活用されそうですので、ぜひ皆さんも慣れていただくといいのかなと思いました。それでは今回は以上です。ありがとうございました。

