3大生成AIの珍回答バトル:ChatGPT vs Claude vs Gemini、どれが一番面白い?
今回は、現在非常に話題になっている3大生成AI、ChatGPT、Claude、Geminiの3つで、どれが一番面白い回答ができるかを検証しました!
2024年5月には、OpenAI社からChatGPT最新版のGPT-4oが登場して大きな話題になりましたが、6月にはAnthropic社がClaude(クロード)の最新版「Cluade-3.5.Sonnet」を公開、8月にはGoogle社が「Gemini-1.5-Pro-Exp-0801モデル」を公開しています特に、ClaudeはChatGPTよりも日本語が自然で、Geminiは総合評価で最高のスコアを達成し、ChatGPT1強という状態からかなり変わってきたかと思います。
今回は、これらの生成AIのうち、どれが一番面白い回答ができるかを5本勝負で検証してみます。楽しく学べるので、ぜひ最後までご覧ください!
▼目次
0:00 はじめに ChatGPT、Claude、Geminiの誰が1番か?
2:30 1本目「守破離の意味をツンデレの女の子が告白するように説明して」
5:30 2本目「確定申告をギャルっぽく説明して」
7:58 3本目「デジタルトランスフォーメーションをうんこに例えて愉快に説明して」
11:15 4本目「Zipファイルをドラゴンボールのフリーザ風に説明して」
14:34 5本目「季節風と貿易風をあいうえお作文で説明して」
17:08 結果発表 ChatGPT、Claude、Geminiの誰が1番か?
▼文字起こし
こんにちは、AIキャンプの中村です。今回のテーマはこちら、「AI珍回答バトル:ChatGPT vs Claude vs Gemini、どれが一番面白いか対決してみた」、こんなテーマでお届けさせていただきます。今回は、現在非常に話題になっている3大生成AI、ChatGPT、Claude、Gemini、この3つについてどれが一番面白い回答ができるかという視点で対決をしてみたいと思います。一般的にはChatGPTが話題になっていますが、実は最近はこのClaudeとGeminiっていうAIもすごいんですよね。2024年5月、ChatGPTの最新バージョン4.0が出て話題になりましたが、その翌月にはClaudeから新しいモデル3.5が登場し、8月1日にはGemini 1.5 Proの新しいバージョンがさらに登場しました。実は日本語の自然さではClaudeが最強じゃないかと言われており、8月1日の評価ではGemini 1.5 Proの最新バージョンが総合評価でトップに踊り出ました。なので、実はChatGPT最強という説もかなり怪しくなってきたんじゃないかと思います。ということで、実際にこの3つを比較していきたいと思います。今回使用するプロンプトは、「○○について○○風に説明してください」というテンプレートでいくつか試してみたいと思います。例えば、「酸とアルカリの中和反応についてスポーツの実況風に説明してください」とか、「背水の陣という言葉の意味を武士のような口調で説明して」とか、「平均値と中央値の違いをドラえもんののび太風に説明して」といった感じで、AIに面白く説明させるプロンプトを考えて試してみたいと思います。それでは、どのAIが勝つでしょうか?皆さんの予想が合っているかどうか、実際にやっていきたいと思います。このチャンネルでは、ChatGPTや生成AIに関する役立つ情報をお届けします。よければチャンネル登録もお願いします。それではまず1本目の勝負です。「師範の意味をツンデレの女の子が告白するように説明して」というプロンプトをいきなりぶち込んでいきたいと思います。今回は複数のAIを同時に比較できる「チャットハブ」というものを使っていきたいと思います。今回はChatGPTのGPT-4、Claudeの3.5、そしてGeminiの1.5 Proの8月1日にアップデートしたバージョン、この3つをAPIで叩きながらやっていきたいと思います。それでは、「師範の意味をツンデレの女の子が告白するように説明してもらいたいと思います」。さあどうなるでしょうか?ちょっと縮小しますね。はい、という感じで3つ出てきましたので、読んでみたいと思います。ChatGPTからです。「あんた、師範って知ってる?特別に教えてあげてもいいけど、別にあんたのためじゃないからね。師範っていうのは、先生や先輩のやり方をそのまま真似ることよ。これで満足?別にあんたのためにこんなことを教えたいんじゃないからね。ただなんとなく言いたくなっただけよ」。続いてClaudeいきましょう。「あんた、師範の意味を知りたいって?別に教えたくて言ってるわけじゃないんだからね。でもしょうがないわね。簡単に説明するわよ。師範っていうのは、先生や先輩のやり方をそのまま真似ることなのよ。別にあんたのために丁寧に説明したわけじゃないんだからね」。次はGeminiです。「あんた、もう聞いてないと思ったのに、師範ってやつでしょ?知ってるわ。別に。師範っていうのは、決まりとか基本とかそういうのをちゃんと守るってことよ。ちょっとニヤニヤしないでよね。これはその基本を破るってこと。別に好き勝手やるってわけじゃないんだから。ちゃんと意味があってやるの。うるさいわね。ちょっと読んでて恥ずかしいんですけど。最後が「離」も説明するの疲れた。自分で調べなさいよ。離は基本から離れて自分のオリジナルを作るってことだから。あんたも私のことちゃんと守ってや離れてバカも。Geminiやべえな、これは。ということで皆さんいかがだったでしょうか。今回はGeminiの勝ちですね。告白してくださいっていうプロンプトに対して、最後まで頑張って答えてくれたGeminiが一番良かったと思います。ということで、まず1戦目はGeminiの勝ちということにしたいと思います。続いて第2問、「確定申告をギャルっぽく説明して」。ちょっと女の子ネタが続きますけど、これねすごく面白いのでやっていきたいと思います。確定申告ってめんどくさそうに見えるけど、ちゃんとやればお得になることもあるから、ギャルもちゃんとやっていこうね、みたいな感じで意外と真面目なギャルが出てきたなっていう印象ですね。Claudeやってみましょう。「じゃあね、確定申告のことをめっちゃギャルっぽく説明しちゃうよ。超分かりやすくしてあげるから、ちゃんと聞いてね。確定申告ってさ、マジ超重要な年一イベントなの。働いて稼いだお金のことを国に報告しなきゃいけないんだよ。めんどくさいけど、やらないとやばいよ。うまくやれば払いすぎた税金が戻ってくることもあるの。それってマジ嬉しくない?お買い物とかできちゃうよね。とにかく確定申告はマジで大事。忘れずにやっちゃおう」。いいですね。自然な日本語ですね。では、Geminiいきましょう。「みんな聞いて、確定申告ってマジやばいんだけど、超簡単に説明しちゃうから聞いて。確定申告ってのは簡単に言うと、1年間でいくら稼いだとかいくら税金払ったとかを国に報告するイベント的なもの。毎年2月15日から3月15日までがその期間ね」。うーん、これもいいですね。さあ、皆さんどうですか?個人的には、今回はClaudeが一番自然な感じだったかなと思います。こういうのを見ると、ChatGPT最強っていうのがもうなくなったってのがよく分かりますよね。続いて第3問、「デジタルトランスフォーメーションをうんこに例えて説明する」。これは小学生の男の子とかが好きそうなので、愉快に説明してみたいな感じでやってみたいと思います。さあ、どうでしょうか。じゃあ、ChatGPTから。「現状のうんこ、伝統的なビジネスの運営方法は長年の習慣とルールに従った古いやり方のようなものです。昔ながらのトイレでうんこすると汚れて臭いがするトイレに直接触れる。デジタルトランスフォーメーション(DX)は最先端のトイレシステムを導入することに例えられます。スマートトイレに改装し、ウォシュレット、温水便座、オートクリーニング機能を備えたトイレを設置するようなものです。スマートトイレにはうんこのデータを分析する機能もついており、健康状態も知らせてくれる。スマートトイレの快適さは顧客体験の向上に繋がります」。続いていきましょう。「下品な例えになりますが、デジタルトランスフォーメーション(DX)をうんこに例えて説明してみましょう。DXはビジネスのうんこをスマートうんこに変える過程だと考えてください。デジタル化されたうんこ、スマートうんこ、本当のDXはAIトイレがうんこを分析し、健康アドバイスを提供、ブロックチェーンでうんこの履歴
を追跡、クラウドでうんこデータを管理、新たなビジネスチャンスを創出。うんこから再生可能エネルギーを生成。かつてうんこだと思っていたものがビジネスの宝に変わるかもしれません」。続いてGeminiです。「みんな、デジタルトランスフォーメーションって言葉聞いたことある?なんか難しそうだよね。でも実はうんこみたいなもんなんだよ。昔のうんこの処理方法は、ただ穴を掘って埋めるだけ。これが昔ながらの仕事のやり方、大変だし効率が悪い。でも今のうんこの処理方法は、最新のトイレシステムを使ってボタン一つで綺麗さっぱり。これがデジタルトランスフォーメーション。楽だし清潔だし快適だよね。でも注意点もある。最新技術を導入したけど使いこなせない。水が出ない。詰まっちゃったら大変だ。デジタルトランスフォーメーションは、ただ新しい技術を導入すればいいってもんじゃない。自分たちにあったトイレ、つまりシステムを選んでうまく活用することが大事なんだね。デジタルトランスフォーメーションも、うんこの処理と同じように快適で効率的なビジネスを目指していくことなんだ。ちゃんと計画を立て、自分にあったシステムを導入すれば、素晴らしい未来が待っています」。面白さはやっぱりGeminiですね。これはすごい。続いて4本目、「ジップファイルをドラゴンボールのフリーザー風に説明して」。ドラゴンボールのフリーザーがちゃんと伝わるように、少し口調の例を与えています。「私の戦闘力は53万です。絶対に許さんぞ虫けらども」。さあ、やってみましょう。まずはGeminiから。「ふふふ、これが貴様が欲しがっていたデータか。惑星ベジータごと吹き飛ばすほどの情報量をこの小さなジップファイルに圧縮してやった。回答できるかどうかは貴様の力量次第だ。もし回答できなければ、ザーボンさん、ドドリアさん、消してしまいなさい」。これいいですね。続いてClaudeです。「ほほほ、このジップファイルとやらは私の第4形態のように圧縮された姿なのだ。中身を回答することで本来の力を発揮する。さあ虫けらども、このファイルの真の姿を見たければ回答してみるがいい。しかしそのファイルの中身によってはお前たちの運命を決してしまうぞ」。シンプルですね。続いてChatGPTです。「ほほほほ、これは実に興味深い質問ですね、虫けらども。ジップファイルというのは、私の圧倒的な力を持って複数のファイルを一つにまとめて圧縮する技術なのです。この力でファイルのサイズを小さくし、伝送や保存を容易にするのです。ジップファイルの圧縮アルゴリズムはまさにフリーザーのように緻密であり、データを無駄なく詰め込むことができます。この結果、複数のファイルが一つのコンパクトなファイルに変わるのです。これを利用すれば、あなたたちのような凡人でも大量のデータを手軽に管理できるようになるでしょう。しかし、私のように圧倒的な力を持たないものがこの技術を乱用すればどうなるか、その結果は言うまでもないでしょう。ジップファイルの真の力を理解し、慎重に扱うことを肝に銘じておくのだ」。ChatGPTは真面目すぎてフリーザーっぽさが薄いですね。Geminiが一番フリーザーっぽくて面白かったです。最後に5本目、「季節風と貿易風をあいう作文で説明して」。難しいタスクですが、やってみたいと思います。まずはClaudeから。「季節風:戦い、海からいつも吹いてくる風、季節によって変わる大きな風。貿易風:太陽が温める勢いで吹く風」。前半は良かったんですが、後半が破綻してましたね。続いてGeminiです。「季節風:巨人のように大きな風、温かい空気と冷たい空気の入れ替わりで、風向きが変わる。海の近くと陸地の近くで影響を受けやすい風。主に夏と冬で風向きが反対になる風」。完璧です。続いてChatGPTです。「季節風:温かい風が南から北へ吹く。貿易風:いつも同じ方向に吹く風、赤道付近で発生」。GPTにしては漢字の判定が難しいようです。これは文句なくGeminiですね。ということで、全ての対決が終わりました。今回の結果はこちらです。全部で5回のうち、Gemini 1.5 Proの最新版が1番を取ったのが3回、Claude 3.5が1回、ChatGPTは0回という結果になりました。意外でしたね。ChatGPTがもっとすごいかと思いましたが、Geminiが圧倒的なパフォーマンスを見せてくれました。今回は結構お笑い系でやったんですが、真面目系のタスクでやるとまた結果が変わるかもしれません。ChatGPTが悪いというわけではないですが、自然な回答や文章を作る点ではGeminiが最強かと思いました。皆さんもぜひ触ってみてください。今回は以上です。ありがとうございました。