ChatGPT誕生2周年記念!2年間の生成AI注目ニュース&活用術総まとめ

AIキャンプSHIP静岡講座 ~ChatGPT誕生2周年記念!~ 注目のAI活用術総まとめ

開催報告はこちら:https://learningc.jp/20241226-2/

こんにちは!AIキャンプ®の中村です。今回は「ChatGPT誕生2周年記念!注目のAI活用術総まとめ」ということで、2022年~2024年の生成AIの流れと注目の情報について紹介します。
※本動画は、SHIP静岡という会場で開催した勉強会の1部になります。

▼目次
0:00 はじめに
0:56 最新Newsはサイトにまとめています
1:05 2022年夏 生成AI盛り上がり始める
1:30 2023年9月 ChatGPTやGoogleのマルチモーダル化が進む
2:19 2023年10月 AIツールが溶け込み始める
2:51 2023年11月 カスタムAI「GPTS」、Copilot、Geminiの登場
3:15 2023年12月 Midjourney v6
3:44 2024年2月 OpenAI「Sora」
3:59 2024年2月 100万トークンモデルGeminiの登場
4:50 2024年3月 Claude、Geminiの躍進
5:22 2024年4月 ChatGPTログイン不要に
5:49 2024年4月 ChatGPTデータ学習OFF機能登場
6:49 2024年夏 変換系AIの盛り上がり 例:Mapify
8:24 2024年12月 OpenAI o1の登場
9:49 2024年12月 Google Geminiの画面認識
11:47 様々なAIツール12選

■文字起こし

今日のテーマはChatGPT誕生2周年記念、注目のAI活用術総まとめということで始めさせていただきます。ありがとうございます。最初に皆さんに心構えとしてお伝えしておきたいことがあります。鳥になっていただきたいのです。ビジネスの世界に虫の目、鳥の目、魚の目という言葉がありますが、細かいこと、例えばGoogleのAIとChatGPTの性能比較のような話ではなく、もう少し大局を見ていただきたいのです。情報が溢れていますので、全てを追うのではなく、大事なところが何かを大空から眺めるように見ていただくと良いかと思います。今回は、企業のウェブサイトの最新ニュース、特に重要なものをまとめたものになります。2022年の夏から画像生成AIが始まり、11月にChatGPTが登場しました。MicrosoftのBing、GoogleのBard、懐かしいですね。昔、こういう名前で登場し、API公開、プログラム実行、検索機能と進化してきました。特に重要な点として、2023年9月、ちょうど1年3ヶ月前、ChatGPT、特にGoogleとの2社に画像認識のビジョン機能、音声対話機能が搭載されました。覚えておいてください。マルチモーダルAIと言って、AIがテキストだけでなく映像や音声も認識できるようになったのです。つまり、テキストの羅列だけでなく、見たり話したり聞いたりできるようになったのです。さらに今月のアップデートで、検索、実行、ファイル操作も可能になりました。どんどんとAIが人間のように進化しているのが大きな変化です。これが9月頃から徐々に始まってきました。去年の10月頃から、スマホやパソコン自体にもうAIが搭載されている時代になっています。これ、MicrosoftのCopilotボタンです。押すだけでMicrosoftのAIが立ち上がります。ワンクリックでAIを呼び出せる世界になってきています。AIが生活に溶け込み、意識しなくても使えるよう徐々に進化しています。去年の11月、ChatGPTにMyGPTという自分のカスタムAIが作れるようになりました。私たちが作っているAIあおいさんのようなものですね。自分専用のChatGPTを作ろうという流れになりました。この頃からMicrosoftはCopilot、GoogleはGeminiという名前に変わり、大きく進化しました。画像・動画についても触れたいと思います。大きな転換点はMidjourneyという画像生成AIです。最新モデルV6が登場し、生成された画像が本物と見分けがつかなくなってきました。1年半前のAIは不気味でしたが、それを超えてきました。ついにOpenAIから動画生成AI、Soraが公開されました。静岡の街並みを入力すると、非常に綺麗な動画が生成されます。皆さん、トークンという言葉を聞いたことがありますか。ChatGPTやGoogleのAI、Geminiに入力できる文字数のことです。最初、ChatGPTが登場した時は2000文字程度しか入力できませんでしたが、最近は100万文字程度入力できます。2000文字を処理できるAIと、100万文字、つまり本10冊分や100冊分を一度に処理できるAIでは、知能が全く違います。人間が一度に処理できるスピードをAIが超えると言われてきましたが、今年の2月頃には既に超えていました。Google Geminiは100万トークン対応です。そして、ClaudeというAIをご存知でしょうか。ChatGPT、Geminiと並ぶ3大生成AIと言われています。3月にClaude 3.0が登場し、GPT-4の性能を完全に超えたと言われています。ChatGPT一強時代が終わり、様々なAIが登場してきたのが今年1年だったと思います。個人的に大きかったと思うのは、今年の4月からChatGPTがログインなしで使えるようになったことです。ログインせずにChatGPTにアクセスし、例えば「こんにちは」と入力すると応答が返ってきます。誰でも手軽に使えるようになり、ハードルが下がりました。これも大きな変化です。今年の4月からデータコントロールが可能になりました。以前は、ChatGPTに入力した文章は全てアメリカのOpenAIに送信され、個人情報や企業の機密情報が学習されてしまうため、企業では利用が禁止されていました。しかし、ここでオプトアウトできるようになったのです。以前は有料版のみ、またはオフにすると履歴が残らない等の制限がありましたが、誰でもオフにできるようになり、セキュリティ面で利用が加速しました。最新モデルGPT-4oが登場したのは5月です。AIが会話できるように進化しています。今年の夏、大きなトレンドになったのは、テキストだけでなく様々なAIを自由に変換できるようになったことです。実演します。Mapflowというツールをご存知でしょうか。英語で書かれた論文を、日本語のマインドマップに一瞬で変換できます。PDFをアップロードすると、英語のPDFが日本語のマインドマップに変換されます。これこそが生成AIの本質的な価値の一つ、変換力です。テキストから画像、音声、音声から動画、マインドマップ、PDF、Excelファイル、プログラム、アプリケーション、スライドなど、全てを瞬時に変換できるようになるでしょう。これが今年の夏の大きなトレンドでした。AIエージェントも9月頃から非常に注目されています。後で触れていただきます。エージェントAI、そして今月、OpenAIの新しいモデル、GPT-4oが登場しました。IQ133、人類の上位1.4%の天才AIを常にそばに置けるようになったのです。月額200ドルでOpenAI GPT-4oプロモードが利用可能です。非常に深く考える推論型AIモデルです。経営者、研究者、コンサルタントには非常に役立つでしょう。ビジネスプラン作成を指示すると、驚くほどのものが生成されます。この凄さを理解するには実際に触っていただくしかありません。従来のコンサルのレベルを遥かに超えるものが得られます。考察力や戦略立案能力は、まさに人類の上位1%レベルに到達したと言えるでしょう。月額3万円は高額ですが、天才的な参謀をパソコンに搭載できると考えれば、安価に感じる人もいるかもしれません。これがGPT-4oです。特に大きな動きとして、Googleが20個以上のAI機能を発表しました。Gemini Nanoフラッシュ、マルチモーダルライブAPI、エージェントなど、AIが見て、聞いて、話せるように進化しました。GoogleのGeminiを紹介します。画面を見て、話せるようになりました。「こんにちは」「こんにちは。何が見えていますか?」「左側にはNotionが表示されています。」このように、AIが画面を見ながら一緒に作業できるようになったのです。左側でプログラミング、右側で実行といったことが当たり前になります。エンジニア向けの例ですが、左側のコードを改善したいと指示すると、プログラムが実行され、左側の画面を見ながら右側で実行できます。AIに目があるようなものです。「実行しますか?」と尋ねるので、「実行する」と答えると実行できます。これからさらに進化し、例えば資料作成を指示するだけで、AIが作成してくれるようになるでしょう。本当に進化してきたと感じます。最近、YouTubeで様々なAIツールを紹介していますので、是非ご覧ください。以上で終了とさせていただきます。本日はご参加いただき、ありがとうございました。