【完全保存版】Google Gemini徹底解説36選!(基本から応用機能、Google AI Studio、Gemini for Goolge Workspace、NotebookLM等)

【完全保存版】Google Gemini徹底解説36選!(基本から応用機能、Google AI Studio、Gemini for Goolge Workspace、NotebookLM等)

今回は「【完全保存版】Google Gemini徹底解説36選!」というテーマで。Google社のAIやGeminiについて気合を入れて解説します!Geminiの基本的な使い方や、応用機能、Google AI StudioやGemini for Goolge Workspace、NotebookLM、ImageFX、スマホ版Gemini、AIエージェントなどについても触れていきます。

★実際にGeminiを一緒に操作しながら受講していただくと、より理解が深まります!

▼目次
0:00 はじめに Google Gemini徹底解説36選
2:16 本動画を見ながらGeminiを一緒に操作してみましょう
3:08 基本1 Gemini重要ポイント
4:03 基本2 Gemini各種リンクと使用法
4:31 基本3 Google Geminiとは?
6:10 基本4 他社と比べたGeminiのモデル性能
7:18 基本5 Geminiのプラン・ツールによる違い
9:11 基本6 Geminiアクティビティでデータ学習をOFFにする
10:31 ワーク1. Geminiとの基本会話
11:03 ワーク2. Gemini応用機能①音声入力
11:23 ワーク3. Gemini応用機能②画像認識
11:52 ワーク4. AI画像検索ならGoogle Lensも!
12:26 ワーク5. Gemini応用機能③AI検索
13:45 ワーク6. Gemini応用機能④画像生成
14:50 ワーク7. Gemini応用機能⑤ファイル分析
15:30 ワーク8. GeminiでGmailやGoogleドキュメントに出力
16:51 ワーク9. GeminiでYouTubeやGoogle Mapと連携使用
18:30 ワーク10. Gemini Deep Research
21:45 ワーク11. カスタムGemini「Gems」
23:12 開発者向けGoogleAI Studioを触ってみよう
24:13 ワーク12. Google AI Studioで上位モデルを触る
25:35 ワーク13. Google AI Studioで長文分析
28:27 ワーク14. Google AI Studioで動画分析(マルチモーダル)
31:39 推論モデル OpenAI o1 Pro実演
33:12 ワーク15. Google AI Studioで推論モデルを使う
34:12 ワーク16. Google AI Studioで画面認識+会話
36:30 ワーク17. YouTube Studioの動画機能
37:54 ワーク18. スマホアプリ版Gemini Live
38:56 参考1:Google最新スマホ「Pixel 9」
40:49 ワーク19. Google検索 OverView
42:43 参考2:Gemini for Google Workspace
43:30 ワーク20. Googleドライブ上でGemini for Goolge Workspaceを使う
44:26 ワーク21. Gmail上でGemini for Goolge Workspaceを使う
45:30 ワーク22. Googleドキュメント上でGemini for Goolge Workspaceを使う
46:14 ワーク23. Googleスプレッドシート上でGemini for Goolge Workspaceを使う
48:15 ワーク24. Googleのノート型AI「Google NotebookLM」
51:36 ワーク25. Googleの画像生成AI「ImageFX(Imagen3)」
52:42 参考3:Googleの動画生成AI「Veo2」
53:38 参考4:開発者向け Vertex AI
53:42 参考5:GeminiのAIエージェント
54:13 Google Gemini まとめ

▼各種リンク
(最初に「h」をつけて使用してください)

①Geminiログイン
ttps://gemini.google.com/

②Google AI Studioログイン
ttps://aistudio.google.com/

③Google NotebookLMログイン
ttps://notebooklm.google.com/

④Google Workspace
ttps://workspace.google.com/

⑤Google Labs
ttps://labs.google/

⑥画像生成AI ImageFX(Imagen3)
ttps://labs.google/fx/tools/image-fx

⑦Google Search Lab
ttps://labs.google.com/search/

▼文字起こし

こんにちはAIキャンプの中村です。今回のテーマはこちら「Google Gemini徹底解説36選!」です。今回はOpenAI ChatGPTと並んで現在非常に注目されているGoogle Geminiについて紹介させていただきます。最近はAI情報が多すぎて追いきれない、ChatGPTの機能を知るだけでも手一杯という状況ですが、Geminiにも便利な機能が多数搭載されているため、ぜひその機能も知っていただきたいと思います。そこで今回はGoogle Geminiを活用するための重要ポイントを36個お伝えします。内容に誤りがないか確認しておりますが、非常にボリュームがありますので、もし誤りがあればコメントで教えていただけると幸いです。今回の流れは、まずGoogle Geminiが何であるかという基本的なポイント、基本的な操作方法、そこからGmailやYouTubeなどの外部連携、最近登場したGeminiのディープリサーチやカスタムAI gemsという機能、さらにGoogle AI Studioというツールで上位のモデルや画面認識などの機能、スマホアプリ版のGeminiライブ、Pixel 9やGoogle検索、そして最近はGoogle Workspace上にGeminiが基本搭載となり、GoogleドライブやGmail、GoogleドキュメントなどでGeminiが使えるようになっていること、さらに画像生成や動画生成、開発者向けの機能、AIエージェントなど多岐にわたる内容を紹介します。全ての情報を追いかける必要はありませんので、気になるところだけ抑えていただければ大丈夫です。今回、かなり力を入れて整理しましたので、ぜひご覧いただけると嬉しいです。また、今回受講者の方から素敵なグラフィックレコードもいただきました。ありがとうございます。なお、最近AIの情報は非常に激しいので、情報の選別やアウトプットを必ずしようという考えもお伝えしております。情報量が多くなるため、まず全体図を掴んだ上でご視聴いただければと思います。このチャンネルではChatGPTや生成AIに関する役立つ情報をお届けしていますので、よろしければチャンネル登録もお願いします。では、まずGoogleアカウントですが、個人で簡単に作れる無料版があれば、そちらでGeminiを触ることができます。一方、有料版のGeminiアドバンスに課金している方や、法人でGoogle Workspaceに課金している場合は、より多くの機能を体験できます。おすすめの裏技として、1ヶ月間無料で試せるプランもありますので、適当なサブアカウントを作って試すのも良いでしょう(解約を忘れないようにしてください)。まず基本として、今日のGemini受講にあたって押さえておく論点は5つです。まず、機能が非常に豊富であること、次にコストパフォーマンスが非常に良いこと、そして長文が扱える点がChatGPTよりも優れていること、さらにマルチモーダル(画像、動画、音声の分析能力)が非常に優秀であること、最後にGoogleの各種ツールと連携できるようになっている点です。これら5つが今回お話ししたい概要となります。もし「今何やってるんだっけ?」と感じられたら、最初の基本部分に戻って確認してください。GoogleのAIを快適に使うためには、まずGoogleアカウントを1つ用意し、Google Chromeを使用することをおすすめします。Chrome以外のブラウザでは動作しない場合もあるため、Chromeでご参加いただければと思います。Geminiが開けないという方は、Geminiのログインボタンを押して、GoogleのGemini画面に入ってください。次に、基本3として、Google Geminiとはそもそも何かということです。Google社が提供するAIツールの基盤モデルであり、読み方は「ジェミニ」で、ChatGPTと並んで現状最強のAIツールといえます。ただし、日本ではMicrosoft製品の利用が多く、Google Workspaceを法人で使っている企業は少ないため、Geminiがあまり話題にならない事情もあります。また、GoogleのAIツールのラインナップ自体は世界最強であり、今回ご紹介するGeminiの他にも、Gemini 4、Google Workspace向け、NotebookLM、AI Studio、マルチモーダルライブAPI、画像生成、動画生成、Pixel 9など、多種多様なツールが存在します。次に、性能についてですが、結論として非常に優秀です。OpenAIのChatGPTとGoogleのGeminiが世界最強を争っており、さらにClaudeや最近の中国のディープシークなども登場しています。1月28日時点でGemini EX1206というモデルが現状最強モデルですが、ChatGPT 4.0では動作しないことが多く、正常に動作しない場合もあるため、現状では「こんなもんか」という感覚でご覧いただければと思います。ここで話しているのは、2.0 FLASH EXプレビュー版の話です。通常のGeminiはWeb版の画面から使うか、後ほど紹介するGoogle AI Studioから使うことができます。無料版、有料版、そしてGoogle AI Studioの3つで何がどう違うかを一覧表で確認できます。Geminiの画面では、左上のGeminiボタンを押すと、軽量モデルの1.5 FLASHと2.5 FLASH EXが使えます。軽量モデルの1.5 FLASHは性能が低いため、無料版はやや微妙ですが、2.0 FLASHは速くてそこそこ賢いのですが、プレビュー版のため動作しないことも多い状態です。さらに、右下のマイクボタンで音声入力ができ、左下の画像アップロードボタンから画像認識が可能です。私の有料版アカウントでは多くのモデルを選択でき、特に注目すべきは2.0 EXで、これのためだけに課金しているという人もいます。また、ディープリサーチというエージェントも利用可能で、カスタムAI、教育版モデル、軽量モデル、ライブAPIなども使うことができます。今日皆さんが無料版で体験できるのは上記の2つの軽量版のみですが、後ほど紹介するGoogle AI Studioはお金がかからずに多彩な機能を体験できます。法人でAIを使う際は、入力した情報が学習データに利用されないように、Geminiの設定でアクティビティをオフにする機能があるので必ずオフにしてください。アクティビティがオフになっていても72時間は安全監視されています。では、ここから実際にGeminiとの基本的な会話を試していきます。まず、何でも良いのでハリー・ポッターの読書感想文を入力してみてください。通常のテキスト入力でChatGPTと同じような会話が可能です。私の感覚では、日本語の柔らかさや活発さがGeminiには良く表れていると感じます。次に、音声入力についてですが、チャット欄の右下にあるマイクボタンを押すと、音声をテキストに変換して入力することができます。続いて、画像認識の機能です。画像をアップロードし、「これ何とか」と入力すると、画像認識が走ります。これはChatGPTと同様ですが、たとえばGoogle検索の右側にある「画像で検索」ボタン(Googleレンズ)のような機能とも似ています。次に、AI検索ですが、例えば「今日のニュースを1つ教えて」と入力すると検索が走るはずですが、現状GeminiのAI検索は性能が低下しており、実際に調べると2023年11月の情報など、1年以上前の情報を引っ張ってくることがあるため、注意が必要です。次は画像生成機能です。実はGoogleの画像生成は現状最強の一角とされており、テキストから画像を生成できます。無料版では制約がありますが、モデルはImagen 3が使われ、例えば「犬の絵を描いてみたい」と入力すると生成されます。無料版では回数制限が厳しいため、後で紹介するイメージFXから使うのもおすすめです。Geminiの強みは、リアルな写真を生成できることで、ChatGPTで利用できるDALL·Eとは異なり、より現実に近い画像が生成できる点です。次に、ファイル分析機能です。画面左下の画像アップロードボタンから、画像やファイル、さらにはGoogleドライブからのアップロードも可能で、PDFファイルやCSVデータなどをアップロードして分析させることができます。今回、厚生労働省のモデル就業規則などをアップロードして分析させた例もあります。基本的な機能としては、音声入力、画像認識、AI検索、画像生成、データ分析機能があり、これらはChatGPTとほとんど同じですが、Geminiならではの機能も存在します。たとえば、GmailやGoogleドキュメントに1クリックで出力できる共有・エクスポート機能があり、これにより資料や契約書の下書き、メールの下書きなどを簡単に作成することができます。また、YouTubeやGoogle Mapsなど、Googleの各種サービスと連携して回答を得ることも可能です。例えば、Google Mapsを呼び出して「JRから新越賀駅まで公共交通で何分かかりますか」と入力すると、GeminiがGoogle Mapsと連携して回答を返します。次に、Geminiのディープリサーチという機能をご紹介します。これは非常に優秀なリサーチ系AIツールで、例えば「業界におけるChatGPTの具体的な活用事例を10個調べてください」と入力すると、AIが様々な切り口を提案し、成功事例、ユースケース、導入目的、将来展望、海外事例などを詳細にリサーチして回答してくれます。実際に私が以前行った事例では、多くのウェブサイトから情報を収集し、非常に質の高い回答を得ることができました。ぜひ皆さんも自分の事例でディープリサーチを試してみてください。さらに、GeminiではChatGPTと同様にカスタムAIを作成することも可能です。例えば、猫っぽく回答するカスタムAI「猫きち」を作成し、AIキャンプの代表者は中村敏也さんで、嫌いな食べ物がキウリであるといった特徴を持たせることができます。これはChatGPTのカスタムGPTやClaudeのプロジェクトと同様ですが、現状は共有や拡張機能が少ないため、Geminiを使うために課金するほどではないかもしれません。次に、Google AI Studioを実際に操作してみます。この画面は開発者向けのもので、左側や右側を自由に閉じることができます。ここではさまざまなAIモデルを選択可能で、基本のモデルはGemini、Gemini 1.5 Pro、先ほどのFLASHモデル、プレビュー版のGemini 2.0 FLASH、さらに教育向けのRANLMや開発者向けのGemmaなどがあります。中でも最上位モデルのGemini EXPアドバンス1206は、一般の方が触れる中で最も精度が高いとされています。なぜこれを無料で触れるのかは謎ですが、このモデルを選択してください。ただし、Google AI Studioは入力した情報がすべてGoogleの学習データに利用されるため、個人情報や機密情報は入力しないようご注意ください。私が大好きなプロンプトとして「うちの会社は高齢化が進んでデジタル化が全然進まない。これをスポーツの実況風に、物語のように実況してください」と入力して実行すると、非常に面白い結果が得られ、企業でITやDXを推進する方々にも役立つ内容となっています。次に、Google AI Studioで長文分析を行います。Geminiは200万トークン、動画なら2時間、単語なら140万文字程度の非常に長いテキストを扱える特徴があります。たとえば、私たちのYouTubeチャンネル「AIキャンプ」の文字起こしデータ(36万文字)を分析させ、「中村さんの価値観が現れているシーンはどこか、その理由を含めて詳細に分析してください」と入力すると、人間が1日かかる作業をAIが32秒で完了させるほどの能力を発揮します。さらに、Geminiには動画分析機能もあり、テキストだけでなく画像、音声、動画などマルチモーダルなデータの分析が可能です。例えば、短い動画をアップロードして「分析してください」「実況してください」「ダメ出ししてください」と順にプロンプトを入力すると、動画内の要素(明るい黄色の電車、ピンクの服を着た小さなウサギ、緑のトンネル、ピンクと緑のプラスチック製の木々など)を認識し、実況風にコメントやダメ出しを行ってくれます。たとえば、「プラレールアドベンチャー。本日の主役はドクター・イエロー。眩しいイエローボディが印象的で、ピンクの服を身にまとったウサギが特製のグリーン車両で揺られている。これは癒しと興奮が融合した夢のような光景です」といった具合です。次に、最新モデルとしてGemini 2.0 FLASH シンキング エクスペリメンタル0121、いわゆる水論モデルが登場しており、これは従来の汎用モデルよりも論理的思考に優れており、例えば中学入試レベルの問題(ABBCDのパターンで積み木をいくつ置けばよいか)など、じっくりと考察してくれます。操作画面でAIが何を考えているかを覗くことも可能です。無料で試せる点が魅力ですが、性能的にはOpenAIのO1プランには及ばない部分もあります。続いて、画面認識と会話機能についてです。Google AI Studioの左側に「STREAMリアルタイム」というボタンがあり、これを押すとGeminiとの音声対話が可能になります。さらに、カメラ映像を認識して映っているものを回答する機能もあり、例えば私のパソコンのデュアルディスプレイの左側の画面を共有すると、Geminiがその内容を認識して回答を返します。また、YouTubeやGoogleカレンダー、Gmailなどのサービスとの連携も行えます。次に、スマホアプリ版のGeminiライブを紹介します。スマホ版では、ChatGPTのアドバンスドボイスモードと似た音声対話機能があり、画面右下をタップするとGeminiライブが起動し、音声で対話が可能です。最新のGoogle Pixel 9 Proなどでは、さらに多彩なAI機能が搭載され、例えばメールの文章を考えたり、関西弁に変えたり、写真からレシピを生成したりと、非常に便利です。続いて、Google検索の進化したオーバービュー、正式名称Googleオービーを紹介します。これは従来のGoogle検索がAI搭載となり、検索結果の最上位にAIによる概要が表示される仕組みです。たとえば、「Excelで偏差値を求める方法」と検索すると、通常はウェブサイトが表示されますが、最上位にAIが回答した概要が表示され、わざわざ各ページを確認しなくても情報が得られます。これは、情報発信者にとっては戦略の変更が求められる可能性もあります。さらに、Gemini for Google Workspaceについても紹介します。Gmail、Googleドライブ、Googleドキュメント、GoogleスプレッドシートなどでGeminiを活用できるようになっており、たとえばGmail上でメールを要約させたり、返信文を作成させたり、Googleドキュメントに1クリックで文章を挿入させることができます。Googleスプレッドシートでは、関数の自動生成や合計値の算出、さらに定量的なデータ分析だけでなく評価的な考察も行えるため、従来のExcel機能だけでは得られなかった新たな価値が提供されます。次にNotebookLMというツールも紹介します。これはGeminiが持つ知識ではなく、アップロードされたデータのみから回答するAIツールで、例えば授業用のノートや学習資料の作成、FAQチャットボットの構築などに活用できます。私のYouTubeチャンネルの文字起こしデータを与えると、そのデータに基づいてチャットボットが回答する仕組みです。さらに、画像生成AIとしてイメージFXというサイトもあり、フリー素材として使えそうな画像(例えば、パソコンを持ってピースしている女性の写真など)を生成できます。細かい設定で、たとえば「ジャパニーズ」を「チャイニーズ」に変更、スーツをドレスに、コンピューターをブックに、オッケーサインをポインティングに変更、またアスペクト比や画質の調整も可能です。モデルはImagen 3が現状使えるものです。続いて、Googleの動画生成AI、例えばBeobeo2なども紹介します。これは現時点で最高峰の動画生成AIモデルで、最近はOPAIの「空」といった動画生成AIが話題になっていますが、性能的に評価されにくい面もあるため、Googleのモデルは非常にリアルで、物理法則も反映された動画生成が可能です。さらに、開発者向けのvexAIや、AIエージェントについても触れます。AIエージェントの詳細については、私が別途投稿している動画を参照してください。Googleの実験ページ「Google Labs」では、GoogleのAIエージェントの活用例や、私が注目しているプロジェクトMarinerなども紹介されています。以上、今回はOpenAIとライバルと称されるGoogle Geminiの基本情報を紹介しました。まとめると、Geminiは非常に優秀でコスパが良く、長文やマルチモーダルなデータを扱えるだけでなく、Googleの各種ツールと連携できる点がChatGPTにはない魅力です。特に、ディープリサーチは非常に優秀なので、それだけのために一度課金して試す価値があります。また、Google AI Studioでは、Gemini EXPアドバンス1206モデルを中心に多彩な機能が体験でき、さらにGemini for Google Workspaceも非常に面白いので、ぜひGoogleドライブやGmail、Googleドキュメント、Googleスプレッドシートなどで触ってみてください。なお、MicrosoftのCopilotがWordやExcelで使えるようになっているように、今後あらゆるツールにAIが標準搭載される時代が来ると感じています。本日はここまでですが、1つや2つでも持ち帰っていただければと思います。以上、今日はありがとうございました。