【神アプデ】Geminiの動画分析がやばい!衝撃の活用例5選(マニュアル化・文字起こし・タイムスタンプ・動画実況など)

今回は、「Geminiの動画分析がやばい!衝撃の活用例5選」というテーマでお届けします。「動画の文字起こしやマニュアル作成に時間がかかりすぎる」「大量の資料をテキスト化するのが面倒」といった悩みを抱えていませんか?Google Geminiの最新の動画分析機能を使えば、そうした作業を劇的に効率化できます。この動画では、Geminiを使った動画の文字起こし、タイムスタンプ作成、マニュアル化など、5つの衝撃的な活用例を具体的に解説しています。AIの驚くべき進化とその活用法を知り、あなたの作業効率を飛躍的にアップさせるヒントを手に入れてください。
▼目次
0:00 はじめに
2:56 1. 実況とダメ出し
5:34 2. 文字起こしとタイムスタンプ
8:39 3. 紙資料を一気に文字起こし
10:48 4. PC操作画面をマニュアル化
13:35 5. 作業風景をマニュアル化
18:37 まとめ
▼文字起こし
こんにちは、AIキャンプの中村です。今回のテーマはこちら。動画がマニュアルに!Geminiの動画分析がすごすぎる衝撃の活用例5選。こんなテーマでお届けさせていただきます。今回はGoogle Geminiの動画分析を使った衝撃の活用例5選を紹介させていただきます。動画の文字起こしやタイムスタンプを作るのが大変、作業風景をマニュアルにしたいけど手間がかかる、大量の書籍をまるっと文字起こししたい。そんな方に朗報です。2025年6月のアップデートで、なんとGoogleのGeminiでも動画分析が可能になりました。しかもここ最近のアップデートでGeminiの精度が非常に上がっているので、ついにこの動画分析っていうところのクオリティが実用化のレベルになってきたということです。しかも使い方とっても簡単です。Geminiに動画をアップして簡単な指示を出すだけです。これだけで簡単に文字起こしとか、要約して議事録を作ったり、タイムスタンプを作成したり、あるいは動画の内容をマニュアルにしたり、あるいは動画を実況させる、そんなことまでできてしまうわけです。そこで今回はGoogle Geminiを使った動画分析の活用例5選を順番に紹介していきます。今回紹介するのがこちらの5つになってるんですけど、1つ目は動画を実況させて、さらに撮影にダメ出しをさせていこうというやつです。2つ目は私のYouTube動画を文字起こしして、そこからタイムスタンプを作ってみましょう。で、上の2つに関しては以前からできたのであまり驚かないかもしれないんですけど、今回のアップデートによってこの下の3つができるようになったんですね。1つが紙の資料を文字起こしするってことです。今こちらで紙の資料を撮影している映像がありますけど、こんな感じで紙を撮影していただくことで文字起こしができるんですよね。で、また今回驚きなのがこのマニュアルを作るっていうやつです。例えばパソコンで操作してる画面を録画して、それをマニュアルにしてって言うとマニュアルができますし、あとはこんな感じで物理的な作業をしてる動画もマニュアルにすることができるので、現場の方の作業風景を他の方にシェアするみたいなそんな使い方も可能になってきたというわけです。AI動画分析の力で文字起こしやマニュアル作成など作業効率が飛躍的にアップする、そんな未来を感じる内容となっておりますので、ぜひ楽しんで見ていただければと思います。このチャンネルでは、ChatGPTや生成AIに関する役立ち情報をお届けします。よければチャンネル登録もお願いします。それでは1つ目、実況とダメ出しをしていきましょう。まずですね、こんな感じの10秒の動画を用意しました。はい、これですね、プラレールとシルバニアファミリーのこのうさぎちゃんたちがね、こうやって乗ってる、10秒程度のこのぐるぐる回ってるだけの動画なんですけど、今回はこちらをアップしてここに実況やダメ出しをさせてみたいなと思います。はい、では実際にやっていきましょう。Google Geminiを開いて、できればね、最新版の2.5 Proってのを使うといいかなと思います。で、こちらをアップして動画をアップロードして今回は、この動画を3000文字程度で熱く実況してくださいっていうね、すごくシンプルなプロンプトを打つだけ。これだけで簡単に使うことができます。しかもこれ無料版のアカウントでもできますのでぜひ試してみてください。ではやってみましょう。はい、そうすると20秒ぐらい経つとこんな感じの、実況のテキストが出てきましたので、これちょっと読むと大変なので読み上げさせてみようかなと思います。読み上げ。さあ、皆様、大変長らくお待たせいたしました。今、まさに歴史がいや、伝説が生まれようとしています。静かにその時を待つ1つの影。お、見てください。あの流線型のフォルム、闇を切り裂く稲妻のごとくシャープなデザイン。そして何よりも見るものの心をとらえて離さない太陽のごとく輝きを放つかなりイエローのボディ。はい、ということでいかがでしたでしょうか。Geminiのね、音声読み上げてちょっとね、機械的であんまり好きじゃないんですけど、出てきたテキストは大変素晴らしいですね。最初のカーブに差し掛かりました。見てください。この絶妙なコーナリングみたいな感じで実況ができてるのはとても面白いんじゃないかなと思います。はい、で、さらに追加で質問していきましょう。あなたは愛が溢れるカメラマンで動画クリエイターです。この動画撮影にめちゃくちゃ厳しく3000文字程度でダメ出しをしてくださいって打ってみました。おい、君、ちょっと座りなさい。そう、そこに。今、君が撮ったっていうこの動画を見させてもらったよ。11秒。たった11秒のこの映像を俺はもう100回は見た。見て、そして深い、深い溜息しか出てこない。なんだこれは。なあ、なんだこれは。怒ってるんじゃないみたい。怒ってますね。はい。正直めちゃくちゃ腹は立っているが、それ以上に俺は悲しいんだよ。君と、そして何よりこの映像の主役であるはずの彼、誇り高きドクターイエローと、勇気あるうさぎの乗客たちに対して、あまりにも不誠実じゃないかと。面白いですね。はい。これね、僕昔からやってるんですけど、このプロンプトはね、前からやってるんですけど何回やっても面白いですね。カメラワークが悪いだろうがとか、三脚立てろとか、なぜもっと地面に這いつくばらないんだとか、こんな感じでね、非常に厳しい愛のある、アドバイスが出てきたんじゃないかと思います。はい、これが1つ目の事例になります。はい、それでは2つ目、YouTube動画を文字起こししてタイムスタンプ作っていこうかなと思います。今回扱う動画は、私たちAIキャンプのYouTube動画で7分ぐらいの動画になっています。以前ですね、Midjourneyのアニメの解説をした動画ですね。こんにちは、AIキャンプの中村です。今回のテーマはこちら。画像生成AI Midjourneyがアップデート、ついに動画生成がアップデートで画像生成AI Midjourneyで作った動画がこんな感じかって見ていただけるといいんですけど。はい、こんな感じ、私たちのYouTube動画がありますので、こちらをアップして解析していこうかなと思います。それでは今回はですね、この動画をアップして以下の動画の文字起こしをしてくださいって打ってみました。で、文字起こしするだけだと文章汚いので、今回はちょっと校正するプロンプトも入れています。で、これ私がね、普段使っている校正プロンプトになるんですけど、不要なメタ情報は削除してくださいとか、ええ、あのなどのフィラーは削除してくださいとか、あとはこの辺のキーワードですね、こういうのを使って文章を校正してくださいみたいな指示を与えています。これでやってみましょう。はい、ということでちょっと見ていきましょうか。こんにちは、AIキャンプの中村です。今回のテーマはこちら。画像生成AI Midjourneyがアップデート、ついに動画生成にできるようになりました。こんなテーマでお届けさせていただきます。おお、いいですね。はい、もうこれ完全に僕のYouTubeチャンネルだなと思うんですけど、はい、こんな感じで綺麗にね、できてるんじゃないかなと思います。で、少しだけダメ出しをしておくと、今回ええとかあのとかの不要な情報を削除してってお願いしたんですけど、これ見ていただいて分かるとおり、不要な情報まだまだたくさんありますよね。で、現状でも対策はあって、そんな時はですね、もう一度こうね、不要な情報を削除してくださいって言ってあげることで、そうですね、ほら、こんな感じで綺麗な文章にさらに校正することもできますので、現状でも、1回文字起こしさせてみて、それが気に入らない場合はもう一度校正するみたいなことをやっていただくといいかなと思います。ではここからタイムスタンプを作っていきたいなと思います。以下の見本に従いタイムスタンプを作成してくださいということです。で、YouTubeではこういう風なタイムスタンプを作るととてもいいんですけど、0分00秒の初めにから、まとめのところまでこんな感じで出てくれるとすごくいいんですね。ではこれで打ってみましょう。はい、ということでタイムスタンプできましたね。はい、いいですね。素晴らしいものができたんじゃないかなと思います。で、このタイムスタンプの精度ってどれぐらいってところ気になると思うんですけど、私の感覚的にはもう80点ぐらいのものができてくるので、もうめちゃめちゃ使えるんですね。で、実際には例えばここの始まるのが2分4秒じゃなくて2分8秒だったりして、若干の誤差はあるんですけど、これはですね、私の動画の切り替えのタイミングが、大体そのあたりで起きているので、厳密にここでね、100点を出 すってのはちょっと難しいかなと思うんで。なので、実際にはここちょこちょこっとね、確認修正してあげるだけで、もう全然実用的なタイムスタンプを作ることができます。これね、YouTubeやってる人とかにはめちゃめちゃ有効な使い方じゃないかなと感じております。はい、以上でYouTube動画の文字起こしとタイムスタンプの作成でした。はい、それでは3つ目いきましょう。では紙資料を録画して文字起こしするっていうことをやっていこうかなと思います。今回はこんな感じで、私たちが発行しているAIキャンプのこのハンドブックってのがあるんですけど、これを動画で撮影して、で、途中ね、こんな感じでぺらってめくってみたり、少しね、読み取ってほしいところを拡大してこうやってスクロールしたりとか、そんな感じの動画を、20秒程度のものを上げていますので、じゃあどこまで精度高く文字起こしができるかっていうのをやっていこうかなと思います。はい、で、プロンプトはとてもシンプルです。文字起こししてっていうだけでやってくれますので、いわゆる画像認識の映像版ということで、やってくれるんじゃないかなと思います。お、いけましたね。さあ見てみましょう。表紙、AIキャンプ、えっと、R、ChatGPT、生成AI活用ハンドブック、ボリューム7、2025年3月発行、制作株式会社ラーニングライト(AIキャンプ)。えっと、あー、ちょっとだけURLがバグってますね。ちょっと惜しい。はい。え、表紙絵は画像生成AI Midjourneyで生成していますとのことで、いいですね。ほとんど、えっと、このURL以外は完璧ですね。AIキャンプ代表の中村と申します。いいですね。ChatGPTが登場して早くも2年半が経ちました。はじめはChatGPTって何?生成AIってどう使うの?と、みんな手探りの状態でしたよね。しかし、2024年後半から流れが一気に変わりましたということで、いいですね。はい、ちょっとね、えっと、誤字が多少ありますけど、感覚的にはそうですね、90点ぐらいのものができてるかなと思います。なので、テキストとかを、文字起こしして丸投げっていうのはもちろん難しいんですけど、ある程度90点ぐらいのものができればいいよとか、そこから人が修正すればいいよっていうことであれば、もうこれでも全然実用的かなと思います。いや、もうこれを見て確信を持ってるんですけど、もう本当ですね、見たもの全てを文字起こしできる、そんな時代に、ついに突入したんだなってことを感じております。はい、それでは続いてマニュアル化をやっていこうかなと思います。今回はパソコンのこの操作画面ですね、これを、与えてマニュアルにしてもら うってことをやっていこうかなと思います。上げてる動画は大概52秒で、今回はデザインツールのCanvaってやつがあるんですけど、これでアップロードした画像を背景を透過するっていうね、ま、この作業手順をマニュアルにしたいということです。こんな感じで画像をCanvaにアップして、はい、背景状況のボタンを押して、はい、で、最後にファイルをダウンロードするとか、そこまでの一連の流れをマニュアルにしてみないなと思います。これができたらすごいですよね。はい、で、プロンプトはとてもシンプルです。この動画から解説マニュアルを作成してとお願いしてみましょう。はい、そうするとね、もうなんか10秒ぐらいでできました。素晴らしい。早いね。あ、すごい。Canvaで画像の背景を透過する方法ということで、はい、私の今回の動画の、あの、意図をちゃんと、理解してくれてますね。すごいなこれ。もう人間じゃんね、これ。で、このマニュアルではデザインツールCanvaを使用して画像の背景を簡単に透過させる、透明にする方法を解説しますと。おお、すごい。すげえな、これ。うわ、マジか。やばいな、これ。はい、手順はCanvaの新しいデザインを作成しますと。で、画像をアップロードして背景を透過、背景リムーバー機能を使用してダウンロードする。おお、すごい。マジか。やばいな、これ。で、Canvaで新しいデザインを作成するということで、WebブラウザでCanvaを開いて画面右上にあるデザインを作成ボタンをクリックしますと。なんかここにあるデザインを作成するボタンを本当は表示したいのかなと思うんですけど、これはちょっとうまくできてないですね。ちょっとここは無視しましょう。で、今度正方形の画像を作成するために検索窓に正方形と入力。そう、そう、そう、そう。で、例えばInstagramの投稿を正方形を選択して、はいはいはい。そこをにアップするんだよと。そうなんですよ。そう、そう、そう。こういう小技がちゃんとできてますね。はい、編集画面開いて画像ファイルをデスクトップから、ま、ドラッグ&ドロップして、で、背景リムーバーをして、え、ダウンロードするとか、もう完璧にできています。いやもう、なんかちょっとここのエラーっぽいここの表記だけ抜けば、もう完璧に、できてますね。えっと、これってもしかして画像とかも入れてくれるようになるのかな?ちょっとこれはね、Geminiだけだとできないかもしれないんですけど、いずれはなんかマニュアル解説PDFみたいなものを作ってくれそうですね。で、以前から私もこれ何回かチャレンジしたんですけど、ここまでの精度が出なかったんですけど、ついにGoogle Gemini、あの、このぐらいのことが出来るようになったということで、本当に私感動する使い方になっています。はい、それでは最後いきましょう。今度はパソコンの画面ではなく、手作業で作業してるこの動画をマニュアル化してみたいなと思います。え、今回の動画は大概1分30秒。ラジコンですね、このラジコンに、電池を入れて、で、操作をするってことをやっています。で、しかも今回音声付きで、動画の最後で、えっとAIキャンプ中村が紹介しましたみたいな音声が入っているので、今回この映像プラス音声も認識できてるかどうかを検証してみたいなと思います。ちょっとね、動画流しますのでご覧ください。えっと、ここに、なんていうか、あの、車のおもちゃがあって、えっと、このリモコンで、操作できるみたいです。じゃあこれにまず電池を入れていきましょう。はい、後ろ側にしてここをパカっと開けます。ここがね、言語化できるのかな。電池が入る場所が出てきますので、ここに単三電池を4本入れていきましょう。はい、電池入れますね。ということで電池を4つ入れてみました。はい、じゃあこれでカバーをしていきます。ここでカバーをして。はい。で、はい、じゃあプラスドライバーでネジを締めていきましょう。はい、このプラスドライバーで締めてますよね。これがGeminiに分析できるかどうかをしたいです。をしています。え、できました。はい、で、電池ができたので後ろのスイッチを入れてみましょう。ポチっと。お、光りましたね。はい、じゃ、前に倒すと前に進みます。後ろにあるとバックします。面白いですね。これ面白いね。横に倒すとね、回転するんですよね。はい、右、左、右。はい、こんな感じでね、遊ぶことができます。はい、ということで車のおもちゃの解説でした。ちなみに私はですね、AIキャンプ代表の中村が今解説しています。はい、ということでこんな感じですね。まあ、ラジコンの電池を入れるところから操作まで、そして自己紹介のところまで全部ね、音声と映像をちゃんと認識できるかどうかを、え、やってみましょう。で、今回のプロンプトはこの動画から解説マニュアルを作成して、で、今回話者が私ですので、話者も明記することっていうのを認識できるかやってみましょう。さあ、だいぶね、レベルの高い分析動画になるんですけど、これができるかやっていきましょう。これができたら、本当にAIに目も耳もついたっていうことで、本当にね、人間に近くなってくるんじゃないかなと思います。あ、見てください。もう10秒ぐらいでできました。さあいきましょう。アップロードされた動画「操作デモ ラジコン.mp4」を元に以下のような解説マニュアルを作成しましたということで、あ、ファイル名も見てくれてるみたいですね。あ、なるほど、なるほど。で、今回やってることは、ラジコンカー操作解説マニュアルということで、ラジコンカーの準備から操作方法まで解説するということです。はい、いいですね。ラジコン本体、リモコン、え、単三電池4本とプラスドライバーを準備してください。おお、すごい。あ、しかも見てください。動画にはリモコン用の電池は映っていませんが、別途必要になる場合があります。そうなんですよ。僕ね、今回リモコンは入れていたので、これはいらないんですけど、本当はいるんですよね。すごい。いや、マジで、いや、マジすげえな。これ、やばくない?え、これやばいね。で、セットアップ手順としてラジコン本体に電池を入れましょう。裏返してカバーを見つけて、え、ドライバーで、え、カバーを開けて、あ、単三電池4本をプラスとマイナスを正しく確認しながらセット。おお、すごい。電池カバーを元に戻して、え、電池をしっかりと締めて固定する。ま、ここプラスドライバー使ってるんですね。いいですね。はい。で、本体の裏側にある電源スイッチをオンの位置にスライドさせて、え、車のホイール部分が青く点灯するということでいいですね。完璧。はい。操作方法。えっと、左スティックを前に倒すと前に進む。はい、後ろに倒すと後ろに進む。はい、左右に倒すと車がその場でスピンするように回転しますと。え、組み合わすことでアクロバティックな走行を楽しむことができる。そうなんですよ。そう、そう、そう。いや、すごい。完璧じゃん。うわ、マジか。やばくね?はい。で、この操作デモの解説はAIキャンプ代表の中村様が行っていますということで、ちゃんと音声も認識できてるということです。え、やばくない?え、やばくないすか?これね、もう認識できちゃうんですよ。つまり、AIは単なるテキストを返す道具っていうのはもうはるかに超えていて、こんな感じで映像もちゃんと目で見えて認識できて、私が何喋ってるかっていうこともちゃんと音声で認識してくれるというね、ついにそのレベルになったということになります。衝撃ですね。はい。これで現場の作業なんかをどんどん動画にできるんじゃないかなと思うと、本当に衝撃の、え、事例じゃないかなと思います。えっと、まだまだ私もね、まだ触ったばっかりですので、このあたりのプロンプトとかを練り込んでいないんですけど、もっともっとここをね、応用でプロンプトを練ってあげたり、いろんなことを考えていただくと、マニュアル作成とかもね、本当に、十分できるようになるんじゃないかなと思います。本当にね、こう未来を感じる使い方になります。はい、ではね、実践は以上とさせていただきます。はい、それではまとめます。今回はGoogle Geminiの動画分析の活用例5選を紹介させていただきました。実況とダメ出し、そしてYouTube動画に文字起こしとタイムスタンプを作る、紙資料を動画で一気に文字起こしする、そしてパソコンの操作画面や手作業の作業をマニュアル化しよう、しかも音声も認識できるということで、本当にあの素晴らしい技術が登場したんじゃないかなと思います。AI動画分析の力で文字起こしやマニュアル作成など、作業効率を飛躍的にアップできる、そんなことを感じていただけたと思いますので、まだまだ私もね、検証を続けていきますけど、最近のAI機能の中では本当にね、かなり驚きの事例だったんじゃないかなと思いますので、ぜひ皆さんもね、真似してやってみて欲しいなと思います。はい、それでは今回は以上です。ありがとうございました。