【徹底検証】ChatGPT-4oで超強化!「画像認識Vision機能」活用例100選を大公開!
今回は、ChatGPTを活用した「画像認識」、通称「Vision機能」の実例100選をご紹介します!2023年の秋に登場したこのVision機能は、2024年5月に「ChatGPT-4o(omni)」としてパワーアップしました。これにより、以前よりも高速かつ高精度な回答が可能となっただけでなく、日本語や漢字の読み取りにも対応し、格段に便利になりました。ChatGPTの無料ユーザーでも使えるようになったので、初めて触る人も多いでしょう。
本動画では、画像の内容を当てる「①何コレ系」の使い方から始まり、「②文字起こし系」、「③問題・クイズ系」、そして最も興味深い「④分析・考察系」の活用法を紹介します。特に、Vision機能の分析能力は、人間を超えるレベルの使い方が登場しています。これは単なる画像認識ではなく、世界を変える技術だと感じていただけるでしょう。動画の後半では、「⑤他機能との組み合わせ」や「⑥高度なVision活用術」も紹介します。Vision機能は、データ分析や画像生成などの機能と組み合わせたり、プロンプトを工夫することで、さらなる威力を発揮します。最後に「⑦失敗集」も紹介します。Vision機能が楽しすぎて、気付いたら「計114個」も検証してしまいました(笑)。動画が長くなっているので、興味のあるものを中心にご覧いただければ幸いです。
それでは、ChatGPT-4o(omin)が開く画像認識(Vision)の世界を、ぜひお楽しみください!
▼目次
特に見て欲しいものは「★マーク」がついていますので、そこだけでもご視聴ください!
0:00 はじめに ChatGPT-4o画像認識Vision機能
1:59 AIに目がついた世界1:OpenAI
2:42 AIに目がついた世界2:未来の婚活
3:56 ChatGPT-4o画像認識(Vision)機能の実演
6:06 ChatGPT-4o画像認識(Vision)機能のすごさ
8:45 目次
ChatGPT-4o画像認識 ①何コレ系
9:40 1料理の名前を聞く
10:03 2生き物の名前を聞く
10:10 3花の名前を聞く
10:26 4外国の飲み物を調べる
10:43 5場所を聞く
11:02 6Googleストリートビューから場所を当てる
11:27 7大企業のロゴから企業名を聞く
11:40 8装置やボタンの意味を聞く
12:22 9有名な写真を説明させる
12:40 10絵本のキャラクターを尋ねる
12:55 11星座を聞く
13:20 12タイのマクドナルドのポーズを教えてもらう
13:52 13電子機器の型番を聞く
ChatGPT-4o画像認識 ②文字起こし系
14:23 14手書きのメモやノートを文字起こしする★
14:53 15難解な図・数式を含むノートを文字起こしする
15:48 16漢字の読み取り
16:01 17ホワイトボードの文字起こし
16:18 18領収書の正確な文字起こし
16:36 19レシートの文字起こし
16:48 20英語で書かれたフライト情報の分析
17:22 21楽曲名一覧から有名な曲を分析する
17:50 22ノートから問題を作る
18:05 23霞ヶ浦の資料を分析する
18:23 24牛乳パックの情報をJSON化★
18:55 25難解な図を説明してもらう★
19:58 26動物園の地図から動物リストを作る
20:14 27登り棒のフォントを分析する
ChatGPT-4o画像認識 ③問題・クイズ系
20:43 28簡単な文章題を解く(地学)
21:27 29化学式を整合判定する
22:00 30元素周期表の数値の意味を読み解く
22:34 31高校化学の電池の問題を解く★
23:05 32小学校レベルの分数の問題を解く
23:13 33大学入試二次試験理系レベルの数学の問題を解く★
24:07 34野菜や果物の名前を当てる
24:43 35サイゼリアの間違い探し
ChatGPT-4o画像認識 ④分析・考察系
25:14 36写真の内容を詳細に分析する★
26:05 37写真の人物像を予測させる
26:49 38冷蔵庫の食材からレシピを作る
27:32 39料理のカロリーを推定する
28:10 40お菓子のカロリーを推定する
28:45 41ヨガのポーズを解説してもらう
29:14 42ワードの操作方法を聞く
29:35 43道具の使い方を聞く
29:57 44案内表示から場所を推測する★
30:35 45写真から大学入試の小論文の問題と模範回答を作る★
31:54 46書籍の図を分析してブログを作成する
33:02 47写真から店舗を推測する
33:33 48漫画のシーンを分析する★
34:22 49本の表紙を評価する
35:09 50チラシのコンセプトを分析する
35:36 51線路(プラレール)の欠陥を見つける
36:25 52テニスボールの種類を分析する
36:49 53テニスのプレイを考察する
37:19 54試合状況を分析実況する
37:39 55理科の実験結果(光の回折)を考察する
38:11 56炎色反応を解説してもらう
38:36 57面談の写真から会話を生成する
39:35 58ワンシーンから物語を作る
40:21 59モノボケ・ギャグのアイデアを出す
41:00 60ショッピングを手伝ってもらう
41:37 61料理のメニューを選んでもらう
41:59 62ロゴのコンセプトを分析する★
42:55 63文字入りのロゴからコンセプトを分析する
43:15 64手相を見てもらう
43:45 65街並みから就活性にアドバイスをする★
46:31 66ウェブサイト・ホームページを評価する
46:37 67グラフを分析する
46:48 68株価のチャートを読み取る
47:07 69商品陳列のコンセプトとターゲット像を分析する★★★
49:05 70本のジャンルを当てる
49:20 71店舗レイアウトを考察する★
50:07 72ヒット本から社会動向を考察する
50:40 73画像から商品紹介トークを作る★★★
★参考動画:【AI革命】ChatGPTで変わる次世代の商品紹介術!営業トークから多言語動画の制作まで【HeyGen】 https://youtu.be/inVzr4J6hpo
52:04 74画像から経営戦略や欠点を分析する
52:48 75画像からキャッチコピーを作る
53:14 76画像からSNS投稿文を作る
53:47 77写真から阪神優勝を推測する
54:10 78絵画を評価する
54:28 79美的センスを問う
55:12 80写真撮影のアドバイスをする
56:00 81運転の危険予測をしてもらう
56:50 82装置のUIを評価する
57:20 83障害者に道案内をする★★★
57:59 84ChatGPTは視力検査ができるのか
58:36 85天気図の読み取り
58:46 86Amazonの商品画像から販売促進の戦略を立てる
59:44 87ライブカメラに質問する★
ChatGPT-4o画像認識 ⑤多機能との組み合わせ
1:01:01 88グラフ画像を数値に変換する
1:01:23 89データ画像のスクリーンショットをCSVに変換する
1:01:49 90データ画像からレーダーチャートを作る★★★
1:03:29 91カラーコードを調べる
1:03:47 92アプリ画像からコードを作る
1:04:01 93ワイヤーフレームからサイトを作る★
1:04:28 94ラフ画からシューティングゲームを作る★★★
★参考動画:【解説】ChatGPTでド素人がシューティングゲームを作ってみた【ChatGPT 4V画像認識×Python×Pygame×VScode】 https://youtu.be/uny06ZDI2I4
1:05:17 95ラフスケッチから画像を作る★
1:06:30 96人物写真をアイコンに変換する
1:06:50 97画像から4コマ漫画を作る
1:07:06 98画像生成AIのプロンプトを作る
ChatGPT-4o画像認識 ⑥高度なVision活用術
1:08:05 99画像から指定した部分のみを抽出する★
1:08:47 100複数の画像を組み合わせて分析する★★★
1:10:41 101複数の画像を比較する
1:10:59 102複数画像から優秀作品を選出する
1:12:01 103読書歴から自己分析をする★★★
1:13:57 104画像内の書き込みも認識する★
1:14:56 105テストの問題をピンポイントで質問する★
1:15:42 106Googleマップで2点間の距離を比較する
1:16:10 107医療現場での活用例
1:16:45 108画像データを学習させる★★★
ChatGPT-4o画像認識 ⑦失敗集
1:18:20 109一部が隠された黒板の文字起こし
1:18:50 110生物 血液型の遺伝問題を解く
1:19:16 111難関大学の二次試験レベルの数学の問題を解く
1:19:58 112時計の時刻を当てる
1:20:20 113パズルを解く
1:20:37 114麻雀の待ちや役を聞く
ChatGPT-4o画像認識 まとめ
1:21:21 ChatGPT-4oまとめ・ベスト3の紹介