【超入門】ノーコードAI開発ツール「Dify」の始め方と基本操作(API設定とチャットフローと基本ブロック解説まで)

【超入門】ノーコードAI開発ツール「Dify」の始め方と基本操作(API設定とチャットフローと基本ブロック解説まで)

今回はノーコードAI開発ツール「Dify」の始め方と基本までを入門者向けに分かりやすく解説します!Difyとは何か?DifyのAPI設定のやり方。基本のチャットフローの使い方と、「開始」「LLM」「回答」などの基本ブロックの解説など、最低限これだけは押さえたい!という内容に厳選してまとめました。ワンランク上のAI活用法を知りたい方は、この動画を見てぜひDifyを初めてみてください!

▼目次
0:00 はじめに
1:23 ノーコードAI開発ツール「Dify」とは
3:03 Dify活用イメージ①データを与えたカスタムAIをHPに埋め込む
4:14 Dify活用イメージ②PDFからPodcastを作成
5:16 Difyの始め方・OpenAI APIキーの設定
9:19 Difyチャットフロー
10:22 Difyチャットフロー①名前・アイコン設定など
10:55 Difyチャットフロー②基本操作
13:01 Difyチャットフロー③プレビュー・公開・実行
14:46 Difyチャットフロー④必須の3ブロック
19:40 Difyチャットフロー⑤変数を渡す
23:35 確認:LLMを2つにしてみる
26:00 まとめ

▼文字起こし

こんにちは、AIキャンプの中村です。今回のテーマはこちら、「超入門講座Difyの始め方と基本操作」。これだけは抑えたいAPI設定とチャットフロー、基本ブロック解説までお届けします。今回はノーコードAI開発ツールDifyの超入門講座です。このDifyはものすごく流行っています。Difyを使えるようになると、GPTやGeminiのような通常のAIよりさらに高度なAI活用が可能になります。またDifyを触る過程でAIについてもめちゃめちゃ詳しくなれますし、プログラミングができない非エンジニアの方でも全然大丈夫です。我こそはと思う方はDifyを始めてみてください。今回の流れです。まずDifyとは何か、そして始め方、チャットフローの基本解説と流れをご紹介します。Difyを始める上で最低限抑えたい内容だけに絞って解説しますので、この動画を見ながら実際にDifyを触ってみてください。ぜひ最後までご覧ください。このチャンネルではChatGPTや生成AIに関する役立ち情報をお届けします。よければチャンネル登録もお願いします。それではまずノーコードAI開発ツールDifyとは何かをご紹介します。Difyとは一言で言うとChatGPTのようなAIの上位版のようなものだと思ってください。独自のカスタムAIや複雑なワークフローを構築できるツールです。プログラミングの知識がなくても直感的に操作できます。こんな感じでブロックを配置しながら線で繋いでいくだけで、コードを書かずに実装できます。難易度としてはChatGPTなどを勉強するより少し難しいですが、プログラミングでコードを書いてガリガリやるよりはるかに低いです。エンジニアでなくても十分手が出せる領域です。OpenAIのGPTだけでなく、GeminiやClaudeなど色々なAIモデルを複数使用することが可能です。また高度なデータ活用(これをRAGと言います)の実装が可能で、LINEやSlack、Notionのような外部ツールと連携することもできます。実際にこのDifyで何ができるかというとアイデアは無限にあります。たとえばChatGPTを超えるような高度なチャットボットを作ったり、SNSやブログなどのコンテンツ制作AIを作ったり、業務自動化アプリを作って自社の仕組みに組み込んだりできます。実際に色々な企業が既に導入しており、リコーさん、価格コムさん、アフラック生命さんなどが業務効率化を実現したというニュースも多数出ています。まずはDifyの活用イメージをご紹介します。1つ目は、自社のデータを与えた猫型のチャットボットをホームページに埋め込む例です。これは私たちの会社のホームページに赤枠のチャットボットを埋め込み、そこに会社の情報を参照しながら猫っぽく回答するように設定しています。「AIキャンプの代表は誰ですか?」と聞くと、「AIキャンプの代表は中村俊也さんだにゃ」というように回答が返ってきます。こんなふうにデータを与えたり口調をカスタマイズしたりして、ウェブサイトやLINEなどに埋め込むことができます。これがDifyのイメージの一つです。2つ目のイメージとして、PDFをアップするだけで独自のポッドキャストに変換するというものがあります。前回の動画でも紹介しましたが、PDFをアップするとAIがテキストを抽出し、ラジオ用の原稿を作り、音声に変換します。実際に再生すると「こんにちは、今日もAIキャンプラジオのお時間がやってきました。AIあおいさんです」というように自動でラジオが生成されます。ChatGPTでは実現が難しい高度なカスタムAIを、こうした形でDifyなら構築できます。以上2つがDify活用のイメージです。ここから実際に作り方を学んでいきましょう。続いてDifyの始め方をご紹介します。まずは「Dify」と検索し、Googleアカウントなどでアカウントを作成してください。無料で始められます。次に設定からOpenAIやGeminiなどのAPIキーを設定します。Difyを操作するには事前にOpenAIなどのAPIキーが必要です。APIキーの取得方法は前回の動画で紹介しているので参考にしてください。Difyの画面でアカウントを作成したら、右上の設定ボタンからモデルプロバイダーを選び、使いたいAIモデルのAPIキーを入力します。OpenAIのGPTや音声認識モデル、埋め込みモデルなど多数使えます。今回はOpenAIのAPIキーを入力してセットアップ完了となります。他にAnthropicやGeminiのAPIキーも同様に設定できます。ここまででAPIキーの設定が完了しました。続いてDifyを使うにあたって、まずはチャットフローを触ることをおすすめします。スタジオから「最初から作成」を選び、「チャットフロー」を選択すると画面に入れます。スタジオにはいろいろな機能がありますが、このチャットフローがDifyの基本です。テンプレートやファイルインポートもありますが、とりあえず「最初から作成」を選んでください。「チャットボット」「エージェント」「テキストジェネレーター」「チャットフロー」「ワークフロー」と5つありますが、最初はチャットフローがおすすめです。「チャットボット」はChatGPTカスタムみたいなものなので、あえてDifyでやる必要はあまりありません。「エージェント」や「ワークフロー」は上級編です。以上がDifyの始め方です。ここからはチャットフローの基本を、一緒に構築しながら解説します。チャットフローとは、ブロックやノードを繋げて処理の流れを作るノーコードAI開発ツールです。これこそがChatGPTにないDifyの強みです。今回は5つの手順に分けて説明します。1つ目が名前などの設定、2つ目が基本操作、3つ目がプレビューと公開、4つ目が基本ブロックの理解、5つ目が変数を渡す概念の理解です。特に4と5が少し難しいですが、順番にやっていきます。まずは名前や説明、アイコンを設定しましょう。スタジオで「最初から作成」→「チャットフロー」を選択し、アプリのアイコンと名前をつけます。今回は「テストアプリ」でアイコンを猫の絵にして作成します。そうするとフローチャートの画面が出ます。これがDifyのメイン画面です。右クリックでブロックを追加したり、Deleteキーでブロックを削除したり、線をドラッグしてブロックを繋いだりできます。線を削除する場合もDeleteでOKです。左下のボタンで自動配置も可能なので、まずはこれらの操作に慣れてください。次にプレビューや公開、実行の方法を説明します。「プレビュー」を押すと動作確認ができ、「公開」を押すと保存されます。公開後に「アプリを実行」するとチャット画面に移り、他の人にもURLを共有できます。実際にAIに「AIって何?」と聞くと、ChatGPTのように回答が返ってきます。このチャットフローの動作を確認するのがプレビューボタンの役割です。続いて「公開する」を押して更新ボタンを押せば保存完了です。アプリを実行するとテスト画面で再度質問できます。ワークフローのプロセスも表示され、どのブロックが何秒かかったか確認できます。次に4つ目の基本ブロックについてです。Difyには沢山のブロックがありますが、まずは必須の3つ、開始ブロック、LLMブロック、回答ブロックを覚えてください。開始ブロックはユーザーの入力を受け取り、LLMブロックがAIモデル(大規模言語モデル)を動かし、回答ブロックでユーザーに返すという流れです。開始ブロックでは入力形式をテキストやファイルなどから選択できます。LLMブロックでは使用するモデルやプロンプトを設定できます。ChatGPTにおけるシステムプロンプトのように、たとえば「猫の口調で答えて」と書けば猫っぽい回答が返ってきます。モデルをGPT-4にしたり、温度やトークン数を調整したりもできます。回答ブロックではLLMブロックの出力をユーザーに表示します。回答形式や定型文も設定できます。最後に5つ目、変数を渡す概念についてです。開始ブロックで入力されたユーザーの質問は変数として次のブロックへ渡され、LLMブロックで回答が生成され、それがまた回答ブロックに変数として渡されます。この受け渡しを正しく設定しないとエラーが出るので注意してください。開始ブロックの出力変数は「sys.query」というように表示され、LLMブロックのユーザー欄に「sys.query」を入力する形です。LLMブロックの出力「text」を回答ブロックの入力に指定すれば回答が表示されます。ブロックを増やして複数のLLMを並列に動かすこともできます。たとえば1つ目は猫っぽく、2つ目は犬っぽく答えて、それぞれの回答をまとめて表示させるなど、自由に組み合わせができます。以上がDifyのチャットフローの基本です。ここにデータを与える知識取得や、HTTPリクエストで外部サービスを叩いたりするともっと高度な活用ができます。さらにDall-Eなどの画像生成モデルを呼び出したり、ポッドキャストジェネレーターを使って音声を生成したり、いろいろなツールと組み合わせると可能性は無限大です。今回の動画では最低限の内容にとどめましたが、ぜひ遊びながら慣れてください。Difyを使いこなすと高度なAI活用ができるのはもちろん、AIの仕組みにもとても詳しくなれます。ノーコードで開発できるので、プログラミングが苦手な方でも挑戦しやすいです。ぜひ皆さんもDifyに触れてみてください。今回は以上です。ありがとうございました。