【完全ガイド】「Deep Research」の全貌&「Dify」でAIエージェント構築入門

はじめに
本連載は、生成AIコミュニティ「IKIGAI lab.」で活動している各分野のエキスパートが執筆を担当しています。この記事を通して、ぜひ皆さんも各々の半歩先の未来を想像しながら、色々な価値観を楽しんでいただけると嬉しいです。
前回はDeep Researchを搭載して大きな進化を遂げたPerplexity AIを取り上げました。Perplexity AIの持つポテンシャルをまだ出し切れていない人も、この記事を読めば、より高度な検索スキルを身につけることができるでしょう。生成AIによる検索はこれまでの「ググる」と異なり、より自然な文章をベースに検索できるため、適切なツールを活用すれば、誰でも検索・リサーチのエキスパートになれる可能性があります。
ライバルたちの「Deep Research」
「Deep Research」機能を提供しているのはPerplexity AIだけではありません。最初にこの機能をリリースしたのはGoogleでしたが、その後、他の企業も同様な機能を展開しています。
各社それぞれのDeep Researchの特徴を表1にまとめたので、利用時の参考にしてください。
表1:各社の「Deep Research」の特徴
企業名/製品 | 提供開始日 | 利用料金 | 回数制限 | 備考 |
---|---|---|---|---|
Google Gemini Deep Research |
2024年12月11日 | 月額2900円 | 月100回 | Gemini Advancedの一機能として提供 |
Genspark Deep Research V2 |
2025年2月25日 (V1は2025年1月 |
無料ユーザー:無料 Plusユーザー:月額24.99ドル |
無料:上限不明 有料:上限不明 |
現時点でベータ版提供であるため制限がないとの情報が多いが、公式による説明がないため詳細は不明 |
OpenAI ChatGPT Deep Research |
2025年2月2日 | Proプラン:月額200ドル Plusプラン:月額20ドル |
Pro:月120回 Plus:月10回 無料:月2回(予定) |
2025年2月25日よりPlus、Team、Enterprise、Eduプランのユーザーにも提供開始。無料ユーザーにも将来的に拡大予定 |
Perplexity AI Deep Research |
2025年2月14日 | 無料ユーザー:無料 Proユーザー:月額20ドル |
無料:1日5回 Pro:1日500回 |
無料ユーザーでも高度な機能を利用可能 |
Grok DeepSearch |
2025年2月18日 | X Premium+プラン:月額6,080円 SuperGrokプラン:月額30ドル |
無料:1日10回※ X Premium+:2時間毎に20回※ SuperGrok:2時間毎に30回※ |
Grok 3モデルを利用。公式ではPremium+に関する回数制限について明確な記載なし ※正確な情報が少ないため、左記の回数制限は目安として提示(参考サイト) |
Felo Deep Reasoning Mode |
2025年2月20日 | 無料プラン:無料 Proプラン:月額2,099円 |
無料:1日5回 Pro:1日300回 |
無料版では独自の大型言語モデルを使用し、Pro版ではGPT-4o/o3-miniやClaude 3.7 sonnet、DeepSeek R1などの高度なAIモデルにアクセス可能 |
無料プランでもほとんどの製品でDeep Researchの機能を試すことが可能です。Grokの場合は期間限定ですが無料でDeepSearchの利用が可能です。
Google Gemini Advancedの無料プランではDeep Researchが利用できません。しかし、Google Gemini Advancedは初回登録者向けに有料機能を数か月間無料で利用できるトライアルを提供しています。Gensparkも同様にトライアルが可能です(トライアルのキャンペーンにもよりますが、2025年3月時点でGemini Advancedは1~2か月、Gensparkは3か月です。詳細はそれぞれのサイトをご確認ください)。
それぞれのDeep Researchの主要機能と特徴(差別化ポイント)は表2の通りです。
表2:各社の「Deep Research」の主要機能と特徴
会社名/製品 | 主な特徴 | 備考 |
---|---|---|
Google GeminiDeep Research | 最大数百のWebサイトを自動的に閲覧して、任意のトピックに関する包括的な複数ページのレポートを作成
|
質問入力後にAIが調査プランを提示し、承認後ウェブ上の情報を深掘り分析。公的サイト、信頼性の高いサイト、企業の公式ウェブサイト、YouTube動画、最新の論文など、多様な情報源を活用し、体系的なレポートを作成。レポートはワンクリックでGoogleドキュメントにエクスポート可能 |
Genspark Deep Research V2 |
初代「Genspark Deep Research」の進化版
|
Mixture of Agents(MoA)技術を採用し、GPT-4o、Claude 3.5 Sonnet、Gemini 2.0など複数の最新AIモデルが連携して情報を分析。これにより、各モデルの強みを活かしつつ、誤差や偏りを軽減。さらに、分析プロセスの透明性を確保し、ユーザーは各ステップを確認可能 |
OpenAI ChatGPT Deep Research |
推論モデルであるo3を基盤として利用。マルチステップで検索→情報解釈→分析を繰り返し、高度な考察を実施
|
OpenAIのDeep Researchは複数のベンチマークで優れた性能を示している。
|
Perplexity AI Deep Research |
数十回の検索で数百の情報源を読み込み、自動で包括的なレポートを数分で生成
|
Perplexity Deep Researchは複数のベンチマークで優れた性能を示している。
|
Grok DeepSearch |
インターネットとX(旧Twitter)の投稿を横断的に検索
|
Grok 3モデルを活用し、より深く精度の高い検索を実現するAIリサーチツール。WebサイトだけでなくX(旧Twitter)上の膨大な情報源から関連情報を収集できるため、リアルタイム情報の収集に長けている |
Felo Deep Reasoning Mode |
5W1H(誰が、何を、いつ、どこで、なぜ、どのように)を活用した深い推論
|
バイリンガル深層検索システムの搭載や、Felo Search Agent(Felo 3.0)による特に市場調査の自動化に焦点を当てた機能強化のほか、自動プレゼン資料生成など、ほかにはない独自機能がある |
実際の出力例としては「【保存版】センスNo.1のAIは? 5つのDeep Researchを徹底比較!」に、
- Perplexity(Deep Research)
- Felo(Felo Agent)
- Genspark(Deep Research)
- Gemini(1.5 Pro with Deep Research)
- ChatGPT(Deep Research)
これらの出力結果と比較が出ています。また、記事だけではなくSpotify、Youtube、Apple Podcastとしても配信されており、具体的な事例として大変分かりやすいので参考にしてください。

【出典】「【保存版】センスNo.1のAIは? 5つのDeep Researchを徹底比較!」(NEWS PICKS 2025年3月13日)
Deep Researchの次にくるもの
Deep Researchにより、リサーチは大きく変わろうとしています。AI検索およびリサーチという観点でまとめたのが表3です。
表3:AIによる検索/リサーチ支援機能の進化
世代 | 時期 | 主な特徴 | 代表的なツール例 |
---|---|---|---|
第1世代 AI回答の黎明期 |
~2021年頃 | シンプルなQAシステム 固定データベースや検索エンジン上位結果を利用した一問一答形式。文脈理解や逐次的推論は限定的で、ユーザーの質問に対し表面的な回答を返す |
機能的には従来型のFAQボットやSiri/Google Assistantの初期の簡易応答が相当 |
第2世代 検索エンジン+LLMの融合 |
2022年~ | AI検索回答の登場 検索エンジンと大規模言語モデル(LLM)を組み合わせ、インターネット上から見つけた情報をAIが統合して回答。ユーザーは質問を投げるだけでAIが関連ページを検索し、要点をまとめて提示。出典を引用する例も増加。対話は単一ターン中心で深掘りするには追加質問が必要 |
Perplexity(初期) 検索結果を元に対話的回答を生成する先駆け。引用付きで回答し、当初から会話UIを持つ Bing Chat(初期) 検索とGPT-4を組み合わせたMSのチャット検索。簡単な対話や要約回答を実現 |
第3世代 高度化・専門化したリサーチAI |
2023年~2024年 | 多機能型AI検索 単なる要約回答に留まらず、複数ステップのやり取りや専門特化機能を持つ検索エンジンが登場 ユーザー支援型の深掘り AIがユーザーに追加質問(Clarifying Q)を投げかけ、回答精度を上げる“コパイロット”的機能 専門特化機能 多言語対応や学術文献検索、ユーザー編集可能なナレッジページ生成など、それぞれのサービスが独自色を強める |
Perplexity(Pro/Copilot) ユーザーへの質問投げかけやコード/文章生成にも対応し、対話型検索を強化 Genspark 複数の専門AIエージェントで検索を分担し、統合結果を1ページに要約表示。Sparkpageはユーザー編集も可能で集合知に進化 Felo AI クロス言語検索で世界中の情報を取得。論文検索やマインドマップ生成など研究向け機能も充実 |
第4世代 自律型Deep Researchエージェント |
2024年末~現在 | 自律型の調査AI 人が手動で検索クエリを逐次投入しなくてもAIが目的に応じて自ら検索キーワードを考え、多段階の調査を自律実行 包括的レポート生成 得られた大量の情報を要約・分析し、論文レベルの詳細なレポートを自動作成。出典も明記され信頼性が高い エージェント指向 AIが「調査プラン立案→実行→結果纏め」を人手を介さず完結し、必要に応じて表やグラフ・画像も生成 |
Google Gemini(Deep Research) Gemini 1.5モデルで大量の資料を広範に集約。調査プランをユーザー確認する段階を挟み信頼性を担保。Googleドキュメントへの出力連携等、実ビジネスでの利用も意識 OpenAI ChatGPT(Deep Research) o3モデルによる高度推論で国別の詳細データ比較など大学院研究レベルの分析出力 Perplexity(Deep Research) 数百の情報源を数分で解析し、自動レポート化 Genspark(Deep Research V2) AIが自動的に複数の情報源からデータを収集し、MoAにより誤差や偏りを軽減しながら目的に応じた詳細なレポートを生成 |
それでは、第5世代はどのように進化していくのでしょうか。その鍵となるのが、最近話題の「Manus」です。

【出典】「'Outperforming DeepResearch': New Chinese AI agent Manus rewrites autonomy rulebook. What sets it apart?」(Business Today 2025年3月9日)
Manusについては「【必見】DeepSeekの次はコレ! 中国発「AIエージェント」爆誕」を参照してください。この記事にもあるように、AIエージェントはOpenAIも力を入れており2025年のトレンドにもなっています。ここから、第5世代をChatGPTのDeer Researchで予想してみました(以下は一部抜粋。全文PDFはこちらからダウンロード可能です)。
第5世代では、完全自律型AIエージェントの果たす役割は大きそうです。
AIエージェント作成ツール:Dify

【出典】「Dify v1.0.0: Building a Vibrant Plugin Ecosystem」(Dify 2025年2月17日)
完全自律型のAIエージェントが今後のキーになってくるのは間違いないと思われますが、問題はその利用にかかる費用です。「【必見】DeepSeekの次はコレ! 中国発「AIエージェント」爆誕」にもあるように、OpenAIが今後リリースを検討しているAIエージェントは一番安いものでも月額2,000ドル、最も高いプランでは月額2万ドルです。
これでは一般ユーザーには到底利用できないようにも思えますが、「なければ作る」ことができるのがITの良いところです。ちょうどオーケストレーションツールとして紹介したこともあるDifyが2025年2月17日にv1.0.0を発表しました(最新版はv1.0.1)。すでにアプリケーションのタイプとして「エージェント」を作成可能となっており、最新版ではプラグインメカニズムやワークフロー機能の強化、オープンエコシステムの立ち上げなど、順調に進化を続けています。
しかし、クラウド版の無料プランでは10個までしかワークフローを作成できませんが、手元のPCでDifyを動かせば、この制限を回避できます。そのため、今後のAIエージェント時代を見据えて手元のPCでDifyを動かすことにチャレンジしてみましょう!
ローカルで動かすDify
これを機にLinuxに触れ学んでみるのも良いと思いますが、それでも「Windows以外はちょっと…」と敷居が高く感じる人も多いと思います。そこで、ここでは少し駆け足になりますが「WSL2(Windows Subsystem for Linux 2)+Docker Desktop+Dify」という環境を手元のラップトップ又はデスクトップに構築し、ローカル環境で動かしてみます。
おおよその手順は「Docker Composeを使ってDifyをローカルサーバーで動かしてみよう!」を参照していただくと分かりやすいかと思います。
また「WSL2って何?」「Dockerって何?」という方は、以下のThink ITの記事が参考になるので、ぜひ読んでみてください。

【出典】「Windowsユーザーのための WSL2で始めるLinux環境構築術」(Think IT)
Gitのインストール

【出典】「https://gitforwindows.org/」(git for windws)
Difyの最新版などを入手するために必要となるので、以下のURLよりダウンロードを行いインストールしておきます。
基本的には、すべて「Next」か「OK」でインストールを進めて問題ありません。
なお、インストール途中の細かい選択や機能について知りたい場合は「WindowsにGitをインストールする手順(2025年02月更新)」が丁寧で分かりやすいので、こちらを参照してください。
WSL2のインストール
つづいて、WSL2をインストールします(WSLのインストールに関する説明は「「WSL2」をインストールしよう」を参照)。ただし、今回はもっと簡単な方法を採用します。PowerShellを立ち上げて(Terminalの起動でも可)、以下のコマンドを入力してください(PowerShellやTerminalについての詳細は「「Windows Terminal」を使いこなす」を参照)。
wsl --install
自動的にWindowsオプション機能を含めたセットアップが行われます。
インストールが終わったら、一度再起動を行います。
Dockerのインストール

【出典】「https://www.docker.com/」(Docker)
Dockerの説明については、Think ITの「Windowsでもコンテナを使いたい! WSLで「Docker」に入門しよう」を参照してください。
以下のURLより「Docker Desktop」をダウンロードします。
Dockerも、基本的には「OK」だけでインストールは完了します。
ここで注意!「Close and restart」をクリックすると問答無用で再起動します。保存していないドキュメントなどがあれば、保存してからクリックするようにしましょう。
再起動後に以下の画像が表示されたら、無事にインストールできています。「Accept」をクリックして先に進みましょう。
この後も「質問」などが出てきますが、ひとまず「Welcome to Docker」と表示されている枠の右上にある「skip」をクリックして先に進めます。
次の画面が表示されたら、Dockerのインストールは完了です。
この段階で、すでに「Docker-desktop」というLinux用のWindowsサブシステムディストリビューションがインストールされており、動作しています。
Difyのインストール

【出典】「https://www.docker.com/」(Dify)
Difyのインストールについては公式のドキュメントが用意されていますが、少し分かりにくいと思われるため、順を追って説明します。
まずは、Terminal上で以下のgitコマンドを入力し、最新版のDifyをローカル環境にクローン(コピー)します。
git clone https://github.com/langgenius/dify.git
次に、以下のコマンドでDifyのフォルダに移動します。
cd dify
続けて、以下のコマンドでdockerフォルダに移動します。
cd docker
環境設定ファイルをコピーします。
cp .env.example .env
Dockerコンテナを起動します。
docker compose up -d
途中で、以下のような画面が表示された場合は「許可」を選択します。
最後に、PowerShellで以下のような画面が表示されたら、Dockerの起動は完了です。
以下のURLをブラウザに入力し、Difyの管理者アカウントを設定しましょう。
管理者アカウントのセットアップが終わると自動的に以下の画面に遷移するので、先ほど設定したメールアドレスとパスワードでサインインします。
入力したメールアドレスとパスワードが正しければ、以下の画面が表示されます。これでDifyのセットアップは完了です!
まとめ
今回は、各社の「Deep Research」について取り上げ、それぞれの主要機能や特徴、差別化ポイントを解説しました。また、Deep Researchの今後の進化の方向性について考察し、最後にAgentを作成可能なDifyのインストールを行いました。
今後は、今回インストールしたDify上で外部のLLMを利用する設定などを紹介し、実際に簡単なチャットボットを作成しながら、その使い方や活用方法も合わせて紹介していきたいと考えています。
今後も、生成AIに関する最新情報とその深掘りを発信していくので、楽しみにしていただけると嬉しいです。次回の投稿をお楽しみに!
※本ニュースは「IKIGAI lab.」が配信しているコンテンツです。
IKIGAI lab.はこちらをご覧ください。
連載バックナンバー
Think ITメルマガ会員登録受付中
全文検索エンジンによるおすすめ記事
- 【Perplexity AI】が拓く次世代AIリサーチの可能性
- 【知っておきたい】DeepSeekの衝撃とChatGPTの新機能、何が変わった?
- 【OpenAI vs Google】年末AI戦争から見た未来
- 【ChatGPT超進化!】最新トレンド「AIエージェント」の全貌と実践的活用法
- 【白熱最前線】勝者は誰だ⁉ 群雄割拠「生成AIの主戦場」
- 【解決力UP】オーケストレーションが可能にする生成AIの活用法、具体例を徹底解説
- 【注目】生成AIサービス「Perplexity」の独自機能と信頼性を徹底解説
- 【天才プロンプト進呈】あなたに最適な生成AIはこれだ!
- Windowsでもコンテナを使いたい! WSLで「Docker」に入門しよう
- 【業務革命】ルーチン作業とお別れ!? 生成AIが拓く効率化の現在地