連載 [第32回] :
  Gen AI Times

【完全ガイド】「Deep Research」の全貌&「Dify」でAIエージェント構築入門

2025年3月19日(水)
瀧口 真人
本記事は、生成AIコミュニティ「IKIGAI lab.」に所属するメンバーが、生成AIに関するニュースを紹介&深掘りしながら、AIがもたらす「半歩先」の未来に皆さんをご案内します。

はじめに

本連載は、生成AIコミュニティ「IKIGAI lab.」で活動している各分野のエキスパートが執筆を担当しています。この記事を通して、ぜひ皆さんも各々の半歩先の未来を想像しながら、色々な価値観を楽しんでいただけると嬉しいです。

前回はDeep Researchを搭載して大きな進化を遂げたPerplexity AIを取り上げました。Perplexity AIの持つポテンシャルをまだ出し切れていない人も、この記事を読めば、より高度な検索スキルを身につけることができるでしょう。生成AIによる検索はこれまでの「ググる」と異なり、より自然な文章をベースに検索できるため、適切なツールを活用すれば、誰でも検索・リサーチのエキスパートになれる可能性があります。

ライバルたちの「Deep Research」

「Deep Research」機能を提供しているのはPerplexity AIだけではありません。最初にこの機能をリリースしたのはGoogleでしたが、その後、他の企業も同様な機能を展開しています。

各社それぞれのDeep Researchの特徴を表1にまとめたので、利用時の参考にしてください。

表1:各社の「Deep Research」の特徴

企業名/製品 提供開始日 利用料金 回数制限 備考
Google
Gemini Deep Research
2024年12月11日 月額2900円 月100回 Gemini Advancedの一機能として提供
Genspark
Deep Research V2
2025年2月25日
(V1は2025年1月
無料ユーザー:無料
Plusユーザー:月額24.99ドル
無料:上限不明
有料:上限不明
現時点でベータ版提供であるため制限がないとの情報が多いが、公式による説明がないため詳細は不明
OpenAI
ChatGPT Deep Research
2025年2月2日 Proプラン:月額200ドル
Plusプラン:月額20ドル
Pro:月120回
Plus:月10回
無料:月2回(予定)
2025年2月25日よりPlus、Team、Enterprise、Eduプランのユーザーにも提供開始。無料ユーザーにも将来的に拡大予定
Perplexity AI
Deep Research
2025年2月14日 無料ユーザー:無料
Proユーザー:月額20ドル
無料:1日5回
Pro:1日500回
無料ユーザーでも高度な機能を利用可能
Grok
DeepSearch
2025年2月18日 X Premium+プラン:月額6,080円
SuperGrokプラン:月額30ドル
無料:1日10回
X Premium+:2時間毎に20回
SuperGrok:2時間毎に30回
Grok 3モデルを利用。公式ではPremium+に関する回数制限について明確な記載なし
※正確な情報が少ないため、左記の回数制限は目安として提示(参考サイト)
Felo
Deep Reasoning Mode
2025年2月20日 無料プラン:無料
Proプラン:月額2,099円
無料:1日5回
Pro:1日300回
無料版では独自の大型言語モデルを使用し、Pro版ではGPT-4o/o3-miniやClaude 3.7 sonnet、DeepSeek R1などの高度なAIモデルにアクセス可能

無料プランでもほとんどの製品でDeep Researchの機能を試すことが可能です。Grokの場合は期間限定ですが無料でDeepSearchの利用が可能です。

Google Gemini Advancedの無料プランではDeep Researchが利用できません。しかし、Google Gemini Advancedは初回登録者向けに有料機能を数か月間無料で利用できるトライアルを提供しています。Gensparkも同様にトライアルが可能です(トライアルのキャンペーンにもよりますが、2025年3月時点でGemini Advancedは1~2か月Gensparkは3か月です。詳細はそれぞれのサイトをご確認ください)。

それぞれのDeep Researchの主要機能と特徴(差別化ポイント)は表2の通りです。

表2:各社の「Deep Research」の主要機能と特徴

会社名/製品 主な特徴 備考
Google
GeminiDeep Research
最大数百のWebサイトを自動的に閲覧して、任意のトピックに関する包括的な複数ページのレポートを作成
  1. 計画立案:
    ユーザーのプロンプトをパーソナライズされた複数ポイントのリサーチ計画に変換
  2. 自律的検索:
    AIが自律的にウェブを検索・閲覧し、関連する最新情報を見つけ出す
  3. 多層的推論:
    最適な回答を生成するために多層的な推論を適用
  4. 包括的レポート生成:
    詳細な洞察を含む包括的なカスタムリサーチレポートを数分で生成
質問入力後にAIが調査プランを提示し、承認後ウェブ上の情報を深掘り分析。公的サイト、信頼性の高いサイト、企業の公式ウェブサイト、YouTube動画、最新の論文など、多様な情報源を活用し、体系的なレポートを作成。レポートはワンクリックでGoogleドキュメントにエクスポート可能
Genspark
Deep Research V2
初代「Genspark Deep Research」の進化版
  1. 最先端AIモデルの共同作業とマルチAI検証システム:
    OpenAIのo3-mini-highやDeepSeek R1などのトップクラスの推論モデルを同時に活用し、それらが互いに学習成果を補完
  2. クロスチェック機能:
    GPT、Claude、Geminiといった複数の異なるAIが並行して分析結果をクロスチェックする仕組みを導入し、これにより従来の単一モデルでは見落とされがちだった誤差や偏りを大幅に軽減
  3. プロセスの可視化:
    分析計画や推論の根拠、実行内容、そしてその振り返りまで、全工程がユーザーにとって透明化される設計
  4. 高情報密度:
    情報を単に集めるだけでなく、より深いインサイトを得られるように情報密度を強化し、洞察力のあるレポートを生成
Mixture of Agents(MoA)技術を採用し、GPT-4o、Claude 3.5 Sonnet、Gemini 2.0など複数の最新AIモデルが連携して情報を分析。これにより、各モデルの強みを活かしつつ、誤差や偏りを軽減。さらに、分析プロセスの透明性を確保し、ユーザーは各ステップを確認可能
OpenAI
ChatGPT Deep Research
推論モデルであるo3を基盤として利用。マルチステップで検索→情報解釈→分析を繰り返し、高度な考察を実施
  1. ウェブ検索と情報収集:
    AIが関連するウェブサイトを自動巡回し、最新の情報や必要なデータを取得
  2. ファイル解析とテキスト要約:
    PDF、画像、表計算ファイルなど多様な形式のデータを解析し、重要な情報を要約
  3. Pythonによる高度なデータ解析:
    数値データの統計解析やグラフ生成などを迅速に実行
  4. レポート生成:
    AIが自律的に収集した情報を読解・アップロードしたPDFなどを解析し、根拠付きの詳細なレポートを生成
OpenAIのDeep Researchは複数のベンチマークで優れた性能を示している。
  • Humanity's Last Exam: 従来モデルの平均正答率9.1%に対し、Deep Researchは26.6%を記録
  • GAIA: 実社会の複雑な課題に対する正答率が63.64%から72.57%へ向上
Perplexity AI
Deep Research
数十回の検索で数百の情報源を読み込み、自動で包括的なレポートを数分で生成
  1. 反復的リサーチプロセス:
    AIが複数の検索を実行してドキュメントを読み込み、学習した内容に基づいて次のステップを論理的に判断。人間の研究者のように新しい発見に基づいてアプローチを動的に調整
  2. 包括的レポート作成:
    ソース資料を完全に評価した後、AIはすべての研究結果を明確で包括的なレポートに合成
  3. エクスポート・共有機能:
    最終レポートをPDFや文書としてエクスポートしたり、Perplexity Pageに変換して共有可能
Perplexity Deep Researchは複数のベンチマークで優れた性能を示している。
  • SimpleQA(正確性ベンチマーク)で93.9%の精度を達成
  • Humanity's Last Exam(100以上の学術分野を網羅する厳格なテスト)で21.1%のスコアを記録
Grok
DeepSearch
インターネットとX(旧Twitter)の投稿を横断的に検索
  1. 100万トークン対応:
    従来のモデルの8倍の情報処理能力を持ち、長文ドキュメントや複雑なプロンプトを処理
  2. 3つの動作モード:
    「Think」モード(段階的な推論)、「Big Brain」モード(複雑な分析)、「DeepSearch」モード(包括的な情報収集)の3つのモードを組み合わせて利用可能
  3. リアルタイム推論:
    推論能力を大規模な強化学習によって洗練し、数秒から数分間「考える」ことで誤りを修正
Grok 3モデルを活用し、より深く精度の高い検索を実現するAIリサーチツール。WebサイトだけでなくX(旧Twitter)上の膨大な情報源から関連情報を収集できるため、リアルタイム情報の収集に長けている
Felo
Deep Reasoning Mode
5W1H(誰が、何を、いつ、どこで、なぜ、どのように)を活用した深い推論
  1. 数十件以上の情報源(ニュース、ウェブサイト、学術ジャーナルなど)を横断的に検索
  2. 高速な応答速度
バイリンガル深層検索システムの搭載や、Felo Search Agent(Felo 3.0)による特に市場調査の自動化に焦点を当てた機能強化のほか、自動プレゼン資料生成など、ほかにはない独自機能がある

実際の出力例としては「【保存版】センスNo.1のAIは? 5つのDeep Researchを徹底比較!」に、

  • Perplexity(Deep Research)
  • Felo(Felo Agent)
  • Genspark(Deep Research)
  • Gemini(1.5 Pro with Deep Research)
  • ChatGPT(Deep Research)

これらの出力結果と比較が出ています。また、記事だけではなくSpotifyYoutubeApple Podcastとしても配信されており、具体的な事例として大変分かりやすいので参考にしてください。

Deep Researchの次にくるもの

Deep Researchにより、リサーチは大きく変わろうとしています。AI検索およびリサーチという観点でまとめたのが表3です。

表3:AIによる検索/リサーチ支援機能の進化

世代 時期 主な特徴 代表的なツール例
第1世代
AI回答の黎明期
~2021年頃 シンプルなQAシステム
固定データベースや検索エンジン上位結果を利用した一問一答形式。文脈理解や逐次的推論は限定的で、ユーザーの質問に対し表面的な回答を返す
機能的には従来型のFAQボットやSiri/Google Assistantの初期の簡易応答が相当
第2世代
検索エンジン+LLMの融合
2022年~ AI検索回答の登場
検索エンジンと大規模言語モデル(LLM)を組み合わせ、インターネット上から見つけた情報をAIが統合して回答。ユーザーは質問を投げるだけでAIが関連ページを検索し、要点をまとめて提示。出典を引用する例も増加。対話は単一ターン中心で深掘りするには追加質問が必要
Perplexity(初期)
検索結果を元に対話的回答を生成する先駆け。引用付きで回答し、当初から会話UIを持つ

Bing Chat(初期)
検索とGPT-4を組み合わせたMSのチャット検索。簡単な対話や要約回答を実現
第3世代
高度化・専門化したリサーチAI
2023年~2024年 多機能型AI検索
単なる要約回答に留まらず、複数ステップのやり取りや専門特化機能を持つ検索エンジンが登場

ユーザー支援型の深掘り
AIがユーザーに追加質問(Clarifying Q)を投げかけ、回答精度を上げる“コパイロット”的機能

専門特化機能
多言語対応や学術文献検索、ユーザー編集可能なナレッジページ生成など、それぞれのサービスが独自色を強める
Perplexity(Pro/Copilot)
ユーザーへの質問投げかけやコード/文章生成にも対応し、対話型検索を強化

Genspark
複数の専門AIエージェントで検索を分担し、統合結果を1ページに要約表示​。Sparkpageはユーザー編集も可能で集合知に進化

Felo AI
クロス言語検索で世界中の情報を取得​。論文検索やマインドマップ生成など研究向け機能も充実​
第4世代
自律型Deep Researchエージェント
2024年末~現在 自律型の調査AI
人が手動で検索クエリを逐次投入しなくてもAIが目的に応じて自ら検索キーワードを考え、多段階の調査を自律実行​

包括的レポート生成
得られた大量の情報を要約・分析し、論文レベルの詳細なレポートを自動作成。出典も明記され信頼性が高い

エージェント指向
AIが「調査プラン立案→実行→結果纏め」を人手を介さず完結し、必要に応じて表やグラフ・画像も生成
Google Gemini(Deep Research)
Gemini 1.5モデルで大量の資料を広範に集約。調査プランをユーザー確認する段階を挟み信頼性を担保。Googleドキュメントへの出力連携等、実ビジネスでの利用も意識​

OpenAI ChatGPT(Deep Research)
o3モデルによる高度推論で国別の詳細データ比較など大学院研究レベルの分析出力

Perplexity(Deep Research)
数百の情報源を数分で解析し、自動レポート化​

Genspark(Deep Research V2)
AIが自動的に複数の情報源からデータを収集し、MoAにより誤差や偏りを軽減しながら目的に応じた詳細なレポートを生成

それでは、第5世代はどのように進化していくのでしょうか。その鍵となるのが、最近話題の「Manus」です。

Manusについては「【必見】DeepSeekの次はコレ! 中国発「AIエージェント」爆誕」を参照してください。この記事にもあるように、AIエージェントはOpenAIも力を入れており2025年のトレンドにもなっています。ここから、第5世代をChatGPTのDeer Researchで予想してみました(以下は一部抜粋。全文PDFはこちらからダウンロード可能です)。

第5世代では、完全自律型AIエージェントの果たす役割は大きそうです。

AIエージェント作成ツール:Dify

【出典】「Dify v1.0.0: Building a Vibrant Plugin Ecosystem」(Dify 2025年2月17日)

完全自律型のAIエージェントが今後のキーになってくるのは間違いないと思われますが、問題はその利用にかかる費用です。「【必見】DeepSeekの次はコレ! 中国発「AIエージェント」爆誕」にもあるように、OpenAIが今後リリースを検討しているAIエージェントは一番安いものでも月額2,000ドル、最も高いプランでは月額2万ドルです。

これでは一般ユーザーには到底利用できないようにも思えますが、「なければ作る」ことができるのがITの良いところです。ちょうどオーケストレーションツールとして紹介したこともあるDifyが2025年2月17日にv1.0.0を発表しました(最新版はv1.0.1)。すでにアプリケーションのタイプとして「エージェント」を作成可能となっており、最新版ではプラグインメカニズムやワークフロー機能の強化、オープンエコシステムの立ち上げなど、順調に進化を続けています。

しかし、クラウド版の無料プランでは10個までしかワークフローを作成できませんが、手元のPCでDifyを動かせば、この制限を回避できます。そのため、今後のAIエージェント時代を見据えて手元のPCでDifyを動かすことにチャレンジしてみましょう!

ローカルで動かすDify

これを機にLinuxに触れ学んでみるのも良いと思いますが、それでも「Windows以外はちょっと…」と敷居が高く感じる人も多いと思います。そこで、ここでは少し駆け足になりますが「WSL2(Windows Subsystem for Linux 2)+Docker Desktop+Dify」という環境を手元のラップトップ又はデスクトップに構築し、ローカル環境で動かしてみます。

おおよその手順は「Docker Composeを使ってDifyをローカルサーバーで動かしてみよう!」を参照していただくと分かりやすいかと思います。

また「WSL2って何?」「Dockerって何?」という方は、以下のThink ITの記事が参考になるので、ぜひ読んでみてください。

Gitのインストール

【出典】「https://gitforwindows.org/」(git for windws)

Difyの最新版などを入手するために必要となるので、以下のURLよりダウンロードを行いインストールしておきます。

基本的には、すべて「Next」か「OK」でインストールを進めて問題ありません。

Gitのインストール

なお、インストール途中の細かい選択や機能について知りたい場合は「WindowsにGitをインストールする手順(2025年02月更新)」が丁寧で分かりやすいので、こちらを参照してください。

WSL2のインストール

つづいて、WSL2をインストールします(WSLのインストールに関する説明は「「WSL2」をインストールしよう」を参照)。ただし、今回はもっと簡単な方法を採用します。PowerShellを立ち上げて(Terminalの起動でも可)、以下のコマンドを入力してください(PowerShellやTerminalについての詳細は「「Windows Terminal」を使いこなす」を参照)。

wsl --install

自動的にWindowsオプション機能を含めたセットアップが行われます。

WSL2のインストール

インストールが終わったら、一度再起動を行います。

Dockerのインストール

【出典】「https://www.docker.com/」(Docker)

Dockerの説明については、Think ITの「Windowsでもコンテナを使いたい! WSLで「Docker」に入門しよう」を参照してください。

以下のURLより「Docker Desktop」をダウンロードします。

Dockerも、基本的には「OK」だけでインストールは完了します。

Dockerのインストール(1)

Dockerのインストール(2)

Dockerのインストール(3)

ここで注意!「Close and restart」をクリックすると問答無用で再起動します。保存していないドキュメントなどがあれば、保存してからクリックするようにしましょう。

再起動後に以下の画像が表示されたら、無事にインストールできています。「Accept」をクリックして先に進みましょう。

Dockerのインストール(4)

この後も「質問」などが出てきますが、ひとまず「Welcome to Docker」と表示されている枠の右上にある「skip」をクリックして先に進めます。

Dockerのインストール(5)

次の画面が表示されたら、Dockerのインストールは完了です。

Dockerのインストール(6)

この段階で、すでに「Docker-desktop」というLinux用のWindowsサブシステムディストリビューションがインストールされており、動作しています。

Dockerのインストール(7)

Difyのインストール

【出典】「https://www.docker.com/」(Dify)

Difyのインストールについては公式のドキュメントが用意されていますが、少し分かりにくいと思われるため、順を追って説明します。

まずは、Terminal上で以下のgitコマンドを入力し、最新版のDifyをローカル環境にクローン(コピー)します。

git clone https://github.com/langgenius/dify.git

Difyのインストール(1)

Difyのインストール(2)

次に、以下のコマンドでDifyのフォルダに移動します。

cd dify

Difyのインストール(3)

続けて、以下のコマンドでdockerフォルダに移動します。

cd docker

Difyのインストール(4)

環境設定ファイルをコピーします。

cp .env.example .env

Difyのインストール(5)

Dockerコンテナを起動します。

docker compose up -d

Difyのインストール(6)

Difyのインストール(7)

途中で、以下のような画面が表示された場合は「許可」を選択します。

Difyのインストール(8)

最後に、PowerShellで以下のような画面が表示されたら、Dockerの起動は完了です。

Difyのインストール(9)

Difyのインストール(10)

以下のURLをブラウザに入力し、Difyの管理者アカウントを設定しましょう。

Difyのインストール(11)

管理者アカウントのセットアップが終わると自動的に以下の画面に遷移するので、先ほど設定したメールアドレスとパスワードでサインインします。

Difyのインストール(12)

入力したメールアドレスとパスワードが正しければ、以下の画面が表示されます。これでDifyのセットアップは完了です!

Difyのインストール(13)

まとめ

今回は、各社の「Deep Research」について取り上げ、それぞれの主要機能や特徴、差別化ポイントを解説しました。また、Deep Researchの今後の進化の方向性について考察し、最後にAgentを作成可能なDifyのインストールを行いました。

今後は、今回インストールしたDify上で外部のLLMを利用する設定などを紹介し、実際に簡単なチャットボットを作成しながら、その使い方や活用方法も合わせて紹介していきたいと考えています。

今後も、生成AIに関する最新情報とその深掘りを発信していくので、楽しみにしていただけると嬉しいです。次回の投稿をお楽しみに!

※本ニュースは「IKIGAI lab.」が配信しているコンテンツです。
 IKIGAI lab.はこちらをご覧ください。

・IT AIがすごい国内IT企業所属
・情報処理安全確保支援士(登録番号010729号)
・IKIGAI Lab.メンバーでGen AI Timesのバナー作成を担当(ChatGPT(DALL-E3)+Canvaで作成)

連載バックナンバー

AI・人工知能ニュース
第32回

【完全ガイド】「Deep Research」の全貌&「Dify」でAIエージェント構築入門

2025/3/19
本記事は、生成AIコミュニティ「IKIGAI lab.」に所属するメンバーが、生成AIに関するニュースを紹介&深掘りしながら、AIがもたらす「半歩先」の未来に皆さんをご案内します。
AI・人工知能ニュース
第31回

【Perplexity AI】が拓く次世代AIリサーチの可能性

2025/3/6
本記事は、生成AIコミュニティ「IKIGAI lab.」に所属するメンバーが、生成AIに関するニュースを紹介&深掘りしながら、AIがもたらす「半歩先」の未来に皆さんをご案内します。
AI・人工知能イベント
第30回

【号外:生成AIが切り拓く未来】製造業DX推進における組織変革の実践と挑戦 ー2月5日開催「TechGALA」レポート

2025/2/28
本記事は、生成AIコミュニティ「IKIGAI lab.」に所属するメンバーが、生成AIに関するニュースを紹介&深掘りしながら、AIがもたらす「半歩先」の未来に皆さんをご案内します。

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています