DeerFlow 2 vs Claude Code|OSS AIエージェントは本家にどこまで迫れるか実測比較
GitHub 30k Star超のByteDance製AIエージェント基盤DeerFlow 2.0を実際にセットアップして検証。Claude Code CLIヘビーユーザーが出した結論とコスト試算。

堀川 慎
Backend Engineer / AWS / Django / Go
GitHub 30k Star超のByteDance製AIエージェント基盤DeerFlow 2.0を実際にセットアップして検証。Claude Code CLIヘビーユーザーが出した結論とコスト試算。
月$100〜$200のClaude Codeに、対抗馬は現れたのか
Claude Codeに毎月$100、忙しい月は$200まで突っ込んでいる人間の感想として書きます。スキルファイルとサブエージェントを自分用に組み上げて、調査も実装もすべて一本のCLIに流す。正直、乗り換える理由は何もなかった。
そこに、ByteDance製の「DeerFlow 2.0」がGitHub Trendingに居座っていた。リリースから2週間で30,000スター。CrewAIやAutoGenのようなフレームワークではなく、Web UIもサンドボックスもメモリもSlack連携も最初から入った「完成品」を名乗っている。30kスターという数字は無視できないので、Mac(Apple Silicon)にセットアップして使い込んでみた。
結論を先に書くと、Claude Code CLIでコードを書いている人間にとってDeerFlowは買い替え候補にはならない。ただし、Claude Codeを契約していない人、または$20プランの上限に毎月ぶつかっている人なら、Gemini Flashと組み合わせて月$3〜$10で動かす研究用エージェントとしてちゃんと使える。以下、何を試してどう判断したかを、ベンチマーク的な数字付きで書いていく。
DeerFlowとは何か
DeerFlow(Deep Exploration and Efficient Research Flow)は、ByteDanceがオープンソースで公開しているAIエージェント基盤です。v1はリサーチ寄りのツールだったらしいですが、2026年2月28日にリリースされたv2.0は完全な書き直しでコードを一本も継承していない大胆な刷新。GitHubスターは執筆時点で30.7k。リリースから2週間でこの数字は素直にすごい。
CrewAIやAutoGenとの一番の違いは「フレームワークではなく完成品」を名乗っているところです。CrewAIは「部品はあるから自分で組み立ててね」、DeerFlowは「組み立て済み。動かすだけ」。Web UI、サンドボックス、長期メモリ、Telegram/Slack/Feishu連携――全部入りです。
技術スタックを並べると以下の通り。手元のマシンで動かす場合はFastAPIとLangGraphの組み合わせが中核になります。
| レイヤー | 採用技術 |
|---|---|
| フロントエンド | React 19 + Next.js |
| Gateway | Python 3.12+ / FastAPI + Uvicorn |
| エージェントランタイム | LangGraph + LangChain |
| パッケージ管理 | uv(Python), pnpm(JS) |
| サンドボックス | Docker / Kubernetes / Local |
中身を覗いてみる
DeerFlowはNginxリバースプロキシをエントリポイントに置き、その下に4つのサービスを並べる構成です。
graph TB
subgraph Nginx["Nginx :2026"]
direction LR
end
subgraph Services["Services"]
FE["Next.js
Frontend
:3000"]
GW["FastAPI
Gateway
:8001"]
LG["LangGraph
Server
:2024"]
PV["Provisioner
:8002"]
end
Nginx --> FE
Nginx --> GW
Nginx --> LG
Nginx -.-> PV
エージェントの実行は11段のミドルウェアパイプラインで制御されていて、ここが個人的には今回いちばん面白かった部分です。各段で何が起きているかは以下の通り。
- 01 ThreadDataの生成
- 02 アップロード追跡
- 03 サンドボックスの確保
- 04 ツール呼び出しのクリーンアップ
- 05 メッセージの要約
- 06 Todoリスト管理
- 07 会話タイトル生成
- 08 メモリファクト注入
- 09 画像準備
- 10 サブエージェントの並行制御
- 11 確認インタラプト
面白いのは08のメモリファクト注入で、DeerFlowは3種類の長期メモリを持っていて、信頼度(0〜1で採点)でランキングしたトップ15のファクトを自動的にプロンプトに差し込んできます。更新は30秒のデバウンスキュー経由で非同期にやるので、会話の流れを止めません。サブエージェントはリードエージェントの下で最大3つ並列で動かせて、2秒間隔のポーリング、5分のタイムアウト。このあたりはすべてconfig.yamlで書き換えられます。
サンドボックスはLocal/Docker/Kubernetesを切り替え可能。/mnt/user-data/workspaceを仮想ファイルシステムとして全モードで統一しているので、ローカルで試したコードをそのままk8s環境に流せます。
他のフレームワークとどう違うのか
AIエージェント界隈は乱立気味ですが、DeerFlow・CrewAI・AutoGen・LangGraph単体の4つで比較するとこうなります。
| 観点 | DeerFlow | CrewAI | AutoGen | LangGraph単体 |
|---|---|---|---|---|
| サンドボックス | Docker/K8s内蔵 | なし | なし | なし |
| 長期メモリ | 3種類内蔵 | 簡素 | 簡素 | なし(自作) |
| Web UI | フル装備 | CLI寄り | Studio | なし |
| チャット連携 | Telegram/Slack/Feishu | なし | なし | なし |
| 対応LLM | OpenAI互換すべて | 主要LLM | 主要LLM | LangChain対応すべて |
| 位置づけ | 完成品 | フレームワーク | フレームワーク | ライブラリ |
「位置づけ」の行が決定的に違います。CrewAIやAutoGenは「部品を渡すから、ほしい形に組み立ててね」と言うタイプ。DeerFlowは「組み上がってる。立ち上げて使ってくれ」と言うタイプ。どちらが向いているかは目的次第ですが、とりあえず動くものをすぐ触りたい層にとってDeerFlowが一番ラクなのは間違いありません。
macOSでのセットアップ手順と詰まりポイント
実際にApple Silicon搭載のmacOSで動かしました。基本の流れは次の4ステップです。
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
# 設定ファイル生成
python3 ./scripts/configure.py
# .env と config.yaml を編集(後述)
# Docker起動
make docker-init
make docker-start
# http://localhost:2026 を開く詰まりポイント1:pythonが見つからない
macOSではデフォルトでpythonコマンドが存在しません。make configを実行するとpython: No such file or directoryで落ちます。alias python=python3はMakefileの中では効かないので、スクリプトを直接叩くのが確実です。
# NG: make config
# OK:
python3 ./scripts/configure.py詰まりポイント2:Geminiのモデル名
config.yamlのサンプルに書かれているモデル名がそのまま使えないことがあります。私の環境ではgemini-2.5-flash-preview-05-20がエラーになり、gemini-2.5-flashで通りました。利用可能なモデル名は以下のコマンドで確認できます。
curl -s "https://generativelanguage.googleapis.com/v1beta/models?key=YOUR_API_KEY" \
| python3 -c "import sys,json;[print(m['name']) for m in json.load(sys.stdin).get('models',[]) if 'flash' in m['name']]"設定ファイルの最小構成
.envに最低限必要なのは以下の2行。今回はたまたまGeminiのAPIキーが手元にあったのでGeminiを選びましたが、OpenAI互換のエンドポイントなら何でも使えます。OpenAI、Claude、DeepSeek、ローカルのOllamaなど。
# .env
TAVILY_API_KEY=your-tavily-key # Web検索(月1,000回無料)
GEMINI_API_KEY=your-gemini-key # LLMconfig.yamlのmodels:セクションにモデル定義を追加します。
# config.yaml (models セクション)
models:
- name: gemini-2.5-flash
display_name: Gemini 2.5 Flash
use: langchain_google_genai:ChatGoogleGenerativeAI
model: gemini-2.5-flash
google_api_key: $GEMINI_API_KEY
max_tokens: 8192
supports_vision: true実際に動かして感じたこと
使い込んでみて良かった点と気になった点を、Claude Codeと比較しながら書きます。
リサーチは速い
Tavilyのウェブ検索とLLMを組み合わせた調査系のタスクは確かに速い。「2026年時点でのFastAPI vs Django vs Flaskの比較」を投げたら、ベンチマーク値込みで整理された回答が短時間で返ってきました。ここはClaude Codeに研究系タスクを丸ごと振るのと比べて遜色なし、というか並列で複数の検索結果を回す分はDeerFlowのほうが早い印象すらある。
「これじゃないとダメ」な場面は見つからなかった
UIはClaudeのデスクトップアプリと近い触り心地で、出来は悪くないけれど目新しさはない。少なくとも今回のレビュー期間で「DeerFlowでしかできない仕事」は出てきませんでした。Claude Codeに重課金している人間として、正直なところ、今困っていることが一つもないんです。
ストリーミングが不安定
これが今回最大の不満点。応答が途中で切れる、消える、表示されない。フレームワーク比較を頼むと毎回ストリームが途切れました。最終的に「ファイルに書き出して」と指示してMarkdownでダウンロードしたら通常通り動いたので、ワークアラウンドはあります。ただし、普通に使うために回避策を要求されるのは厳しい。
コードを書いてくれるが、実行はしない
「HackerNewsのAPIから上位10件を取るCLIツールを書いて」と投げたら、Pythonコードを生成して表示してくれた。コード自体の質は悪くない。ただサンドボックスがあるなら、てっきり実行までやってくれると思っていたので、コードが表示されるだけで終わったのはやや拍子抜けでした。
触り心地は悪くない。ただ「これしかない」と言える場面が見つからない、というのが率直な感想です。
で、自分は使うのか
月$100のClaude Codeサブスクで、忙しい月は$200まで上げて使っている自分にとっては、リポジトリに張り付いてコードを書く用途でCLIに勝るGUIは存在しません。だからDeerFlowは私の現状のワークフローを置き換えません。困っていることがそもそも、ない。
ただし、世の中の全員が月$100〜$200のサブスクを払っているわけではない。ここからが本題です。
有料プランを契約していない人、または$20プランの上限に毎月ぶつかっている人なら、DeerFlowにリサーチ系のタスクを月$10くらいで投げ込む構成は十分アリです。UIもそれなりに整っているので、「ちょうど良いGUIが安く手に入る」という見方ができる。
コスト試算
DeerFlow + Gemini 2.5 Flash + Tavilyの組み合わせで、1日10回程度クエリを投げる軽い使い方ならどのくらいかかるか、見積もってみます。
| 項目 | 単価 | 月利用量目安(10回/日) | 月額 |
|---|---|---|---|
| Gemini 2.5 Flash 入力 | $0.30/100万トークン | 150万トークン | $0.45 |
| Gemini 2.5 Flash 出力 | $2.50/100万トークン | 90万トークン | $2.25 |
| Tavily ウェブ検索 | 月1,000回まで無料 | 約900回 | $0 |
| 合計(軽い使い方) | $3〜$7/月 | ||
Claude Code単独で使ってる場合と、DeerFlowでリサーチを切り出した場合の月額を比較すると以下のようになります。
| シナリオ | Claude Codeのみ | Claude Code + DeerFlow | 差額 |
|---|---|---|---|
| 通常月 | $100 | $100(DeerFlow不要) | ― |
| 繁忙月 | $200 | $103〜$133 | -$67〜-$97 |
Gemini Flashの調査品質がClaude Opus並みかどうかは別問題で、ここはトレードオフを受け入れる必要があります。ただし「調査エージェントを月$3〜$10で手に入れる」と割り切るなら悪い取引ではありません。
誰に向いているのか
用途別に整理すると、自分のリポジトリの中でコードを書くのがメインの人は、DeerFlowではなくClaude Code CLIに行くべきです。CLIがリポジトリの中で動いてくれる時点で、GUIには勝ち目がない。月$100以上を払っていて、すでにClaude Codeで困っていない人にも、わざわざ追加でDeerFlowを入れる動機はあまりありません。
逆に向くのは、調査タスクが中心で、開発はその合間に少しだけ、というタイプの人。$20プランで毎月ぶつかっている人や、有料プランをまだ持っていない人は、DeerFlow + Gemini Flashで$3〜$10/月の研究エージェントを手元に持つというのは現実的な選択肢になります。繁忙月だけ$100〜$200を超えてしまう人にとっても、調査だけをDeerFlowに振り分ければそのオーバー分を抑えられる可能性があります。
非エンジニア向けかというと、そうでもない
「完成品」を名乗っている割に、Dockerが要るし、config.yamlを手で書く必要があるし、APIキーは自分で取りに行く必要がある。「すぐ使える」と謳ってはいますが、実際には一定の技術リテラシーが要求されます。
結局のところ、開発が少しと調査が多め、というちょうど真ん中あたりの層が一番フィットするのだと思います。本気の開発者はCLIに戻るし、完全な非エンジニアはDockerの時点で離脱する。中間層にとって「月$10以下でそれなりに整ったエージェントUIが手に入る」のは、悪くない選択肢です。
「一台何でも屋」の時代はまだ来ていない。今のところは専門特化を組み合わせるほうが強い。
ストリーミング不安定が直ったら、もう一度本気で触ってみます。完成品としての安定が手に入ったとき、判断は変わる余地が十分にあります。