phoenix

★ 11k

LLMの可観測性・評価ツール

Phoenixは、Arize AIが開発するオープンソースのAI可観測性・評価プラットフォームです。OpenTelemetryベースのトレーシングでLLMアプリやエージェントの実行過程を記録・可視化し、LLM-as-a-judgeなどによる自動評価、データセット管理、実験の比較、プロンプトの管理までをローカル環境やセルフホストで実行できます。LangChain、LlamaIndex、OpenAI、smolagentsなど主要フレームワークとの統合が用意されており、数行のコードで計装を開始できます。RAGやエージェントの「なぜこの回答になったのか」を追跡・改善したいAIエンジニアや、評価を開発サイクルに組み込みたいチームに向いています。ベンダーロックインを避けつつLLMの観測基盤を整えたい場合の有力な選択肢です。

GitHubで見る公式サイト

コメント（0）

コメントするにはログインしてください。

同じカテゴリのOSS

hermes-agent

★ 220k

ユーザーと共に成長するAIエージェント（Nous Research製）

LLM開発ツールMITPython

firecrawl

★ 156k

WebをLLM向けに検索・スクレイピングするAPI

LLM開発ツールAGPL-3.0TypeScript

langflow

★ 152k

ビジュアルでRAG・エージェントを構築するローコードツール

LLM開発ツールMITPython

dify

★ 150k

ノーコードでAIアプリを構築できるLLMOpsプラットフォーム

LLM開発ツールOtherTypeScript

langchain

★ 143k

LLMアプリ開発の定番フレームワーク

LLM開発ツールMITPython

llama.cpp

★ 122k

ローカルLLM実行の基盤となるC++実装

LLM開発ツールMITC++

phoenix

コメント（0）

同じカテゴリのOSS

hermes-agent

firecrawl

langflow

dify

langchain

llama.cpp

OSS導入、自社だけで悩まない。