
phoenix
LLM開発ツールLLMの可観測性・評価ツール
Phoenixは、Arize AIが開発するオープンソースのAI可観測性・評価プラットフォームです。OpenTelemetryベースのトレーシングでLLMアプリやエージェントの実行過程を記録・可視化し、LLM-as-a-judgeなどによる自動評価、データセット管理、実験の比較、プロンプトの管理までをローカル環境やセルフホストで実行できます。LangChain、LlamaIndex、OpenAI、smolagentsなど主要フレームワークとの統合が用意されており、数行のコードで計装を開始できます。RAGやエージェントの「なぜこの回答になったのか」を追跡・改善したいAIエンジニアや、評価を開発サイクルに組み込みたいチームに向いています。ベンダーロックインを避けつつLLMの観測基盤を整えたい場合の有力な選択肢です。
関連トピック
agentsai-monitoringai-observabilityaiengineeringanthropicdatasetsevalslangchainllamaindexllm-evalllm-evaluationllmopsllmsopenaiprompt-engineeringsmolagents
コメント(0)
コメントするにはログインしてください。
同じカテゴリのOSS

langflow
ビジュアルでRAG・エージェントを構築するローコードツール
LLM開発ツールMITPython

dify
ノーコードでAIアプリを構築できるLLMOpsプラットフォーム
LLM開発ツールOtherTypeScript

langchain
LLMアプリ開発の定番フレームワーク
LLM開発ツールMITPython

llama.cpp
ローカルLLM実行の基盤となるC++実装
LLM開発ツールMITC++

vllm
高スループットなLLM推論エンジン
LLM開発ツールApache-2.0Python

ragflow
深い文書理解に基づくRAGエンジン
LLM開発ツールApache-2.0Python