promptfoo

★ 24k

プロンプトのテスト・評価ツール

promptfooは、プロンプトやエージェント、RAGシステムをテスト・評価するためのオープンソースツールです。YAMLの宣言的な設定でテストケースを定義し、GPT、Claude、Geminiなど複数モデルの出力品質を並べて比較できます。CI/CDに組み込めば、プロンプト変更による品質低下(リグレッション)をデプロイ前に検知できます。さらにレッドチーミング機能を備え、プロンプトインジェクションや有害出力などAI特有の脆弱性スキャンも実行できる点が特徴です。OpenAIやAnthropicでも利用されていると公表されています。LLMアプリの品質を継続的に担保したい開発チームや、AIシステムのセキュリティ検証が必要な企業に向いています。MITライセンスでローカル実行でき、データが外部に送信されない点も安心です。

GitHubで見る公式サイト

コメント（0）

コメントするにはログインしてください。

同じカテゴリのOSS

hermes-agent

★ 221k

ユーザーと共に成長するAIエージェント（Nous Research製）

LLM開発ツールMITPython

firecrawl

★ 156k

WebをLLM向けに検索・スクレイピングするAPI

LLM開発ツールAGPL-3.0TypeScript

langflow

★ 152k

ビジュアルでRAG・エージェントを構築するローコードツール

LLM開発ツールMITPython

dify

★ 150k

ノーコードでAIアプリを構築できるLLMOpsプラットフォーム

LLM開発ツールOtherTypeScript

langchain

★ 143k

LLMアプリ開発の定番フレームワーク

LLM開発ツールMITPython

llama.cpp

★ 122k

ローカルLLM実行の基盤となるC++実装

LLM開発ツールMITC++

promptfoo

コメント（0）

同じカテゴリのOSS

hermes-agent

firecrawl

langflow

dify

langchain

llama.cpp

OSS導入、自社だけで悩まない。