オープンソースラボ

LLaVAのロゴ

LLaVA

★ 25k

GPT-4V級の視覚言語モデル（Visual Instruction Tuning）

[NeurIPS'23 Oral] Visual Instruction Tuning (LLaVA) built towards GPT-4V level capabilities and beyond.

GitHubで見る公式サイト

関連トピック

chatbotchatgptfoundation-modelsgpt-4instruction-tuningllamallama-2llama2llavamulti-modalitymultimodalvision-language-model

コメント（0）

コメントするにはログインしてください。

同じカテゴリのOSS

ollama

ローカルでLLMを動かすための定番ツール

AIチャットMITGo

prompts.chat

プロンプトを共有・収集できるコミュニティ（旧Awesome ChatGPT Prompts）

AIチャットHTML

open-webui

セルフホストできる高機能AIチャットUIの決定版

AIチャットOtherPython

whisper

OpenAI製の高精度音声認識モデル

AIチャットMITPython

MoneyPrinterTurbo

AIでワンクリック短尺動画を自動生成

AIチャットMITPython

NextChat

ワンクリックでデプロイできる軽量ChatGPTクライアント

AIチャットMITTypeScript

Let's Build Together

OSS導入、自社だけで悩まない。

ツール選定から構築・運用・AI活用まで、オープンソースラボ運営元のClasslessが伴走します。
初回のご相談は無料です。

無料で相談する →事業内容を見る