
LLaVA
AIチャットGPT-4V級の視覚言語モデル(Visual Instruction Tuning)
[NeurIPS'23 Oral] Visual Instruction Tuning (LLaVA) built towards GPT-4V level capabilities and beyond.
関連トピック
chatbotchatgptfoundation-modelsgpt-4instruction-tuningllamallama-2llama2llavamulti-modalitymultimodalvision-language-model
コメント(0)
コメントするにはログインしてください。
同じカテゴリのOSS

ollama
ローカルでLLMを動かすための定番ツール
AIチャットMITGo

prompts.chat
プロンプトを共有・収集できるコミュニティ(旧Awesome ChatGPT Prompts)
AIチャットHTML

open-webui
セルフホストできる高機能AIチャットUIの決定版
AIチャットOtherPython

whisper
OpenAI製の高精度音声認識モデル
AIチャットMITPython

NextChat
ワンクリックでデプロイできる軽量ChatGPTクライアント
AIチャットMITTypeScript

MoneyPrinterTurbo
AIでワンクリック短尺動画を自動生成
AIチャットMITPython