Close

LLaVA: Visual Instruction Tuning

  • "LLaVA : Large Language and Vision Assistant"
  • 범용적인 시각 및 언어 이해를 위해 비전 인코더와 Vicuna를 결합한 대규모 멀티 모달 모델
  • 멀티모달 GPT-4 수준의 능력 및 과학 질문/답변에 있어서 SOTA 정확도를 추구
  • 논문과 코드, 데모 공개

출처 : GeekNews – 개발/기술/스타트업 뉴스 서비스

Leave a Reply

Your email address will not be published. Required fields are marked *

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.

© 2024 NORICOMPANY