Close

알리바바, 이미지 이해 기능 갖춘 생성 AI ‘대형 시각 언어 모델’ 오픈소스로 공개

알리바바 그룹의 디지털 기술 및 인텔리전스 중추인 알리바바 클라우드가 개방형 대규모 시각 언어 모델(Large Vision Language Model, 이하, LVLM) ‘Qwen-VL’과 대화형 모델 ‘Qwen-VL-Chat’을 출시했다. 두 모델은 프롬프트의 이미지, 텍스트 및 경계상자를 이해할 수 있으며 영어와 중국어로 다중 라운드 질문에 대한 답변을 지원한다.먼저, Qwen-VL은 알리바바 클라우드의 70억 개 매개변수로 구성된 대규모 언어 모델인 통이치엔원 (Tongyi Qianwen)의 멀티모달 버전으로, 모델스코프(Mo

출처 : 인공지능신문 – 전체기사

Leave a Reply

Your email address will not be published. Required fields are marked *

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.

© 2024 NORICOMPANY