알리바바 그룹의 디지털 기술 및 인텔리전스 중추인 알리바바 클라우드가 개방형 대규모 시각 언어 모델(Large Vision Language Model, 이하, LVLM) ‘Qwen-VL’과 대화형 모델 ‘Qwen-VL-Chat’을 출시했다. 두 모델은 프롬프트의 이미지, 텍스트 및 경계상자를 이해할 수 있으며 영어와 중국어로 다중 라운드 질문에 대한 답변을 지원한다.먼저, Qwen-VL은 알리바바 클라우드의 70억 개 매개변수로 구성된 대규모 언어 모델인 통이치엔원 (Tongyi Qianwen)의 멀티모달 버전으로, 모델스코프(Mo
출처 : 인공지능신문 – 전체기사