머신러닝(ML)의 핵심 과제는 말하기 또는 쓰기 명령에 대응하여 복잡한 인간 환경을 식별할 수 있는 에이전트를 구축하는 것이다.로봇을 비롯한 오늘날의 모델은 복잡한 환경을 탐색할 수 있는 경우가 많지만, “오른쪽으로 닫힌 갈색 이중문을 지나 테이블 상단의 의자 뒤에 서라”는 등 자연어로 표현된 내비게이션 목표를 아직 이해할 수 없다.시각 및 언어 탐색(VLN. Vision-and-Language Navigation-관련 연구 다운)으로 불리는 이 과제는 공간 언어에 대한 정교한 이해를 요구한다. 예를 들어, “테이블 상단 의자 뒤”
출처 : 인공지능신문 – 전체기사