HomeNewsITStarCoder, BigCode 프로젝트가 공개한 코드용 LLM StarCoder, BigCode 프로젝트가 공개한 코드용 LLM 2023년 5월 8일노리컴퍼니ITNo Comments 190 views 80+개의 프로그래밍 언어에 대해서 1조개의 토큰으로 훈련된 15.5B 모델 효율적인 생성을 위해 MQA를 새용하여, 8192 토큰 컨텍스트 윈도우를 가짐 StarCoderBase : 80개 이상의 언어 데이터를 가진 The-Stack v1.2(6TB) 데이터셋으로 훈련 StarCoder : Python에 대해서 좀 더 훈련… 출처 : GeekNews – 개발/기술/스타트업 뉴스 서비스 관련