HomeNewsITAI2 Dolma: 언어모델을 위한 3T 토큰 오픈 코퍼스 AI2 Dolma: 언어모델을 위한 3T 토큰 오픈 코퍼스 2023년 8월 25일노리컴퍼니ITNo Comments 122 views Allen Institute for AI 가 만드는 데이터셋 웹 콘텐츠, 학술 간행물, 코드, 서적 및 백과사전 자료의 믹스 3조(Trillion)개로 현재까지 공개된 것중 가장 큰 규모의 데이터 셋 HuggingFace 허브에서 다운로드 가능 AI2 ImpACT 라이센스(Artifact의 Risk에 따라 Low/Mediu… 출처 : GeekNews – 개발/기술/스타트업 뉴스 서비스 관련