Close

AI2 Dolma: 언어모델을 위한 3T 토큰 오픈 코퍼스

  • Allen Institute for AI 가 만드는 데이터셋
  • 웹 콘텐츠, 학술 간행물, 코드, 서적 및 백과사전 자료의 믹스
  • 3조(Trillion)개로 현재까지 공개된 것중 가장 큰 규모의 데이터 셋
  • HuggingFace 허브에서 다운로드 가능
  • AI2 ImpACT 라이센스(Artifact의 Risk에 따라 Low/Mediu…

    출처 : GeekNews – 개발/기술/스타트업 뉴스 서비스

Leave a Reply

Your email address will not be published. Required fields are marked *

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.

© 2024 NORICOMPANY