Close

TabLib – 867B Tabluar Token 데이터셋

  • LLM 훈련을 위한 627M(6.27억)개의 테이블과 867B(8670억)개 토큰 데이터셋
    • 웹페이지, Excel, CSV, SQLite 등에서 추출된 테이블을 포함
    • 파일 이름, 소스 URL, 각 테이블 주변 텍스트 등 풍부한 상황별 데이터
  • 표 형식 데이터 작업에 대한 더 나은 이해와 기술 구축에 …

    출처 : GeekNews – 개발/기술/스타트업 뉴스 서비스

Leave a Reply

Your email address will not be published. Required fields are marked *

이 사이트는 Akismet을 사용하여 스팸을 줄입니다. 댓글 데이터가 어떻게 처리되는지 알아보세요.

© 2025 NORICOMPANY