Close

나는 수동으로 간단한 시퀀스를 예측하는 트랜스포머를 만들었다

  • 저자가 수동으로 GPT-2와 유사한 트랜스포머 모델을 구축하여 간단한 시퀀스를 예측하고 트랜스포머와 주의 메커니즘에 대한 더 깊은 이해를 얻음.
  • 트랜스포머는 기존 가중치를 사용하여 훈련되지 않았으며, 각 가중치는 수동으로 할당되었음.
  • 트랜스포머에 선택된 작업은 "aabaabaabaa…

    출처 : GeekNews – 개발/기술/스타트업 뉴스 서비스

Leave a Reply

Your email address will not be published. Required fields are marked *

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.

© 2024 NORICOMPANY