Close

Llama 2 Chat 70B, 모델 평가에서 ChatGPT(3.5)를 능가

  • Instruction-Following 언어 모델을 자동으로 평가하는 AlpacaEval Leaderboard 기준
  • GPT-4 95.28% > Llama Chat 70B 92.66% > Claude 2 91.36% > ChatGPT 89.37%
  • AlpacaEval 은 AlpacaFarm 평가 세트를 이용하여 GPT-4 가 응답한 내용과 비교하여 자동으로 평가를 진행

출처 : GeekNews – 개발/기술/스타트업 뉴스 서비스

Leave a Reply

Your email address will not be published. Required fields are marked *

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.

© 2024 NORICOMPANY