Close

DeepFloyd IF – 오픈소스 Text-to-Image 모델

  • Stability AI 의 새 이미지 모델
  • 언어 이해도가 기존 모델에 비해 높고, 포토리얼리즘한 이미지를 생성
  • T5 Transformer 기반 Frozen 텍스트 인코더와 3단계 픽셀 디퓨전 모듈의 결합
    • 64×64, 256×256, 1024x1024px
  • Zero-shot FID 스코어 6.66 (COCO 데이터셋)…

    출처 : GeekNews – 개발/기술/스타트업 뉴스 서비스

Leave a Reply

Your email address will not be published. Required fields are marked *

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.

© 2024 NORICOMPANY