AI 추론에 특화된 고성능의 GPU 인프라를 사용량에 맞게 보다 합리적인 비용으로 활용할 수 있게 됐다. kt cloud(대표 윤동식)가 슬라이싱 기술을 GPU에 적용한 인공지능(AI) 추론 전용 인프라 서비스 ‘AI SERV’를 16일 출시했다.초거대 AI 분야에서 학습 영역은 단기간 집중적으로 대용량, 고사양의 GPU가 필요한 것과는 달리, 추론 영역은 적은 양의 GPU를 끊김 없이 상시 사용해야 하는 특성을 가지고 있다. 그런 만큼 학습에 사용한 인프라를 그대로 추론 인프라로 활용할 경우 필요 이상의 비용 부담이 발생해 왔다.
출처 : 인공지능신문 – 전체기사