Dedicated 방식으로 모델 사용하기
Dedicated는 특정 모델을 전용 인스턴스에 배포하여 운영하는 방식입니다. 서버 리소스를 독립적으로 점유하기 때문에, 안정적인 성능이 필요한 상용 서비스 환경에 적합합니다.
특징
- 전용 인스턴스에서 모델 실행
- 안정적인 성능 제공
- 장기 실행 및 지속 호출 환경에 적합
- 인스턴스 실행 시간 기준 과금
Dedicated 엔드포인트 생성
Dedicated 엔드포인트는 다음 2가지 절차 중 하나를 통해 생성할 수 있습니다.

- ML API -> Dedicated 엔드포인트 이동
- 엔드포인트 생성 버튼 클릭
- 모델 선택
- 엔드포인트 이름 입력
- 인스턴스 스펙 선택 (CPU / GPU / NPU)
- 오토스케일링 기능 활성화 혹은 인스턴스 개수 설정
- API Rate Limit 기능 설정
- 엔드포인트 생성 완료
혹은
