End-to-End AI 클라우드: AI 모듈형 데이터센터부터 GPUaaS까지 – 엘리스 KRnet 2025 발표
박한솔
2025. 6. 24.
2025년 6월 23일부터 24일까지 열린 KRnet 2025(The 33rd Korea Internet Conference) 는 AI, 6G, 클라우드, 양자 기술 등을 중심으로 한 ICT 융합 흐름을 조망한 국내 최대 규모의 인터넷 기술 행사입니다.
엘리스 박정국 CTO는 이 자리에서 “End-to-End AI 클라우드”를 주제로 발표했습니다. 발표에서는 단순한 자원 제공을 넘어, AI 인프라를 기획부터 운영, 그리고 서비스화까지 하나의 흐름으로 연결하는 전략을 소개했는데요.
특히 GPUaaS와 모듈형 데이터센터(PMDC) 라는 두 축을 중심으로 한 접근은 행사 참석자들의 높은 관심을 끌었습니다.
지금부터 해당 발표의 핵심 내용을 중심으로, 엘리스가 제시한 전략과 기술 방향을 소개 드리겠습니다.
AI 인프라가 나아갈 방향
생성형 AI 등 최신 AI 워크로드는 단순 GPU 탑재를 넘어선 높은 연산 성능과 유연한 운영 환경을 요구하죠.
엘리스는 ‘End-to-End’라는 키워드를 통해 설계부터 서비스화까지 이어지는 AI 클라우드 전략을 제안했습니다. 이는 기술 변화에 빠르게 대응하고, 운영 효율을 높이기 위한 선택이기도 합니다.
End-to-End AI 클라우드란?
엘리스가 말하는 ‘End-to-End AI 클라우드’ 는 단순히 AI 연산 자원을 제공하는 수준을 넘어서 설계 → 구축 → 운영 → 보안 → 서비스화에 이르는 전체 인프라 주기를 하나의 통합된 구조로 연결한 모델입니다.
End-to-End AI 클라우드 모델은 아래와 같은 단계로 구성됩니다.
- 인프라 설계: AI 워크로드에 최적화된 전력, 냉각, 보안 구조 설계
- 모듈형 데이터센터(PMDC) 구축: 빠르게 설치 가능한 물리적 인프라 기반 마련
- GPU/NPU 리소스 구성: GPU(H100, B200 등) 및 NPU(ATOM, Renegade, Warboy 등) 기반 고성능 연산 환경 구성
- GPUaaS 서비스화: 온디맨드 및 예약형 방식으로 GPU 자원을 유연하게 제공, API 기반 접근 지원
- 통합 보안 체계 내재화: 물리·기술·관리 계층의 다중 보안 설계
이러한 통합 구조는 속도, 유연성, 보안, 확장성을 모두 고려한 AI 클라우드 인프라 구축을 가능하게 합니다.
모듈형 AI 데이터센터란?
엘리스는 기존의 전통적인 데이터센터 구축 방식에서 벗어나 모듈형 데이터센터(PMDC)를 선택하여 2022년부터 발빠르게 AI 시대를 준비했습니다.
이 구조는 빠른 구축과 전력·냉각 효율, 유지비 절감 등 다양한 장점이 있으며, 다음과 같은 단계로 구축합니다.
- 요구 분석: 사용 환경, 전력 수요, 공간 요건 등을 기준으로 설계 방향 설정
- 전력·냉각 설계: 고밀도 고효율 설계 (예: 40kW 공랭식 랙 또는 80kW 수냉식 랙)
- 모듈형 조합: 다양한 모듈의 조합 및 클러스터링 (예: 1 x 240kW 공랭식 NPU 모듈 + 9 x 480kW 수냉식 B200 2048 클러스터 모듈)
- 보안 설계: 랙 잠금, 출입 통제, 암호화, 이상 탐지 등 보안 요소 내재화
- 제작 및 설치: 공장에서 제작 후 현장에 배치 → 테스트 → 운영 전환
GPUaaS, 어떤 강점이 있을까?
엘리스는 하드웨어 중심 인프라를 뛰어넘어 GPUaaS(GPU-as-a-Service) 형태의 AI 클라우드 서비스를 직접 운영하고 있습니다.
이 서비스는 GPU 자원을 API로 요청하고, 사용한 만큼만 과금하는 온디맨드 방식으로, 고정된 자산 투자 없이도 고성능 연산 환경을 빠르게 확보할 수 있습니다.
GPUaaS 주요 강점은 다음과 같습니다.
- 비용 경쟁력: 전 세계 주요 클라우드 대비 최대 70% 저렴한 GPU 사용료 제공
- 즉각적인 연산 환경 확보: H100, A100 등 고성능 GPU를 즉시 스핀업 가능
- 연산 환경 다양성: 온디맨드·예약 방식(1개월/3개월) 선택 가능, NPU까지 지원
- ML API 옵션: LLM, 음성인식 등 다양한 AI 모델을 API 형태로 빠르게 서비스화 가능
GPUaaS 활용 예시
- AI 스타트업은 고성능 GPU 리소스를 즉시 확보해 모델 학습 속도를 단축하고
- 연구기관은 일정 기간 동안 예약형 GPU를 활용해 실험 예산을 최적화하며
- 기업(제조·헬스케어 등)은 추론 워크로드에 GPUaaS 또는 ML API를 접목해 전산 리소스를 유연하게 운용하고 있습니다.
엘리스는 자동화된 자원 할당, 실시간 모니터링, 고가용성 클러스터를 기반으로 안정적인 서비스를 제공합니다.
CSAP IaaS 인증까지, 신뢰할 수 있는 보안 인프라
보안은 클라우드 환경의 핵심 요소입니다. 엘리스는 AI 인프라 설계 초기부터 보안을 내재화했습니다.
- 물리적 보호: 서버 랙 단위의 잠금, 출입 통제, CCTV 운영
- 기술적 보호: 접근제어, 암호화된 전송, 이상 행위 탐지 시스템
- 관리적 보호: 역할 기반 권한 제어, 정기 로그 감사, 보안 교육
엘리스클라우드는 국내 AI PMDC 최초로 CSAP IaaS 인증을 획득했습니다.
해당 인증은 116개 항목의 국가 공인 보안 기준을 통과한 인프라에만 부여되며, 공공기관 및 민감 산업에서 요구하는 신뢰 기준을 충족한다는 의미입니다.
이러한 점은 보안을 중시하는 공공기관은 물론, 금융, 의료, 제조 기업에서도 엘리스를 신뢰할 수 있는 이유가 됩니다.
AI 인프라 구축 히스토리
- 2022년 7월: 1차 공랭식 PMDC 구축
- 2024년 6월: GPUaaS 정식 런칭
- 2025년 8월 예정: NVIDIA B200 탑재 수냉식 기반 대규모 PMDC 확장
현재까지 수십 개 기관이 엘리스 인프라를 활용 중이며, 안정성과 운영 효율 측면에서 긍정적인 피드백을 받고 있습니다.
AI 시대의 새로운 데이터센터, 엘리스 AI PMDC
전통적인 퍼블릭 클라우드는 사용 편의성 측면에서는 강점이 있지만, AI 워크로드에 필요한 전력 밀도와 냉각 설계에는 한계가 있습니다.
PMDC 기반 인프라는 다음과 같은 이유로 주목받고 있습니다.
- 빠른 설치 및 확장성
- 비용 절감 및 맞춤형 설계 지원
- 특정 위치나 조건에 제약받지 않는 하이퍼로컬 대응력
엘리스와 함께, End-to-End로 AI 인프라를 설계해보세요
KRnet 2025에서 소개된 엘리스의 전략은 AI 인프라의 설계부터 구축, 서비스화까지 하나의 흐름으로 연결하는 새로운 기준을 제시했습니다.
GPUaaS, 모듈형 PMDC, 통합 보안 구조가 유기적으로 연결된 이 생태계는 복잡한 인프라 운영의 부담을 줄이고, AI 프로젝트에 집중할 수 있는 환경을 만들어 줍니다.
AI 인프라 구축을 고민 중이시라면,엘리스가 기획부터 설계, 구축, 운영까지 End-to-End로 함께하겠습니다.
AI를 더 빠르게, 더 안전하게 실현할 수 있도록, 지금 엘리스와 시작해보세요.
- #엘리스클라우드
- #KRNET2025