
고려대학교 AGI Lab, 엘리스클라우드로 LLM 실험 병목 해소
박한솔
2025. 6. 4.

Industry, Regulation
Elice Product
Purpose
고려대학교 AGI Lab은 엘리스클라우드를 활용해 LLM 실험의 병목을 해소하고, 대규모 병렬 실험을 통해 논문 마감 대응력을 높였습니다. H100 GPU 인프라 기반의 연구 효율화 사례를 확인해보세요.
논문 마감 대응력과 연구 효율을 동시에 높인 클라우드 전환 사례
“H100이나 A100을 8대 이상 활용하더라도, 단일 실험에 최소 48시간이 걸리는 상황이 반복됐습니다.
논문 마감이 다가올수록 실험은 늘고, 시간은 부족했습니다.”
고려대학교 정보대학 인공지능학과 AGI Lab(지도교수 김성웅) 은 Multimodal Generative Modeling, Multimodal Preference Optimization, AI for Science를 중심으로 활발한 연구를 수행하고 있습니다.
AGI Lab 소속 지동환 연구원은 이미지, 영상, 음성 등 여러 모달리티를 통합해 생성할 수 있는 Multimodal LLM을 연구하고 있으며, 대규모 실험 환경에서 병렬 실험이 제한되는 구조적 어려움 속에서 엘리스클라우드를 통해 실험 효율을 크게 개선했습니다.
▲AGI Lab 단체사진
병렬 실험이 필요한 시점, 새로운 선택지
AGI Lab은 자체적으로 A100 GPU 10대, L40s GPU 8대를 보유하고 있으며, 외부에서는 인공지능산업융합사업단(AICA)으로부터 H100 GPU 8대를 대여해 사용하고 있었습니다.
하지만 실험 규모가 커질수록 확보 가능한 리소스에는 한계가 있었고, 논문 마감이 임박한 시점에는 더 많은 실험을 짧은 시간 안에 마쳐야 하는 상황이 반복되었습니다.
“병렬로 실험을 돌릴 수 없어 리소스를 기다리는 시간이 길었습니다.
하나의 모델을 여러 환경에서 테스트하기 버거운 상황이었죠.”
수업용 GPU 클라우드, 연구실 핵심 인프라로 전환되다
AGI Lab은 학부 수업을 위해 GPU 인프라가 필요한 시점에 엘리스클라우드를 처음 도입하게 되었습니다.
그리고 엘리스클라우드가 수업을 위한 리소스를 설정하면서 연구용으로도 충분히 활용할 수 있는 인프라라는 확신을 얻게 되었습니다.
“국내 클라우드라 네트워크 반응 속도도 좋고, 다양한 세팅을 빠르게 구성할 수 있는 점이 특히 마음에 들었습니다.”
현재 랩실에서는 H100 GPU 8개로 구성된 G-NHHS-640 인스턴스를 활용해 대규모 실험을 수행하고 있으며, 대용량 데이터는 엘리스클라우드의 데이터 버킷을 통해 효율적으로 저장·연동하고 있습니다.
반복 실험이 특히 많은 환경에서는 매번 대용량 데이터를 옮기고 구성하는 일이 번거롭고, 실험 흐름이 끊기는 경우도 많았는데, 엘리스클라우드의 데이터 버킷 기능을 활용하면서 실험 데이터를 사전에 업로드해 두고 GPU 인스턴스와 바로 연동해 사용할 수 있어 훨씬 효율적인 실험이 가능해졌죠.
실험 병렬화로 달라진 연구의 속도
엘리스클라우드를 도입한 이후 가장 크게 달라진 점은 고성능 실험을 동시에 여러 개 병렬로 진행할 수 있게 된 것입니다.
“이전에는 리소스 때문에 순차적으로 실험을 돌려야 했는데, 이제는 동시에 여러 개의 실험을 진행할 수 있어 마감 대응력이 완전히 달라졌습니다.”
실험 다양성 확보와 반복 테스트가 가능해지면서 연구 몰입도 또한 크게 올라갔죠.
논문 준비와 병행해 새로운 아키텍처 실험도 무리 없이 소화할 수 있는 구조가 만들어졌습니다.
실제로 지동환 연구원은 최근 학회 논문을 준비하던 시기에 여러 하이퍼파라미터 조합과 모델 구조를 동시에 테스트해야 했습니다.
이때 엘리스클라우드를 활용해 실험을 병렬로 분산시킨 덕분에 마감 이틀 전까지도 새로운 실험을 시도할 수 있었고, 결과를 빠르게 반영해 논문을 제출할 수 있었습니다.
실험 중심 환경에 적합한 사용성과 기술 지원
엘리스클라우드는 연구자가 설정이나 운영에 시간을 쏟지 않고 실험 그 자체에 집중할 수 있도록 설계된 인프라라는 점에서 높은 평가를 받았습니다.
“Shared Memory 부족 같은 기술 이슈가 발생했을 때도 엘리스 측에서 바로 대응해줘서 일정에 차질이 없었습니다.
다른 클라우드였다면 며칠씩 지연됐을 수도 있었을 텐데요.”
엘리스클라우드의 인스턴스 생성은 웹 기반으로 직관적으로 설계되어 있으며, 자주 사용하는 세팅은 그대로 복사해 반복 실험도 수월하게 운영할 수 있습니다.
앞으로의 계획: 하이브리드 실험 구조
AGI Lab은 향후 자체 보유 서버와 엘리스클라우드를 병행하는 형태로 연구 환경을 운영할 계획입니다.
- 초기 실험과 디버깅 → 자체 서버
- 마감 일정 대응, 병렬 실험, 대규모 학습 등 → 엘리스클라우드
“GPU 자원이 부족하거나 실험이 몰릴 때, 엘리스클라우드를 병렬 실험 전용 인프라로 두는 전략이 효과적이라고 판단했습니다.”
연구자가 실험에만 집중할 수 있는 인프라
지동환 연구원은 엘리스클라우드가 단순한 서버 제공을 넘어, 연구자에게 꼭 필요한 속도와 유연성을 갖춘 클라우드라고 강조합니다.
“가격이 합리적이고, 인스턴스 생성도 빠르며, 기술 대응도 굉장히 빠릅니다.
실험 외적인 스트레스를 줄이고 싶은 연구자에게 꼭 맞는 인프라입니다.”
더 많은 실험을, 더 짧은 시간 안에.
엘리스클라우드는 대규모 병렬 실험, 빠른 환경 전환, 유연한 리소스 활용을 통해 연구자들이 논문 마감에 맞춰 결과를 도출하고, 실험 속도를 단축할 수 있도록 돕고 있습니다.
연구자를 위한 클라우드, 지금 바로 엘리스클라우드를 경험해보세요.