한양대학교 AI LAB이 RAG 실험 생산성을 높인 방법 - 엘리스클라우드 ML API

Elice

2026. 2. 6.

고객

한양대학교 AI LAB

도입 서비스

클라우드

한양대학교 AI LAB은 그래프 기반 RAG 연구에서 반복 실험과 대규모 호출이 잦은 환경에 대응하기 위해 엘리스클라우드 ML API를 도입했습니다. 그 결과, 데이터 준비부터 답변 생성까지 전 과정을 안정적으로 운영하며 연구 몰입도와 실험 생산성을 동시에 높일 수 있었습니다.

한양대학교 인공지능연구실(이하 AI LAB)은 Vision과 자연어처리(NLP)를 중심으로 다양한 AI 연구를 수행하는 연구 그룹입니다. 최근에는 LLM(대규모 언어모델)과 RAG(Retrieval-Augmented Generation), 환각 완화 등 실제 서비스 환경에서도 활용 가능한 연구 주제에 집중하고 있습니다.

AI LAB이 주력으로 연구하고 있는 분야 중 하나는 그래프 기반 RAG입니다. 그래프 기반 RAG란 하나의 문서만으로 답하기 어려운 복잡한 질문에 대해 서로 다른 문서와 정보를 단계적으로 연결해 답을 도출하는 방식입니다. 예를 들어, 한 연구 기법의 이론적 배경과 산업 적용 사례를 함께 묻는 질문처럼 여러 자료를 연결해야 할 때, 텍스트를 그래프 형태로 구조화해 정보를 찾고 답변을 만드는 방식입니다.

변동성 큰 연구 환경, 유연한 ML API로 대응

AI LAB은 연구 환경에 가장 적합한 선택으로 엘리스클라우드 ML API를 도입했습니다. 사용량 기반 과금 구조, 다양한 모델을 단일 플랫폼에서 활용할 수 있는 구조, 그리고 국내 기반 기술 지원 환경이 연구 방식과 잘 맞았기 때문입니다.

초기에는 OpenAI GPT API를 직접 활용해 연구를 진행했지만, 연구 특성상 실험량이 시기에 따라 크게 달라지고 대규모 실험이 필요할 때는 여러 실험을 동시에 수행해야 했습니다. 이 과정에서 사용량 관리와 호출 제한(이하 Rate limit) 문제로 운영 부담이 증가했습니다.

GPU 서버를 직접 운영하는 방식도 검토했지만, 장비 관리와 성능 최적화에 필요한 시간 때문에 연구 몰입도가 낮아질 수 있다는 점이 우려되었습니다. 또한 GPT뿐 아니라 여러 모델을 비교·검증해야 했기 때문에 다양한 모델을 유연하게 활용할 수 있는 환경이 필요했습니다.

연구비 집행 구조도 중요한 판단 요소였습니다. 해외 기반 서비스는 결제와 정산 과정에서 연구비 사용이 까다로운 경우가 많았던 반면, 국내에서 운영되는 클라우드 서비스는 연구비를 클라우드 비용으로 명확하게 집행할 수 있다는 장점이 있었습니다. 이러한 요구사항을 충족하면서 ML API를 안정적으로 사용할 수 있는 환경을 검토한 결과, 엘리스클라우드를 선택하게 되었습니다.

데이터 준비부터 답변 생성까지, 전 과정에서 ML API 활용

▲ 연구 내용 일부 발췌

AI LAB은 엘리스클라우드 ML API를 RAG 연구의 전 과정에서 활용하고 있습니다. 먼저 방대한 텍스트 데이터를 정리해 서로 연결된 구조로 구성하고, 이를 지식 그래프(Knowledge Graph) 형태로 구축했습니다. 이후 검색 성능을 높이기 위해 텍스트를 임베딩(Embedding: 텍스트를 숫자 벡터로 변환해 의미가 비슷한 데이터를 더 정확하게 찾도록 돕는 방식) 형태로 변환했으며, 이 과정에서도 ML API를 적극적으로 활용했습니다. 이렇게 정리된 데이터를 바탕으로 정보를 검색하고, 검색 결과를 토대로 답변을 생성하는 단계 역시 ML API 환경을 활용하고 있습니다.

이러한 구조가 자리 잡으면서 호출 패턴도 자연스럽게 형성되었습니다. 연구 초기에는 데이터 정리와 임베딩 생성 과정에서 API 호출량이 집중되고, 이후 실험 반복 단계에서는 검색과 답변 생성 요청이 꾸준히 발생하는 형태입니다. AI LAB은 이와 같은 호출량 변동성을 ML API 환경에서 안정적으로 관리하며 RAG 연구를 이어가고 있습니다.

실시간 사용량 확인 및 안정적인 호출 제한으로 연구에 몰입할 수 있는 환경

엘리스클라우드를 도입한 이후 AI LAB은 사용량 관리와 운영 환경 측면에서 의미 있는 변화를 경험했습니다. 약 1분 단위로 토큰 사용량을 확인할 수 있어 실험이 집중되는 시점의 호출량 변화를 빠르게 파악할 수 있었고, 사용자별 사용량을 팀 단위에서 함께 관리할 수 있는 구조도 공동 연구 환경에 적합했습니다. Rate limit 환경 역시 안정적으로 유지되어, 여러 실험을 동시에 진행해야 하는 시기에도 연구를 끊지 않고 이어갈 수 있었습니다.

또한 서버리스(Serverless) 형태의 ML API를 통해 GPU 서버를 직접 운영해야 하는 부담에서도 벗어났습니다. 모델 운영 과정에서 필요한 자원 관리, 성능 최적화, 장애 대응 등을 별도로 수행하지 않아도 되어, 연구팀은 알고리즘 설계와 실험 검증 등 본질적인 연구 활동에 집중할 수 있었습니다. 이러한 환경은 연구 운영 효율을 높이고, 실험 설계와 데이터 분석에 더 많은 시간을 투자할 수 있는 기반이 되었습니다.

사용량 기반 과금으로 연구비 부담 유연하게 조정

AI LAB의 연구 환경은 초기 구축 단계와 반복 실험 단계가 뚜렷하게 구분됩니다. 이러한 구조에서 사용량 기반 과금 체계는 예산 집행과 실험 계획 운영 측면에서 합리적으로 작용했습니다. 고정비 기반 인프라 대비 비용 부담을 유연하게 조정할 수 있었고, 연구팀은 보다 다양한 실험을 안정적으로 설계할 수 있었습니다.

다양한 모델 비교 연구까지 확장 가능

AI LAB은 현재 GPT 계열 모델을 중심으로 연구를 진행하고 있지만, 향후에는 LLaMA, Qwen, Gemini 등 다양한 모델을 포함한 비교 연구를 확대할 계획입니다. 동일한 조건에서 모델별 성능과 특성을 분석하고, 환각 발생 양상과 컨텍스트 길이에 따른 차이도 함께 검증할 예정입니다.

연구 조직에 필요한 안정성과 유연성 모두 제공

한양대학교 AI LAB은 엘리스AI클라우드 ML API를 도입하며 안정적인 연구 운영 환경을 구축했습니다. 실시간에 가까운 사용량 가시성, 유연한 비용 구조, 운영 부담이 낮은 모델 활용 환경은 연구팀이 보다 수월하게 실험을 설계하고 성과에 집중할 수 있도록 돕고 있습니다.

엘리스AI클라우드 ML API는 연구 조직이 필요로 하는 안정성과 유연성을 함께 제공하는 실험 환경으로 자리 잡고 있습니다.