2025 엘리스 AI Spark Camp 우승자 인터뷰 : 클라우드와 ML API로 완성한 AI 서비스
Elice
2025. 3. 20.
2025 엘리스 AI Spark Camp 우승팀 SNAPSUM 인터뷰: AI 영상 제작의 혁신 만들기
엘리스 AI Spark Camp란?
엘리스 AI Spark Camp는 AI 기술을 활용한 웹 서비스 개발 해커톤입니다.
짧은 모집 기간에도 불구하고 100명 이상이 신청하여 AI 개발에 대한 높은 관심을 다시 한 번 확인할 수 있었는데요. 이들 중 약 4:1의 경쟁을 뚫고 총 26명이 본선에 진출하였습니다.
참가자들은 엘리스 ML API와 엘리스클라우드를 사용해 AI 기반 서비스를 구현하는 미션을 받았고 AI 숏폼 영상 제작 서비스 ‘SNAPSUM’을 개발한 2팀이 우승 트로피를 차지하였습니다 🥳
웹페이지를 입력하면 AI가 자동으로 숏폼 영상을 만들어주는 서비스, SNAPSUM
SNAPSUM 팀이 어떻게 혁신적인 AI 서비스를 만들었는지, 우승팀의 리더 김재협 팀장님과의 인터뷰를 진행했습니다.
Q: 안녕하세요! 간단한 자기소개 부탁드립니다.
안녕하세요. 저는 SNAPSUM 팀의 김재협입니다.
저는 원래 선박 엔지니어로 5년간 해외에서 근무했어요. 하지만 장기간 해외에 머물면서 가족과 함께하는 시간이 부족했고, 더 다양한 도전을 해보고 싶다는 생각이 들었어요. 처음에는 해양경찰 시험을 준비했지만, 건강상의 이유로 방향을 다시 고민하게 되었습니다.
그때 개발자라는 직업을 접하게 되었고, 많은 사람들이 사용하는 서비스를 직접 만들어볼 수 있다는 점에서 매력을 느꼈어요. 그렇게 엘리스 클라우드 트랙을 수료하며 본격적으로 개발자의 길을 걷기 시작했고, AI 기술을 활용한 프로젝트에도 관심이 생겼어요.
이번 AI Spark Camp에 참가한 것도 같은 이유예요. 단순히 코드를 배우는 걸 넘어 실제 AI 기술을 적용해보고, 클라우드 환경에서 서비스를 배포하는 경험을 쌓고 싶었어요. 특히 팀 프로젝트를 통해 협업하면서 성장할 수 있을 것으로 생각했죠.
Q: SNAPSUM은 어떤 서비스인가요?
SNAPSUM은 웹페이지의 텍스트를 AI가 자동으로 요약하고, 이를 기반으로 TTS(음성 변환), 이미지 생성, 영상 합성 기술을 결합해 숏폼 영상을 자동으로 제작하는 AI 서비스입니다.
쉽게 말해, “URL만 입력하면 AI가 알아서 숏폼 영상을 만들어준다”는 개념이죠.
SNAPSUM 핵심 기술
✔ AI 텍스트 요약 – 웹페이지에서 핵심 내용 추출
✔ TTS 변환 – AI 음성으로 요약 내용을 들려줌
✔ 이미지 생성 – 요약된 내용을 시각적으로 표현
✔ 영상 합성 – 텍스트·음성·이미지를 결합해 영상 제작
Q: SNAPSUM 아이디어는 어떻게 떠올리셨나요?
최근 사람들이 짧은 콘텐츠를 선호하는 경향이 강해지고 있어요.
유튜브 쇼츠, 틱톡 같은 숏폼 콘텐츠가 인기이고 영화·드라마의 요약 영상도 인기가 높죠.
이러한 흐름 속에서 “웹페이지도 이런 식으로 요약해서 영상으로 볼 수 있다면 어떨까?”라는 아이디어가 떠올랐고 SNAPSUM 프로젝트를 기획하게 되었습니다.
엘리스클라우드와 ML API 덕분에 빠르게 개발할 수 있었어요.
Q: 서비스 개발 과정에서 가장 중요했던 부분은 무엇이었나요?
빠른 프로토타이핑(시제품 개발)이 가장 중요하다고 생각했어요.
해커톤은 시간이 2주 정도로 짧게 진행되었기 때문에, 기본 기능을 빨리 구현하고 테스트하며 개선하는 방식으로 진행했습니다.
이 과정에서 엘리스클라우드와 ML API가 큰 도움이 됐어요.
Q: 어떤 방식으로 엘리스 클라우드와 ML API를 활용하셨나요?
SnapSum을 개발하면서 엘리스클라우드와 ML API를 적극 활용했어요. 먼저 엘리스클라우드를 이용해 웹 애플리케이션을 빠르게 배포할 수 있었고, 덕분에 서버 환경을 손쉽게 구축하고 운영할 수 있었죠.
또한 엘리스 ML API를 통해 웹페이지의 텍스트를 자동으로 요약하고, 이를 기반으로 음성 변환(TTS)과 이미지 생성 기능을 구현했어요. 여기에 엘리스 TTS API까지 활용해서, AI 음성을 적용한 숏폼 영상 제작이 가능했습니다.
특히 ML API의 성능이 뛰어나서 “챗GPT API와 비교해도 뒤처지지 않는다”라는 느낌이었어요. 원하는 요청을 하면 정확한 수준의 응답을 받을 수 있었고, 덕분에 빠르게 서비스를 만들 수 있었죠.
Q: AWS, GCP 같은 글로벌 클라우드와 비교하면 어떤 차이가 있었나요?
AWS, GCP도 사용해 봤는데, 처음에는 복잡한 설정이 많아 시간이 오래 걸려요. 대신 규모가 크다 보니 레퍼런스가 많아서 빨리 적응할 수 있죠.
엘리스클라우드는 직관적인 UI 덕분에 초기 설정이 간편하고 빠르게 배포할 수 있다는 점과 같은 GPU여도 비용이 훨씬 저렴한 것이 장점이었어요.
AI 영상 생성 속도를 60~70% 단축한 비결
Q: 프로젝트를 진행하면서 가장 어려웠던 점은 무엇이었나요?
초기에는 영상 생성 속도가 너무 느렸어요.
텍스트 요약 → 음성 변환 → 영상 합성 과정이 한 번에 이루어지다 보니 메모리 사용량이 많아지고, 처리 속도가 떨어졌죠.
Q: 어떻게 해결하셨나요?
먼저 텍스트를 문단 단위로 분할하여 개별적으로 처리하는 방식을 도입했고, 그 결과 메모리 사용량을 크게 줄일 수 있었습니다.
또한 병렬 처리 기법을 적용하여 CPU 과부하를 줄이고 리소스를 최적화했으며, 마지막으로 NVIDIA NVENC 기반 GPU 가속을 활용해 영상 인코딩 속도를 개선했어요.
이러한 과정을 거친 후에는 메모리 사용량이 75% 감소했고, 비디오 생성 속도도 60~70%가량 단축되었습니다.
덕분에 AI 영상 생성 과정이 훨씬 안정적으로 이루어질 수 있었고, 더 빠르고 효율적인 서비스 제공이 가능해졌어요.
Q: 앞으로의 목표는 무엇인가요?
SNAPSUM을 더욱 발전시켜 AI 기반 콘텐츠 자동화 서비스로 확장하는 것이 목표예요. 지금보다 더 정교한 AI 요약과 영상 생성 기술을 적용해서, 사용자들이 편리하게 활용할 수 있도록 개선해 나갈 계획이에요. 궁극적으로는 이 서비스를 실제로 출시해서 더 많은 사람들이 사용할 수 있게 하는 게 최종 목표입니다.
SNAPSUM 팀이 만든 AI 숏폼 영상 제작 서비스, 어떻게 보셨나요?
AI 해커톤 진행 및 관련 서비스 개발에 관심이 있다면 엘리스클라우드를 활용해 직접 도전해 보세요!
- #해커톤
- #엘리스클라우드