Hide for Today

연구비 고민은 GPU 충전으로 해결

(3/31 마감) 클라우드 충전하면 15% 크레딧 제공 중

엘리스 X NVIDIA 원데이 워크샵

4/19(토) 하루! 최신 LLM 트렌드가 궁금하다면

연구비 고민은 GPU 충전으로 해결

(3/31 마감) 클라우드 충전하면 15% 크레딧 제공 중

엘리스 X NVIDIA 원데이 워크샵

4/19(토) 하루! 최신 LLM 트렌드가 궁금하다면

연구비 고민은 GPU 충전으로 해결

(3/31 마감) 클라우드 충전하면 15% 크레딧 제공 중

엘리스 X NVIDIA 원데이 워크샵

4/19(토) 하루! 최신 LLM 트렌드가 궁금하다면

Elice logo

[벤치마크] Whisper-large-v3: 속도와 비용 효율성, 얼마나 뛰어날까?

Elice 이영빈

2025. 2. 18.

Whisper-large-v3, 고성능 음성 인식 모델

Whisper-large-v3는 OpenAI에서 공개한 최신 음성 인식 모델로, 다국어 음성 인식, 자동 자막 생성, 오디오 텍스트 변환 등의 작업에서 뛰어난 성능을 발휘합니다. 기존 Whisper 모델보다 향상된 정확도를 제공하며, 특히 다양한 언어와 악센트를 효과적으로 처리할 수 있는 강점을 갖고 있습니다. 또한, 다양한 음성 데이터셋에서 훈련되어 복잡한 환경에서도 높은 정확도의 음성 인식을 수행할 수 있습니다.

부하 테스트 개요: 환경 및 설정

Whisper-large-v3의 속도와 비용 성능을 평가하기 위해 엘리스클라우드의 A100 80GB GPU에서 부하 테스트를 진행하였습니다. 다양한 부하 수준에서 테스트를 수행하여 모델의 실전 적용 가능성을 검토하였습니다.

테스트는 OpenAI Whisper 공식 패키지를 활용하여 모델을 실행하고, BentoML을 통해 서빙하였습니다. Python 기반의 부하 테스트 도구인 Locust를 사용하여 HTTP 요청을 시뮬레이션하며 성능을 평가하였습니다.

📌 테스트 환경 및 설정

  • GPU: 엘리스클라우드 A100 80GB
  • 부하 테스트 도구: Locust
  • 프레임워크: OpenAI Whisper + BentoML
  • 테스트 데이터: Wikipedia Corpus English Part1 데이터셋 (1942 video game 음성, 3분 35초 길이)
  • Concurrent Users: 1 (동시에 테스트를 수행하는 가상 사용자 수)
  • Run Time: 60분 (총 테스트 실행 시간)
  • Expected Workers: 5 (서버가 처리할 워커 프로세스 수)

📊 벤치마크 테스트 결과

Whisper-large-v3의 속도와 비용 성능을 측정하기 위해 다음 두 가지 정량적 지표를 고려하였습니다.

  • Response per second (RPS): 초당 요청 처리 수
  • Real-time factor (RTF): 초당 음성 처리 길이 (초)

📌 성능 측정 결과

whisper_large_v3 _표.webp
✅ 1달러당 83.47시간 분량의 음성을 처리 가능
✅ OpenAI 공식 API 대비 30배 더 많은 음성을 처리 (비용 절감 효과)
✅ RTF 117로 실시간 음성 처리 속도 대폭 향상

Whisper-large-v3는 대량 오디오 처리 및 실시간 음성 인식에 최적화된 성능을 보였습니다.

테스트 결과에 따르면, Whisper-large-v3는 OpenAI 공식 API가 1달러당 2.78시간 분량의 음성을 처리하는 것과 비교해 1달러당 83.47시간의 음성을 처리할 수 있어 비용 절감 효과가 뛰어난 모델임이 입증되었습니다. 또한, 실시간 환경에서도 안정적인 성능을 유지하여 대량 오디오 데이터를 효과적으로 처리할 수 있었습니다.

특히, 엘리스클라우드 A100 80GB GPU 환경을 활용하면 기존 상용 API 대비 30배 더 저렴한 비용으로 음성을 처리할 수 있었습니다.

Whisper-large-v3, 실전에서 얼마나 유용할까?

Whisper-large-v3는 실시간 음성 인식과 대량 오디오 처리에 최적화된 모델로, 이번 테스트에서도 우수한 성능과 비용 효율성을 입증했습니다.

다양한 음성 데이터 처리 작업에서 활용할 수 있으며, GPU 최적화 환경에서 운영하면 비용 절감 효과가 더욱 극대화됩니다.

특히, 엘리스클라우드를 활용하면 OpenAI 공식 API 대비 더 빠른 처리 속도와 합리적인 비용으로 최적의 성능을 경험할 수 있습니다.


👉🏻 엘리스클라우드에서 Whisper-large-v3와 같은 다양한 모델 사용해보기
👉🏻 더 많은 엘리스 벤치마크 리포트 살펴보기




작성: 엘리스 이영빈
편집: 엘리스 박한솔

  • #벤치마크
  • #Whisper-large-v3