Hide for Today

연구비 고민은 GPU 충전으로 해결

(3/31 마감) 클라우드 충전하면 15% 크레딧 제공 중

엘리스 X NVIDIA 원데이 워크샵

4/19(토) 하루! 최신 LLM 트렌드가 궁금하다면

연구비 고민은 GPU 충전으로 해결

(3/31 마감) 클라우드 충전하면 15% 크레딧 제공 중

엘리스 X NVIDIA 원데이 워크샵

4/19(토) 하루! 최신 LLM 트렌드가 궁금하다면

연구비 고민은 GPU 충전으로 해결

(3/31 마감) 클라우드 충전하면 15% 크레딧 제공 중

엘리스 X NVIDIA 원데이 워크샵

4/19(토) 하루! 최신 LLM 트렌드가 궁금하다면

Elice logo

뇌파 분석 AI 모델 개발 – 트랜스포머 기반 LBM 구축 사례

Elice

2025. 2. 19.

프로젝트 주요 내용

EEG 데이터를 AI로 분석하는 방법– 트랜스포머 기반 Large Brain Model(LBM) 개발 사례
뉴럴 토크나이저 및 사전 학습 모델 구축 – 다양한 EEG 데이터셋을 통합 학습
고성능 분산 학습 환경 활용 – 4x A100, 8x H100 기반 멀티 노드 트레이닝

뇌과학 및 바이오 신호 처리 분야에서 EEG(뇌파) 데이터를 활용한 AI 연구가 빠르게 발전하고 있습니다. 최근 LLM(Large Language Model)이 자연어 처리에서 뛰어난 성과를 보인 것처럼, 트랜스포머 아키텍처를 EEG 데이터 분석에 적용하려는 시도가 활발합니다.

이에 엘리스는 EEG 데이터를 학습하는 AI 파운데이션 모델을 개발하는 프로젝트를 수행하였으며, 이를 통해 **Large Brain Model(LBM)**을 구축했습니다. 본 프로젝트는 기존 뇌-컴퓨터 인터페이스(BCI) 모델의 한계를 극복하고, 보다 범용적인 AI 모델을 개발하는 것을 목표로 했습니다.

뇌파 분석 AI 모델 개발-2.png

프로젝트 개요

LBM 프로젝트는 다양한 EEG 데이터셋을 학습할 수 있는 대규모 AI 모델을 구축하는 것을 목표로 진행하였습니다. 주요 기술 요소는 다음과 같습니다.

  • EEG 신호 전처리 및 뉴럴 코드북(Neural Codebook) 구축
  • 뉴럴 토크나이저(Neural Tokenizer) 개발
  • 트랜스포머 기반 LBM 모델 학습
  • 멀티 노드 분산 학습 환경 구축 및 최적화

특히, 4x A100 및 8x H100 GPU 기반 멀티 노드 환경을 활용해 대규모 학습을 수행했으며, NVIDIA DeepOps, SLURM, Grafana, Prometheus 등의 프레임워크를 사용하여 학습 성능을 최적화했습니다.


핵심 기술 및 방법론

1. EEG 신호 전처리 및 뉴럴 코드북 구축

EEG 데이터는 신호 대 잡음비(SNR)가 낮고, 채널 수와 샘플 길이가 일정하지 않다는 문제를 가지고 있습니다. 이를 해결하기 위해 EEG 신호를 세그먼트 단위로 분할하고, 벡터 양자화(Vector-Quantized) 기법을 활용하여 뉴럴 코드북(Neural Codebook)으로 변환했습니다.

이 접근법은 연속적인 신호 데이터를 보다 압축된 신경 표현(neural representation)으로 변환하여 모델이 효과적으로 학습할 수 있도록 합니다.

뇌파 분석 AI 모델 개발-1.png

2. 뉴럴 토크나이저(Neural Tokenizer) 개발

LBM 모델은 EEG 데이터를 보다 의미 있는 정보 단위로 변환하기 위해 뉴럴 토크나이저(Neural Tokenizer)를 개발했습니다.

  • EEG 신호의 개별 채널 패치를 뉴럴 코드로 변환
  • 다양한 EEG 데이터셋에서 일관되게 적용 가능하도록 설계
  • 결과적으로, 여러 데이터셋을 활용한 범용적 학습 기반 구축

뉴럴 토크나이저는 이후 Transformer 모델 학습에 사용될 EEG 데이터의 토큰화 과정에서 핵심적인 역할을 합니다.

3. 트랜스포머 기반 사전 학습 모델 구축

최근 LLM이 자연어 처리에서 강력한 성능을 보인 것처럼, 본 프로젝트에서는 Transformer 아키텍처를 EEG 데이터에 적용한 Large Brain Model (LBM)을 개발했습니다.

LBM은 마스킹된 EEG 신호 패치의 원래 코드값을 예측하는 방식으로 학습되며, 이를 통해 비지도 학습(unsupervised learning)을 활용한 EEG 데이터의 범용적 지각 능력을 확보했습니다.

4. 멀티 노드 분산 학습 및 모니터링

LBM 모델의 대규모 학습을 위해 멀티 노드 환경을 구축하고, NVIDIA DeepOps 및 SLURM을 활용한 최적화된 분산 학습을 수행했습니다.

  • 4x A100, 8x H100 기반 고성능 학습 환경
  • Grafana 및 Prometheus 기반 실시간 모니터링
  • GPU 자원 사용률 최적화 및 학습 과정 문제 해결

이를 통해 대용량 EEG 데이터를 효과적으로 학습하고, 모델의 성능을 극대화할 수 있었습니다.

결론 및 향후 전망

LBM 프로젝트는 EEG 데이터를 활용한 AI 모델의 새로운 가능성을 탐색한 연구로, Transformer 아키텍처를 적용하여 기존 BCI 모델의 한계를 보완하고 보다 범용적인 AI 모델을 구축하는 데 성공했습니다.

향후 엘리스는 EEG 외에도 다양한 바이오신호 데이터를 활용한 AI 연구를 확장할 예정이며, 이를 통해 의료, 헬스케어, 뉴로테크(Neurotech) 등 다양한 산업 분야에서 활용 가능한 AI 모델을 개발할 계획입니다.


👉🏻 엘리스에 AI 파운데이션 모델 개발 문의하기

👉🏻 더 많은 AI 프로젝트 수행 내용 살펴보기



📌참고 문헌

[1] Jiang, W. B., Zhao, L. M., & Lu, B. L. (2024). Large brain model for learning generic representations with tremendous EEG data in BCI. arXiv preprint arXiv:2405.18765.
[2] Yang, C., Westover, M., & Sun, J. (2024). Biot: Biosignal transformer for cross-data learning in the wild. Advances in Neural Information Processing Systems, 36.

  • #개발사례
  • #뇌파 분석 AI 모델
  • #LBM구축