엘리스그룹, 한국어로 이미지 분석 가능한 ‘AI헬피 Pro’ 공개
Elice
2024. 10. 18.
한국어와 한국 문화를 가장 잘 설명하는 멀티모달 모델 개발
AI 교육 솔루션 기업 ㈜엘리스그룹(대표 김재원)은 멀티모달 AI 모델 ‘AI헬피 Pro’를 공개했다. 엘리스의 생성형 AI 챗봇 ‘AI헬피’에 이미지 인식 기능을 더한 것으로 한국어와 한국 문화를 잘 이해할 수 있도록 특화됐다.
‘AI헬피 Pro’에는 엘리스그룹 자체 개발 AI 모델이자 텍스트와 이미지를 이해하고 분석할 수 있는 ‘Helpy-V’가 탑재돼 이미지에 관련된 질문을 받을 경우 답변을 설명하는 시각적 질의응답(VQA, Visual Question and Answering)이 가능하다. 기존 AI헬피가 할 수 있던 정확하고 빠른 질의응답에 더불어 원하는 이미지 생성 기능도 제공된다. 생성형 AI의 문제점이었던 할루시네이션은 실시간 정보 검색 기능으로 크게 완화했다.
오픈소스 AI모델 중 한국어 기반 VQA 작업에서는 가장 뛰어난 성능 보여
또한, 한국어와 한국문화를 읽고 분석하는데 탁월한 성능을 보인다. 유명 한국인 사진을 보고 설명할 수 있는 것은 물론, 국악과 같은 전통 문화, 전통 음식 이미지를 이해하고 정확하게 설명할 수 있다.
한국어 VQA 작업 영역에 대해 진행한 CVQA 벤치마크에서도 빅테크를 포함한 오픈소스 AI 모델 중 최고의 성능을 기록하며 기술력을 입증했다. 이는 기존 공개된 VQA 모델들이 영어 기반으로 개발돼 한국 문화나 지식에 대한 이해도가 낮았던 한계를 해결하고, 신뢰도 높은 한국어 기반 정보를 제공한다는 의의를 가진다.
한국 문화∙지식 이해도 낮았던 기존 영어 기반 VQA모델 한계 극복
엘리스그룹은 실제 교육을 운영하던 중 시각 정보 습득에 어려움을 겪는 학습자를 위해 VQA 기능이 필요하다고 인식해 개발에 나섰다. 모든 학습자가 학습에 참여할 수 있는 보편적 학습 설계(UDL, Universal Design For Learning)를 추구하는 AI헬피 Pro는 4천 곳 이상 기관 AI 교육에 활용 중인 엘리스LXP에 순차적으로 적용될 예정이다.
AI헬피 Pro를 사용할 경우, 국내 초∙중등 학습 교재 내 이미지에 대해 정확한 한국어 설명을 제공할 수 있으며, 과학 수업 중 실험 기구 상태를 화면으로 파악하고 질의응답을 진행할 수 있다. 이 밖에도 산업 현장에서 영상이나 이미지로 위험을 감지하는 등 다양한 교육, 산업 영역에서 활용 범위를 넓혀갈 계획이다.
AI모델 연구를 주도한 엘리스그룹 김수인 CRO(최고연구책임자)와 권도현 AI 엔지니어는 “지난해 생성형 AI 챗봇 ‘AI헬피’ 공개 두 달 만에 15만 건 이상 질의응답이 진행되며 실제 학습자들에게 매우 큰 도움이 됐다는 사실이 매우 유의미했고, 교육에 가치를 더하는 AI모델을 개발했다는 생각에 확신을 갖게 됐다”며, “앞으로도 더 많은 이들이 활용할 수 있는 신뢰도 높은 교육 특화 AI 모델을 개발할 계획”이라고 전했다.
- #News
- #AI
- #AI Helpy
- #