2025년 6월, 서울 코엑스에서 열린 국제 기술 컨퍼런스 'MARS 2025'. 그 어느 부스보다도 사람들이 몰린 곳엔 영국 엔지니어드 아츠(Engineered Arts)가 만든 '아메카(Ameca)'가 있었습니다. 고도화된 얼굴 인식 기술과 정밀한 모터 시스템으로 실제 사람처럼 섬세한 표정을 구현하는 이 인간형 로봇은 단순한 로봇의 영역을 넘어섰다는 느낌을 주며 폭발적인 관심을 끌었습니다.

▲ 출처: 한경
이에 앞서, 엔비디아 CEO 젠슨 황은 CES 2025 무대에서 이렇게 선언했습니다. "다음은 피지컬 AI 시대가 될 것이다."
그렇다면 피지컬 AI란 무엇일까요? 젠슨 황은 피지컬 AI를 "인지하고, 계획하고, 행동하는 인공지능"이라고 정의했습니다. 즉, 인공지능 기술이 실제 물리적 장치(로봇, 스마트 디바이스 등)와 결합하여 인간과 상호작용하거나 환경을 변화시키는 기술을 의미합니다. 스크린 속 챗봇에 머무르지 않고 현실 세계의 자극에 반응하며 '몸으로 작동하는 AI'가 앞으로의 주인공이라는 뜻이죠. (출처: NVIDIA 블로그)
오늘은 이처럼 빠르게 진화 중인 피지컬 AI의 기술 기반과 글로벌 전망에 대해 알아보겠습니다.
피지컬 AI, 예전 로봇과는 뭐가 다를까?
사실 사람처럼 생긴 로봇은 새롭지 않습니다. 2000년대 초반에도 혼다의 ASIMO나 소프트뱅크의 NAO 같은 로봇들이 있었습니다. 하지만 당시엔 대화를 해도 맥락은 이해하지 못했고, 걷는 동작도 어딘가 부자연스러웠습니다. 정확히 말하자면 '움직이는 조형물'에 가까웠습니다.
2025년의 휴머노이드는 그보다 훨씬 진화했습니다. 단순한 반복 동작이 아니라 사람의 말투를 이해하고, 상황에 맞게 물건을 들고, 감정 표현에 반응하는 수준까지 도달했습니다. 이 차이를 가능하게 한 것이 바로 '피지컬 AI'입니다. 단순한 모터 제어가 아니라 센서 → 인지 → 판단 → 행동 → 피드백이라는 전 과정을 실시간으로 처리하는 구조가 구현되기 시작한 것입니다.
어떤 기술이 모여야 피지컬 AI가 될까?
지금의 피지컬 AI는 여러 기술이 얽혀 만들어지는 복합 시스템입니다.
- GPT나 Gemini 같은 LLM은 말의 뉘앙스나 맥락을 파악하고,
- 모션 센서, 3D 비전, 촉각 센서 등은 물리 자극을 감지하며,
- 로보틱스 제어 알고리즘은 그것을 실제 행동으로 전환시킵니다.
이렇게 서로 떨어져 있던 기술들이 유기적으로 결합하면서 로봇이 실제 인간처럼 반응할 수 있는 시대가 열린 겁니다.
피지컬 AI의 글로벌 전망과 기술적 과제
피지컬 AI는 이제 연구 단계에서 벗어나 산업적 가능성을 검증받는 단계로 진입하고 있습니다. 2024년 한 해에만 휴머노이드 로봇 및 피지컬 AI 관련 스타트업에 약 12억 달러 이상의 벤처 투자가 이뤄졌으며, 2025년에는 투자 규모가 30억 달러를 넘어설 것이라는 전망도 나오고 있습니다. 골드만 삭스가 발표한 「Humanoid Robots: AI Acceleration」 보고서에 따르면, 전 세계 휴머노이드 로봇 시장은 2035년까지 약 380억 달러 규모로 성장할 것으로 예상됩니다.
미국에서는 피지컬 AI를 국가 전략 기술로 인식하려는 움직임도 본격화되고 있습니다. 일부 기업과 연구기관은 의회에 로봇 및 AI 인프라를 포함한 국가 차원의 로드맵 수립을 요구하고 있으며, 한국 역시 정부 주도의 R&D 투자와 기술 생태계 조성을 확대하는 흐름을 보이고 있습니다. 이는 피지컬 AI가 단순한 로봇 산업의 진화가 아니라, 제조·물류·국방·의료 등 다양한 산업 경쟁력과 직결된 기술로 인식되고 있음을 보여줍니다.
다만 이러한 성장 전망과 함께, 피지컬 AI가 본격적으로 확산되기 위해서는 여전히 해결해야 할 기술적 과제가 분명히 존재합니다. 그 중심에는 AI 인프라 문제가 자리하고 있습니다.
실시간 추론을 위한 연산 인프라
피지컬 AI는 인식하고, 판단하고, 행동하는 전 과정이 실시간으로 이루어져야 합니다. 사람의 음성을 이해하고, 주변 환경을 인식한 뒤, 물리적 행동으로 전환하는 과정에서 지연이 발생하면 로봇의 안정성과 신뢰도는 급격히 떨어집니다. 이를 위해서는 대규모 연산을 빠르게 처리할 수 있는 고성능 GPU·NPU 인프라와 안정적인 추론 환경이 필수적입니다.
특히 휴머노이드 로봇은 카메라, 라이다, 촉각 센서 등 다양한 입력 데이터를 동시에 처리해야 하기 때문에 단일 모델 추론보다 훨씬 복합적인 연산 구조를 요구합니다. 이로 인해 피지컬 AI의 확산은 곧 AI 인프라 확충 문제와 직결됩니다.
엣지와 클라우드의 역할 분담
피지컬 AI는 모든 연산을 클라우드에서 처리하기 어렵습니다. 네트워크 지연이나 연결 불안정성은 곧바로 안전 문제로 이어질 수 있기 때문입니다. 이에 따라 로봇 내부에서 즉각적인 판단을 수행하는 엣지 AI와, 학습·고도화·대규모 모델 관리를 담당하는 클라우드 AI 간의 역할 분담이 중요해지고 있습니다.
엣지 단에서는 빠른 추론과 제어가, 클라우드 단에서는 대규모 학습과 업데이트가 이뤄지는 구조가 자리잡아야 피지컬 AI가 안정적으로 확장될 수 있습니다. 이는 전체 AI 시스템 아키텍처 설계의 문제이기도 합니다.
대규모 학습과 시뮬레이션 환경
피지컬 AI는 현실 세계에서 학습 비용이 매우 높습니다. 로봇 한 대가 실제 환경에서 반복적으로 실패하며 학습하는 방식은 시간과 비용 측면에서 효율적이지 않습니다. 따라서 가상 환경에서 대규모 시뮬레이션을 통해 학습한 뒤, 이를 실제 로봇에 적용하는 방식이 점점 중요해지고 있습니다.
이를 위해서는 고성능 연산 자원을 기반으로 한 시뮬레이션 환경과 대규모 데이터 처리 인프라가 필요합니다. 다시 말해, 피지컬 AI의 발전 속도는 로봇 자체보다 이를 뒷받침하는 AI 인프라의 성숙도에 크게 좌우됩니다.
안정성과 확장성을 고려한 운영 인프라
피지컬 AI가 연구용 프로토타입을 넘어 실제 현장에 투입되기 위해서는, 한두 대의 로봇을 관리하는 수준을 넘어 다수의 로봇을 동시에 운영할 수 있는 인프라도 필요합니다. 모델 업데이트, 장애 대응, 로그 관리, 성능 모니터링 등은 모두 AI 인프라 차원의 문제로 이어집니다.
이러한 운영 인프라가 갖춰지지 않으면 피지컬 AI는 실험실을 벗어나기 어렵습니다. 결국 로봇의 지능뿐 아니라, 이를 안정적으로 운영할 수 있는 AI 인프라가 함께 발전해야 피지컬 AI의 대중화가 가능해집니다.
피지컬 AI, 결국 인프라 경쟁
엘리스클라우드는 이러한 변화 속에서 피지컬 AI와 같은 고난도 AI 워크로드를 고려한 GPU 인프라 환경을 제공합니다. 대규모 연산이 필요한 모델 학습부터 실시간 추론을 위한 테스트 환경까지, 연구·실험·운영 단계에 맞춰 GPU 자원을 유연하게 활용할 수 있도록 설계되었습니다. 이는 피지컬 AI가 연구실을 넘어 실제 산업 현장으로 확장되는 데 필요한 조건이기도 합니다.
→ 엘리스클라우드로 달라진 피지컬 AI 학습 속도 (사례 보러가기)
결국 피지컬 AI의 경쟁력은 로봇이 얼마나 사람처럼 움직이는가가 아니라, 그 지능을 얼마나 안정적으로 학습시키고 운영할 수 있는가에 달려 있습니다. 그리고 그 중심에는 고성능 GPU 인프라와 이를 효율적으로 활용할 수 있는 클라우드 환경이 자리하고 있습니다.
