AI 에이전트 시대를 여는 엔비디아의 첫 CPU ‘베라’가 현실이 된 이유

GPU 만으로 충분했던 AI 시대가 저물고, 스스로 판단하고 행동하는 에이전트 AI 의 등장으로 인프라의 핵심이 CPU 로 재편되고 있습니다. 엔비디아가 전격 출시한 전용 CPU '베라'가 안토로픽, 오픈AI 등 글로벌 거대 연구소에 직접 전달되며 AI 산업의 새로운 장이 열렸습니다.

배소라 5월 19, 2026 1 분 읽기

AI 에이전트 시대를 여는 엔비디아의 첫 CPU '베라'가 현실이 된 이유

Nvidia CEO Jensen Hwang introduces Vera Rubin, a next-generation AI data center platform, and Rubin Ultra, a next-generation AI GPU architecture, during the keynote address at the company's annual GTC developers conference in San Jose, California, on March 16, 2026. (Photo by JOSH EDELSON / AFP)/2026-03-17 06:33:50/

배소라

인공지능의 중심축이 단순한 연산 속도를 넘어 스스로 판단하고 행동을 취하는 ‘에이전트’ 형태로 진화하면서, 이를 뒷받침할 새로운 하드웨어의 필요성이 절실해졌습니다. 엔비디아는 3 월 GTC 컨퍼런스에서 이 같은 흐름을 읽은 첫 번째 전용 CPU ‘베라’를 공개했고, 불과 수 개월 만에 이 칩이 실제 현장에 안착하며 기술계의 이목을 집중시켰습니다. 단순한 발표를 넘어 안토로픽, 오픈AI, 스페이스엑스 AI 등 세계적 AI 연구소와 오라클 클라우드 인프라에 직접 배송된 사실은, 베라가 이론적 개념이 아닌 당장의 산업 표준으로 자리 잡았음을 시사합니다.

기존의 AI 인프라가 GPU 에 의존해 왔다면, 에이전트 AI 시대의 CPU 는 전혀 다른 임무를 수행해야 합니다. 모델이 질문에 답하는 것을 넘어 슬라이드를 제작하거나 소프트웨어를 컴파일하고, 방대한 데이터를 분석하며 시뮬레이션을 실행하는 복잡한 작업들은 모두 CPU 의 영역으로 확장됩니다. 엔비디아의 하이퍼스케일 및 고성능 컴퓨팅 담당 부사장인 이언 버크는 이러한 변화가 AI 공장 내에서 새로운 CPU 순간을 만들어내고 있다고 강조했습니다. 베라는 이러한 동시 다발적이고 실시간적인 작업 부하를 처리하기 위해 설계된 첫 번째 커스텀 CPU 로, 기존 코어 밀도 중심의 설계로는 감당하기 어려웠던 에이전트 특유의 워크로드를 효율적으로 소화합니다.

이러한 변화는 AI 시스템이 단순한 도구를 넘어 스스로 작업을 조율하고 실행하는 주체로 변모하고 있음을 의미합니다. 에이전트 샌드박스 하나하나, 도구 호출 하나하나, 그리고 긴 문맥을 활용한 검색 작업까지 모두 CPU 성능에 달려 있습니다. 엔비디아의 이언 버크가 직접 손으로 칩을 전달한 행위는 단순한 물류 이동을 넘어, 하드웨어와 소프트웨어가 긴밀하게 결합된 새로운 생태계의 시작을 알리는 상징적인 순간이었습니다. 이는 AI 가 더 이상 수동적인 응답기를 넘어 능동적인 작업자로 기능하기 위해서는 인프라의 근본적인 재설계가 필수적임을 보여줍니다.

앞으로 주목해야 할 점은 베라 기반 시스템이 실제 환경에서 어떤 성능 향상을 가져오는지, 그리고 이것이 AI 에이전트의 복잡도와 확장성에 어떤 영향을 미칠지입니다. 엔비디아가 이 기술을 30 억 달러 규모의 신규 사업으로 전망한 만큼, 베라의 도입은 AI 산업의 경쟁 구도를 다시 그릴 수 있는 분기점이 될 것입니다. 하드웨어의 한계가 AI 의 행동 범위를 결정하던 시대가 지나, 이제 하드웨어가 AI 의 행동을 가속화하고 확장하는 시대로 넘어가는 중요한 전환점을 우리는 목격하고 있습니다.