인공지능 인프라의 평가 기준이 근본적으로 바뀌고 있습니다. 그동안은 한 번의 질문에 얼마나 빠르게 답변을 내놓는지가 핵심이었지만, 이제는 스스로 목표를 세우고 여러 단계를 거쳐 작업을 완수하는 에이전트 AI 의 성능이 주목받기 시작했습니다.
이러한 흐름 속에서 엔비디아의 차세대 아키텍처인 블랙웰이 업계 첫 공식 벤치마크에서 압도적인 결과를 보여주며 시장의 이목을 집중시키고 있습니다.
인공지능 분석 기관인 아티피셜 애널리틱스가 발표한 에이전트 퍼프 벤치마크는 기존과는 완전히 다른 측정 방식을 도입했습니다. 이 벤치마크는 단순한 대화형 AI 가 아닌, 복잡한 작업을 수행하는 에이전트 AI 에 최적화된 시스템을 비교하는 데 초점을 맞췄습니다.
첫 번째 결과 발표에서 엔비디아 블랙웰 울트라 NVL72 플랫폼이 기존 호퍼 아키텍처 대비 메가와트당 20 배 더 많은 에이전트를 구동할 수 있음을 입증했습니다.
기존의 AI 추론 벤치마크는 한 번의 대형 언어 모델 호출 속도를 측정하는 데 그쳤습니다. 하지만 에이전트 AI 는 하나의 목표를 달성하기 위해 수십 번에서 수백 번에 달하는 모델 호출을 연쇄적으로 수행합니다.
각 단계마다 코드 컴파일, 데이터베이스 검색, 웹 서핑 같은 도구 호출이 뒤따르고 이전 단계의 맥락이 누적되어 전달되기 때문에 시스템에 가해지는 부하가 단순 합산이 아닌 기하급수적으로 증가합니다.
이러한 복잡성 때문에 기존 인프라는 에이전트 AI 를 구동하는 데 있어 효율성 측면에서 한계를 드러냈습니다. 블랙웰이 보여준 성능은 단순히 빠른 속도를 의미하는 것이 아니라, 제한된 전력으로 얼마나 많은 에이전트를 동시에 운영할 수 있는지를 보여주는 지표입니다.
기업들이 대규모 에이전트를 배포할 때 가장 중요하게 여기는 것은 바로 투자한 전력당 얻을 수 있는 실제 작업량입니다.
이번 벤치마크 결과는 AI 인프라 시장의 판도를 다시 그리는 신호탄이 될 가능성이 큽니다. 단순한 대화형 챗봇을 넘어 자율적으로 업무를 처리하는 에이전트 시대가 본격화되면서, 하드웨어 선택 기준도 단순 처리량에서 에이전트 효율성으로 이동하고 있습니다.
앞으로 어떤 기업이 블랙웰 기반의 인프라를 얼마나 빠르게 도입하느냐에 따라 AI 에이전트 서비스의 경쟁력이 결정될 것입니다.