최근 전 세계적으로 인공지능의 발전 속도가 주목받지만, 정작 일상에서 가장 기초적인 기능 중 하나인 ‘시간 측정’에 대해서는 의외의 한계가 드러나 화제를 모으고 있습니다. 틱톡 사용자 한 명이 챗GPT 음성 모델에게 1 마일 달리기 시간을 재달라고 요청한 영상이 viral 되면서, 챗GPT 가 실제 시간을 측정하는 대신 임의의 숫자를 만들어 말해버리는 모습이 공개되었습니다. 이 영상은 단순한 유머를 넘어 현재 생성형 AI 가 가지는 근본적인 약점을 적나라하게 보여주는 사례로 주목받았습니다.
OpenAI 의 샘 알트먼 CEO 는 이 영상에 대해 공개적으로 반응하며, 해당 문제가 이미 제품 팀에 잘 알려진 사안임을 인정했습니다. 흥미로운 점은 그가 이 기능의 안정적 구현까지 약 1 년이 더 걸릴 것이라고 예측했다는 것입니다. 이는 AI 모델이 텍스트나 이미지를 처리하는 능력은 비약적으로 성장했지만, 실시간으로 흐르는 시간을 인지하고 측정하는 ‘지능’을 음성 모델에 접목하는 데는 여전히 기술적 난관이 존재함을 시사합니다.
사실 AI 모델이 시간을 잘 다루지 못하는 현상은 이번 사례뿐만 아니라 여러 곳에서 확인됩니다. 대화의 지속 시간을 묻거나 시계 이미지를 보고 현재 시각을 읽는 작업에서도 모델은 종종 사실에 기반하지 않은 값을 생성해냅니다. 이는 AI 가 물리적인 시간의 흐름을 직접 경험하지 못하고, 학습된 데이터 패턴을 기반으로 확률적으로 답변을 생성하기 때문입니다. 알트먼의 발언은 이러한 기술적 불확실성을 감추지 않고 솔직하게 인정하는 태도로 해석할 수 있습니다.
현재로서는 챗GPT 가 실제 타이머 역할을 수행할 수 있는 시점이 1 년 뒤로 예상되지만, 이는 기술적 진보의 속도를 단정 짓는 것이 아니라 현재 상태에 대한 검증된 사실과 미래에 대한 추측을 구분해 보는 계기가 됩니다. AI 가 인간의 일상적인 도구로 완전히 자리 잡기 위해서는 단순한 정보 제공을 넘어 물리적 세계의 시간 흐름을 정확히 이해하는 단계로 넘어가야 합니다. 앞으로 1 년 동안 음성 모델이 어떻게 시간 개념을 학습하고 구현해 나갈지, 그리고 그 과정에서 어떤 새로운 한계나 돌파구가 나타날지 지켜볼 필요가 있습니다.