리우데자네이루시가 최근 공개한 대형 언어모델이 글로벌 AI 커뮤니티를 뜨겁게 달구고 있습니다. 현지 IT 기업인 IplanRIO를 통해 발표한 ‘Rio-3.5-Open-397B’는 마치 브라질 고유의 기술로 탄생한 자국산 모델처럼 소개되었죠.
공식 발표에서는 Qwen3.5 기반의 파인튜닝 모델이라 명시하며 벤치마크에서 동급 오픈 모델을 능가한다는 성과를 내세웠습니다.
하지만 기술적 분석이 이어지면서 분위기가 급변했습니다. Hacker News와 GitHub 등 개발자 커뮤니티에서 이 모델의 내부 구조를 뜯어보니, 의외의 사실이 드러났기 때문입니다.
모델의 가중치 텐서를 하나하나 비교한 결과, 이 모델이 완전히 새로운 학습을 거친 것이 아니라 기존 두 모델의 단순 선형 결합일 가능성이 매우 높다는 지적이 나왔습니다.
구체적으로 살펴보면, 이 모델은 약 60%의 ‘Nex-N2 Pro’와 약 40%의 ‘Qwen3.5-397B-A17B’를 가중치 합성 방식으로 섞어 만든 것으로 보입니다. 특히 60개 레이어 전체와 네트워크의 모든 구성 요소에서 이 비율이 일관되게 유지되고 있어, 단순한 파인튜닝을 넘어선 구조적 합성임을 시사합니다.
개발자들이 놀라워하는 점은 이렇게 단순한 가중치 평균만으로도 모델 성능이 오히려 향상되었다는 사실입니다.
이 논란이 더욱 뜨거워진 이유는 모델이 공개된 타이밍과 홍보 방식 때문입니다. 연구진들은 공식적으로 이 모델을 알리지 않은 채 레딧에 올렸고, 브라질의 월드컵 데뷔전 주말을 틈타 자연스럽게 바이럴되었습니다.
리우 시장이 이 기회를 틈타 무료 홍보 효과를 극대화하려 했다는 분석도 나옵니다. 하지만 정작 모델의 핵심인 ‘Nex’ 모델의 기여도는 공식 문서에 제대로 명시되지 않아, 원작자들의 노력이 제대로 인정받지 못했다는 비판이 제기되고 있습니다.
이번 사건은 AI 모델 개발의 새로운 흐름을 보여줍니다. 거대한 파라미터 수를 가진 모델을 처음부터 새로 학습시키는 대신, 기존에 검증된 모델들을 적절히 섞어 성능을 높이는 ‘모델 머지’ 기법이 얼마나 강력한지 입증한 사례입니다.
앞으로는 모델의 출처와 구성 성분을 투명하게 공개하는 것이 기술적 신뢰를 얻는 핵심 기준이 될 것입니다. 리우 모델의 진정성이 최종적으로 확인될 때, 오픈 소스 생태계는 어떻게 변할지 주목해볼 필요가 있습니다.