구글이 AI 경쟁에서 다시 우위를 점하고 있습니다
*이 글은 외부 필자인 강병호님의 기고입니다. 구글의 제미나이 2.5 시리즈, 우수한 성능을 보이다. 구글은 지난 3월 25일에 제미나이 2.5 프로(Gemini 2.5 Pro)를 공개했고, 몇 주 뒤인 4월 17일에는 경량 모델 제미나이 2.5 플래시(Gemini 2.5 Flash)를 공개했습니다. 두 모델 모두 추론(Reasoning, Thinking)을 지원하는 최신 구조의 LLM이며, 벤치마크 성능에서도 우수한 결과를 내어 이목을 집중 받고 있습니다. 신형 모델이 더 좋은 성능을 기록하는 것은 특별한 사건은 아닙니다. 모델은 주요 벤치마크의 특성을 고려하여 학습되기 때문에 (벤치마크 데이터를 직접 학습했다는 의미는 아닙니다), 새로운 모델은 더 높은 벤치마크 점수를 기록하는 것이 일반적이기 때문입니다. 하지만 제미나이 2.5 시리즈는 최고 수준(SOTA; State-of-The-Art)의 벤치마크 점수 달성과 함께 실사용자로부터의 긍정적인 평가가 이어지고 있다는 점에서 경쟁 모델 대비 실질적으로 우수한 성능을 낸다는 평가를 받고 있습니다. (참조 - Gemini 2.5: Our most intelligent AI model) 추론, 많이 하는 것이 능사는 아니다 추론형 모델, 즉 Reasoning(오픈AI에서 주로 사용하는 용어) 및 Thinking(구글에서 주로 사용하는 용어) 모델은 최종 답변을 생성하기 전에 모델 스스로 답변을 도출하기 위한 중간 단계를 기록해 둡니다. 이러한 중간 기록 과정을 통해 모델은 생각을 단계별로 정리할 수 있게 되어 복잡한 문제를 차근차근 풀어 나가며 올바른 답변을 낼 수 있게 됩니다. 높은 성능을 내는 모델은 더 많은 추론을 하는 경우가 일반적입니다.