강화학습의 대부는 왜 LLM이 막다른 길에 처했다고 했을까
*이 글은 외부 필자인 강병호님의 기고입니다. LLM의 한계를 말하다 지난 2025년 9월 26일, 강화 학습의 대부 리치 서튼(Rich Sutton)은 "LLM(Large Language Models)은 막다른 길(Dead End)"이라고 말했습니다. LLM으로는 범용 인공지능 (AGI; Artificial General Intelligence)를 구현할 수 없다는 의미입니다. 2022년 11월, ChatGPT가 공개된 후 LLM의 강력한 성능이 주목받아 왔고, 가파르게 성장해 나가는 AI의 성능을 모두가 바라보며 범용 인공지능 또한 머지않은 미래에 도달할 것이라는 인식도 퍼져 있습니다. 그러나 현재의 기술로는 범용 인공지능의 달성이 어려울 것이라는 메시지가 무게감 있게 등장한 것입니다. 리치 서튼의 이 발언으로 인해 AI 업계에서 다양한 토론이 이어지고 있습니다. AI의 대부들 또한 자신의 의견을 덧붙이며, 논의를 더욱 깊게 진행시켜 나가고 있습니다. 먼저 이 메시지를 띄운 리치 서튼의 주장부터 살펴보도록 하겠습니다. (참조 - Richard Sutton – Father of RL thinks LLMs are a dead end) 리치 서튼의 “쓰디쓴 교훈” 리치 서튼은 강화학습(Reinforcement Learning) 분야의 창시자로, 2024년에 컴퓨터 과학 분야의 노벨상으로 불리는 튜링 상(Turing Award)를 수상했습니다. 리치 서튼이 대중에게 널리 알려진 계기는 2019년에 작성한 "쓰디쓴 교훈(The Bitter Lesson)"이라는 에세이 때문입니다. 이 에세이는 간결한 알고리즘에 강력한 컴퓨팅 파워가 뒷받침될 때 가장 좋은 성능을 낸다는 내용을 담고 있습니다.