엉터리 대답을 하지 않는 '인공지능 챗봇'을 만드는 방법
*이 글은 외부 필자인 성원용님의 기고입니다. 얼마 전 뉴스에 의하면 6월 한 달 동안 ChatGPT의 PC와 모바일 트래픽이 전달보다 거의 10% 감소했다고 합니다. (참조 - 챗GPT 인기 주춤? 출시 후 '방문자 수' 처음 감소) 학생들의 방학 시즌 시작이나 경쟁 AI모델인 BARD의 출시, 부정확한 대답을 그 이유로 들기도 하지만, 기본적으로 ChatGPT는 학생이나 지식근로자를 위한 도구라고 할 수 있습니다. 따라서 초반의 화제를 넘어 ChatGPT로 대표되는 거대언어모델(LLM)이 더 넓은 확장성을 가지기 위해서는 일반인을 위한 용도가 있어야 할 것입니다. 대표적으로 챗봇(chatbot)을 생각해 볼 수 있습니다. 일례로 회사나 기관의 규정 등은 모두 다르고, 또 회사에서는 전자제품 또는 자동차 등을 소비자에게 팔면서 사용설명서를 배포합니다. 그런데 이 사용설명서를 꼼꼼히 읽어보는 소비자는 별로 없습니다. 그래서 문제가 있을 때 소비자가 고객 콜센터에 전화를 하는 경우도 많은데 이러한 콜센터 운영 비용이 어마어마하게 큰 경우도 있습니다. 물론 지금까지 이러한 일을 돕기 위한 챗봇이 있었습니다. 그런데 챗봇이 질문자의 의도를 잘 알아듣지 못하고 오히려 짜증만 유발하는 경우가 많았습니다. ChatGPT를 통해서 최신의 거대언어모델은 질문자의 의도를 정확히 파악하는 능력이 있는 것을 확인했습니다. 이러한 거대언어모델은 질문을 찰떡같이 알아듣는 챗봇을 개발하는 목적으로도 매우 유용하게 사용될 수 있습니다. 미세학습을 통해 챗봇의 만들기 어려운 이유 ChatGPT 훈련과정을 아시는 분들은 GPT와 같은 사전학습모델(pre-trained model)을 사용자 데이터로 미세학습(fine-tuning)을 시키면 가능하겠다고 생각할 수 있습니다. 물론 더 나은 답변을 얻을 수 있고, 의료나 법률 등 특화된 응용의 모델이 개발되고 있다고 합니다. 그렇지만 이 경우에도 다음의 문제가 있습니다.