구글이 AI 튜터를 만드는 방법

AI 음성으로 듣기 - ElevenLabs

구글은 지난 5월 14일에 LearnLM이라는 언어 모델을 발표했다. LearnLM은 제미나이 1.0을 교육 목적으로 파인튜닝한 모델이다. 구글 딥마인드 연구팀은 LearnLM을 소개하면서 아카이브(arXiv)에 연구 보고서도 함께 발표했다. 이 연구 보고서는 AI를 실질적으로 쓸 만한 AI 튜터로 만들기 위해서 반드시 먼저 정의하고 해결해야 하는 문제들을 체계적으로 분류하고 정리한 결과물이다.

구체적으로 보면, 구글 딥마인드 팀은 AI 튜터의 효과성을 검증하는 평가 프레임워크를 개발했고(7개의 벤치마크 포함), 안전성 프로토콜과 윤리적 가이드라인을 수립했고 무엇보다 제미나이 1.0 베이스 모델보다 교육학적으로 더 나은 언어 모델로 개발했다. 개발 과정에서 AI가 만든 데이터에서부터 교육 전문가가 직접 만든 데이터까지 다양한 레벨의 데이터셋을 만들어 학습시켰고 각각의 응답 및 대화에 대해서 실제 교육자 및 학생의 피드백도 반영했다. 그리고 이를 실제 교육 환경(애리조나 주립 대학교)에 적용해 효과성을 입증했다.

연구의 한계도 명확하게 보고서에 적시했다. 텍스트 기반 상호작용으로 제한되었고 강화학습(RL) 단계는 시행하지 못했다는 기술적 한계부터, 여전히 평가의 신뢰성 확보에 대한 어려움과 장기적 실용성을 검증하지 못했다는 점 등을 한계로 제시했다. 다문화 지원 확대와 문화적 다양성 을 고려한 개선사항 등의 향후 과제도 보고서에 남겼다.

최근 연구 책임자인 아이리나 주렌카(Irina Jurenka)가 구글 딥마인드 팟캐스트에 출연해서 LearnLM 개발 과정과 연구 보고서에 관해서 설명했다. 이 연구는 AI를 교육에 활용하기 위한 첫걸음에 불과하고 이제서야 연구해야 할 범위와 깊이를 확인한 정도의 성과로 봐 주면 좋겠다고 했다.

나는 개인적으로 8월 28일 제미나이 어드밴스드 업데이트 직후에 LearnLM을 직접 써 보면서 놀라움을 금치 못했다. 챗GPT나 다른 어떤 언어 모델보다도 학습에 맞춤화 된 대화가 가능했다. 이 정도라면 정말 학생들에게도 유용하리라는 생각이 들었다. 하지만 이 정도의 완성도에도 불구하고 제미나이는 현재 18세 이상으로 사용이 제한되어 있다. 보고서에 언급된 학생 피드백도 모두 애리조나 주립 대학교 학생들의 피드백이다. 구글이 얼마나 신중하게 AI튜터에 접근하고 있는지 보여주는 대목이다.

구글이 교육 분야에 투자해 온 것은 이미 15년이 넘었다. LearnLM을 사용해 보면서 얼마나 많은 연구자와 개발자가 이 프로젝트에 참여했을지 궁금했는데 이 보고서를 통해 구글 딥마인드가 교육용 LLM 파인튜닝을 위해 얼마나 많은 연구 역량을 투입했는지 알 수 있었다. 에듀테크 업계에 있는 사람들과 에듀테크에 관심이 있는 사람이라면 꼭 읽어 보시길 추천한다.

LearnLM은 제미나이 챗봇에서 Learning coach라는 젬(Gem)으로 사용해 볼 수 있다. 유튜브에서도 일부 교육용 영상에 적용되어 있다고 한다. 추후에는 구글 검색의 'AI 개요'에도 들어갈 것이라고 한다.