한국게임학회 게임문화예술연구회는 ‘강화학습을 사용한 게임 제작’을 주제로 한 오픈세미나를 온라인으로 24일 개최했다. 이번 세미나에서 오지현 유니티코리아 에반젤리스트 팀장과 박우진 테크니컬 파트너 어드바이저는 게임 제작에 강화학습을 활용하는 방법을 공유했다.
세미나의 주제인 ‘강화학습’은 AI가 행동에 대한 보상을 최적화하는 방향으로 학습하는 AI 학습 알고리즘이다. 오지현 팀장은 “강화학습은 강아지를 훈련할 때를 생각하면 쉽다”라며 “다양한 행동을 하고, 보상을 받는 과정을 반복하면서 학습하는 것”이라고 설명했다. 그는 이어 “학습을 하는 ‘에이전트’는 가속환경과 분신(멀티 에이전트)을 통해 학습 시간도 단축할 수 있다”고 덧붙였다.
이 같은 기술을 게임에 접목할 경우, QA에 드는 시간ㆍ노력을 단축하거나, AI 캐릭터의 고도화가 가능하다. 박 어드바이저는 유니티가 진행한 프로젝트인 ‘G돌이의 모험’을 예시로 강화 학습을 통한 QA방식을 소개했다. 그는 “QA 전문 엔지니어가 버그를 발견하더라도 이를 재연하기 쉽지 않은데, 에이전트는 버그를 활용해서라도 게임을 효율적으로 진행하려는 현상이 많아서 버그를 찾기 수월하다”라며 강화학습을 통한 QA의 장점을 강조하기도 했다.
실제 국내 게임에 적용된 사례도 있다. 엔씨소프트는 ‘리니지’의 ‘거울전쟁’과 ‘전설 vs 현역’ 콘텐츠에 전통적인 AI 기술과 함께 강화 학습을 활용했다. 외형이나 사용하는 스킬 등이 이용자와 같은 AI 캐릭터들이 특정 사냥터를 통제하고 때론 이용자와 다대다 전투를 벌이는 등 기존보다 훨씬 복잡하고 전략적인 행동을 보이는 비(非)이용자 캐릭터를 게임에 적용한 사례다.
또한, 강화학습은 이번 세미나에서 다룬 ‘에이전트 학습’과 ‘QA’ 외에도 ‘자동 매칭 선정’, ‘어뷰징·욕설 탐지’ 등에서도 활용되고 있다. 오 팀장은 “강화학습은 에이전트 학습이나 QA 외에도 메타버스에서 활용될 부분이 많다”면서 “음성채팅 기반의 욕설 필터링이나, 성적인 의도를 가진 행동 필터링 등 다양한 분야에서 연구가 이루어지고 있다”라고 말했다.