넥슨, AI로 게임 속 ‘부적절한 이미지’ 잡아낸다
2024.04.30 20:25 게임메카 김미희 기자
10년 이상 서비스된 게임에서는 예상치 못한 일이 발생할 수 있다. 메이플스토리 등 장수 온라인게임이 많은 넥슨은 이에 대해 잘 알고 있다. 넥슨 선행개발실 윤준호 AI 엔지니어는 30일 열린 게이밍 온 구글 클라우드 행사에서 “현재 게임산업에서 가장 중요한 특징 중 하나는 사용자가 개발자 혹은 크리에이터가 되는 시대라는 점이다. 유저 참여로 콘텐츠가 풍부해진다는 점은 환영할 만하지만 일부 사용자의 부적절한 콘텐츠가 노출될 위험이 있다”라고 밝혔다.
가령 메이플스토리에서 어떤 유저가 선정적인 이미지를 게시했다고 가정해보자. 연령등급 상으로 청소년도 즐길 수 있는 게임에 소위 ‘야짤’이 걸렸다면 게임사 역시 관리 소홀에 대한 책임을 피할 수 없다. 아울러 관련 소식이 일파만파 퍼질 경우 그간 열심히 쌓아둔 게임 브랜드 이미지가 한 순간에 무너질 우려도 있다.
이에 넥슨은 구글 클라우드와 협력해 게임 내에서 부적절한 이미지를 탐지해내는 서비스를 개발했다. 이 때 핵심으로 잡은 것은 세 가지다. 이미지를 탐지하는 성능, 비용 감축, 서버 지연 감소다. 이를 목표로 두 회사는 12주 동안 12번의 실험을 거쳐 이미지 탐지 솔루션을 완성해냈다.
그 과정에서 유의미한 결과를 얻은 실험은 3개다. 첫 번째는 실사는 구글의 음란물 탐지 솔루션인 세이프서치로, 애니메이션이나 게임 이미지는 최적화된 오토 머신러닝으로 탐지하는 것이다. 실사와 가상이라는 이미지 종류별로 특화된 모델을 써서 탐지 성능을 높인 것이다. 다만 구조가 복잡해지며 비용이 높아지고, 탐지를 잘못한 사례에 대한 원인을 분석하기 어려워졌다. 특히 추상적이거나 간접적인 방식으로 표현한 음란물을 가려내는 부분에 한계가 발생했다.
이에 두 번째는 이미지 모델의 임베딩(이미지를 기계가 읽을 수 있는 숫자 나열인 벡터로 변환한 것) 부분을 벡터 인코더(변환기)로 활용해봤다. 윤준호 AI 엔지니어는 “처음에는 기대했던 성능을 내지 못했지만, 추가적인 실험으로 잘못 라벨링된 데이터를 다량 찾아내 수정할 수 있었다. 또 다양한 모델의 이미지 임베딩을 시험하며 사전에 잘 훈련된 이미지 임베딩 활용 가능성을 확인해볼 수 있었다”라고 밝혔다.
마지막은 이미지와 텍스트를 함께 처리하는 비전 언어 모델을 활용하는 것이다. 고양이 이미지를 예로 든다면 한 쪽에서는 이미지를 분석하고, 다른 한 쪽에서는 텍스트로 관련된 질문과 답변을 주고받으면서 적절한지 체크하는 것이다. 이 모델에 대해 윤준호 AI 엔지니어는 “기존에 잘 해결되지 않던 케이스도 탐지하는 데에는 성공했으나 일반화하기에는 성능이 부족했고 연산 비용도 높았다”라고 설명했다.
이에 넥슨과 구글 클라우드는 앞서 이야기한 세 가지 실험에서 얻은 결과물을 조합해 최종적으로 ‘부적절한 이미지 탐지 솔루션’을 완성했고, 이를 서비스 중인 게임 서버에 반영했다. 윤준호 AI 엔지니어는 “기존 모델의 미탐지 케이스를 대부분 해결했고, 라이브 서비스 비용이 81% 감소했으며, 구조 복잡성이 감소하며 서버 지연이 73.8% 줄었다. 거의 자동화에 가까운 시스템이라 할 정도로 훌륭하다”라고 밝혔다.
마지막으로 그는 AI의 경우 빠르게 실험해 결과를 확인하는 것이 중요하다고 강조했다. 윤준호 AI 엔지니어는 “12주 동안 12개 실험을 했고, 9개는 실패했고 3개는 성공했다. 빠르게 실패하는 것이 AI 프로젝트에 매우 중요하다”라고 설명했다. 이어서 그는 이미지 탐지 솔루션을 꾸준히 실험함과 동시에, 타사도 이용할 수 있도록 공개할 계획이다. 아울러 구글 클라우드와 AI 프로젝트 협업에 대해서도 논의 중이다.