매일 30TB 데이터 수집하는 '아크 레이더스'가 무사한 이유
2026.06.17 14:20 게임메카 신재연 기자
엠바크 스튜디오가 매일 생성되는 최대 1,000억 개 가량의 데이터를 막힘없이 처리하는 노하우를 공개했다.
넥슨 개발자 콘퍼런스 2026(이하 NDC26) 2일 차인 17일, 경기창조혁신센터 지하 2층 국제회의장에서 진행된 이번 세션에는 '더 파이널스' 및 '아크 레이더스' 개발사 엠바크 스튜디오의 데이터 엔지니어 마티아스 안데르손 연사가 참가했다. 안데르손 연사는 게임 내에서 발사되는 모든 총알 하나하나를 빠짐없이 포착할 수 있는 데이터 플랫폼을 구축한 과정과, 이것이 실제 게임이나 플레이 경험에 영향을 주지 않으면서도 원활하게 수집되는 노하우에 대해 설명했다.
마티아스 연사에 따르면, 엠바크 스튜디오가 수집하는 데이터의 규모는 방대하다. 이들이 추적하는 이벤트 유형만 1,000가지가 넘으며, 플레이어가 가장 많을 때는 하루 1,000억 개 이상의 이벤트, 즉 일일 30테라바이트에 달하는 데이터가 누적된다. 이들이 단순히 기록을 남기는 것을 넘어 게임 데이터를 모으는 이유는 수집된 데이터가 기술적인 기록에 그치지 않고, 게임을 더 재미있고 공정하게 만들기 위한 핵심 자산으로 활용되기 때문이다.
대표적인 활용 목적은 부정행위 사용자 차단으로 게임의 보안을 유지하는 것이다. 모든 탄도를 추적하기에 정상적인 플레이어가 쏠 수 없는 궤적이나 비정상적인 움직임을 파악할 수 있어 불법 프로그램 사용자를 신속하게 선별한다. 이와 함께 일반 데이터를 분석해 특정 무기가 너무 강력하거나 약하지 않은지, 정확한 피해량과 명중률 수치를 파악해 게임 균형을 조절한다. 교전 발생 시 '누가 먼저 쐈는가' 등을 추적해 플레이어의 성향을 분석하고, 공격적인 사용자는 공격적인 사용자끼리 만날 수 있는 대전 상대 검색 지원도 가능하다.
이와 같이 라이브 서비스 중인 온라인 게임으로부터 수천억 개의 데이터를 실시간으로 모으다 보면, 게임이 느려지거나 비용이 과다하게 발생하지 않을까 하는 우려가 생기기 마련이다. 마티아스 연사는 "게임은 복잡해도 데이터 집계는 상대적으로 단순해야 한다"고 강조했다. 그러면서 "데이터 수집 인프라가 게임 성능을 방해하지 않도록 철저하게 격리하는 구조를 선택했다"며, 데이터 수집의 효율성을 극대화하기 위해 독창적인 파이프라인을 설계했음을 밝혔다.
우선 개발진은 언리얼로 만든 게임 서버 측면에 독자적인 애플리케이션을 상주 시켰다. 게임 서버는 매 프레임 발생하는 수많은 발사 이벤트를 초당 30회의 소용량 일괄 처리 형태로 묶어서 애플리케이션에 전달한다. 이 데이터는 메모리 상에서 플레이어 이동 거리, 누적 피해량 등의 상태 변화를 실시간으로 집계하는 일에 사용된다.
이렇게 일괄 처리된 데이터는 라운드가 끝나면 하나의 파일처럼 정리돼 전송되기에 복잡한 데이터베이스나 파이프라인을 요구하지 않는다. 즉, 가볍고 직관적인 코드를 적용하는 방식으로 한 라운드 내 게임에 대한 정보를 취합한 요약 통계를 낼 수 있다는 것이다. 이 데이터는 비용 절감을 위해 한 번에 묶여서 전송되는 자체 설계가 적용된 만큼 방대한 데이터도 상대적으로 저렴하고 효율적으로 분석할 수 있다.
그러면서도 마티아스 연사는 "데이터 팀이 분석을 독점하고 결과를 통보하는 방식은 지양해야 한다"고 지적했다. 사내 개발자, 지도 디자이너 등 누구나 직접 데이터에 접근할 수 있는 '데이터 민주화(Democratizing Data)'를 최우선 가치로 삼아야 한다는 설명이다. 이를 위해 개발한 대표적인 도구가 바로 '라운드 뷰어'다. 이는 특정 라운드의 사용자 플레이 목록, 오류가 발생한 서버 기록, 특정 플레이어 식별자의 당일 동선 등을 한눈에 파악할 수 있는 목록 페이지로, 단순한 표 형태지만 사내에서 가장 자주, 다목적으로 활용되는 도구다. 라운드 뷰어와 연동되어 작동하는 '지도 재생' 맞춤형 도구 또한 유용한 도구로 쓰인다.
지도 재생은 특정 라운드에서 플레이어들이 어떻게 움직였고 어디서 피해를 입고 사망했는지를 시각적으로 재생해 준다. 이를 통해 지도 디자이너들이 의도치 않은 지형지물 악용이나 비정상적인 속도로 움직이는 부정행위자를 직관적으로 검증하는 데 핵심적인 역할을 한다. 나아가 여러 라운드의 데이터를 누적한 2차원 열지도(Heat map)뿐 아니라, 언리얼 게임 엔진 내부에 열지도를 직접 표시해 주는 플러그인을 개발해 개발 창을 벗어나지 않고도 사용자들의 상호작용 공간을 실시간으로 확인하며 작업할 수 있다.
즉, 게임 내에서 실시간으로 수집되는 데이터를 상대적으로 저렴하고 경제적으로 가공하기 위해서는 '단순함'과 '효율성'을 중시한 계획과 전략이 필요하다. 더불어 이를 개발과정에 있는 누구나 사용할 수 있도록 '민주성'을 갖춘 별도의 가공과 비전이 필요하다는 점이다.