게임메카

AI 활용한 추리게임, 과연 ‘헛소리’는 안 할까? 2024.07.17 18:02 게임메카 신재연 기자

▲ 안녕하세요, 게환모즐 신재연 기자입니다 (사진: 게임메카 촬영)

거짓보다 위험한 건 진실 속에 교묘하게 숨은 거짓이라는 말이 있다. 진실을 받아들이는 과정에서 자연스럽게 거짓말이 녹아 들기 때문이다. 이 위험성이 가장 크게 대두될 때가 바로 챗GPT를 활용한 정보 검색이다. 최근 AI를 적극 사용하는 분위기가 커지며, 논문이나 과제 등을 작성할 때 챗GPT에서 도움을 받다가 문제가 발생한 실제 사례는 이미 유명해졌다. 챗GPT 등 여러 AI에서 발생하는 이런 현상을 흔히 ‘할루시네이션’이라 부른다.

이런 리스크가 있음에도 불구하고, 최근 AI를 도입한 추리게임들이 속속 등장하고 있다. AI가 실시간으로 대사를 만들어내, 짜여진 대화 이상의 생생함을 전달하는 것이다. 이는 이론상으로만 언급되던 ‘대화를 통한 조사 및 추리’에 대한 수요를 충족할 수 있다는 점에서 많은 관심을 받고 있다.

▲ 할루시네이션의 예시. 그럴싸해 보이지만 거짓이 다수 섞여있다 (사진: 게임메카 촬영)

▲ 이와 같은 현상이 발생하는 이유도 할루시네이션을 원인으로 들 수 있다 (사진: AI야 소녀를 그려줘)

AI 활용에 있어, 미리 캐릭터의 역할을 만들어 조건을 전제해 놓으면 할루시네이션이 크게 줄어든다. 여기에 핵심 키워드와 사전 정보를 입력해두면 해당 정보가 적용된 방향의 대화가 가능하기에 주제에서 벗어난 전개를 어느 정도 막을 수 있다.

그렇다면 과연 최근 출시된 게임들은 이 기술이 적용돼 정말 ‘헛소리’없는 게임 플레이가 가능할까? 스팀에 출시된 AI 추리게임 2종을 체험하고 두 게임이 얼마나 정확한 수준인지, 할루시네이션을 방지하기 위해 어떤 장치를 적용했는지 등을 살펴봤다.

우선 크래프톤 산하 AI게임 개발사 렐루게임즈의 ‘언커버 더 스모킹 건’을 살펴보자. 언커버 더 스모킹 건은 AI 탐정인 주인공이 현장에서 증거를 탐색하고 용의자인 로봇들과 대화를 나누며 정황을 추리하는 게임이다. 우선 언커버 더 스모킹 건에서는 게임 초반부부터 할루시네이션 현상을 게임 안에 영리하게 녹여냈다. 로봇 설명서를 통해 할루시네이션 현상을 직접 언급하고, 해당 문제가 있을 수 있음을 미리 플레이어에게 인지시키는 것이 그 예시다.

아울러 할루시네이션을 방지하는 장치도 준비했다. 답변을 제시할 때 등장하는 [시스템 과부하]와 [확인 정보] 문구가 그 예시다. [시스템 과부하] 문구는 거짓말을 하는 중이거나, 핵심 정보에 근접했을 때 등장하는 문구다. [확인 정보] 문구는 답변에 포함된 정보가 일부 사실일 때 등장하는 문구다. 두 문구는 챗GPT라는 원본이 가지고 있는 할루시네이션을 구분하기 어려운 상황에서 중요한 정보가 무엇인지 구분하는 지표가 되어준다. 일반적인 대화에서 흐르듯 나왔던 단어더라도, 해당 문구와 함께 등장했을 때는 다시 한 번 생각하고 중요시할 필요가 있다는 뜻이다. 반대로 해당 문구가 안 붙은 대화는 조금 덜 진지하게 볼 수도 있다.

▲ 할루시네이션에 대한 사전 정보를 미리 제시해 위화감을 줄인 것이 특징이다 (사진: 게임메카 촬영)

▲ 스크립트와 함께 해당 정보의 중요성을 강조하는 문구로 할루시네이션이 낳는 오해를 최소화했다 (사진: 게임메카 촬영)

이에 플레이어는 챗GPT를 통해 게임 속 캐릭터와 자유롭게 대화를 나눌 수 있으면서도, 게임의 핵심인 진실을 찾는 일에 어렵지 않게 접근할 수 있다. 앞서 언급된 두 장치 덕에 간혹 진실을 흐리는 발언이 나오더라도 중요한 정보가 무엇인지 파악하기는 어렵지 않다. 두 장치가 등장할 때 인간이 거짓말을 하는 것과 유사한 반응을 시각적으로 전달해, 플레이어는 게임을 즐기면서 자연스럽게 무엇이 이상하고 그렇지 않은지를 받아들일 수 있다.

또다른 인공지능 대화형 추리게임 ‘두근두근 AI 심문게임’은 앞서 언급한 언커버 더 스모킹 건과는 흐름이 다르다. 언커버 더 스모킹 건이 주어진 단서와 환경을 조합해 질문을 해야한다면, ‘두근두근 AI 심문게임’은 살인사건의 용의자인 AI에게 직접 심문을 실시해 자백을 받아내는 것이 핵심이다. 다만 여기에는 별도의 조건이 있는데, 7회 이내에 자백을 이끌어내야 한다.

이는 앞서 언급된 언커버 더 스모킹 건과는 달리 제한된 횟수와 분위기로 역할의 몰입을 유도하고 플레이어의 창의성을 자극한다. 정보량이 적은 상태에서 심문을 시작해야 하는 만큼 플레이어는 다양한 시도를 하게 되는데, 사용하는 어휘나 느낌표의 수 등에 따라 변화하는 AI의 반응도 인상 깊다.

▲ 반복적인 심문을 통해 자백을 유도하는 것이 핵심이다 (사진: 게임메카 촬영)

가장 눈에 들어오는 점은 AI에게 입력된 역할 정보다. 이에 따라 AI는 회유를 통해 자백을 유도하거나, 협박을 통해 공포감을 자극할 때 보여주는 반응이 매번 다르다. 공포에 빠지거나 당황할 때에는 말을 더듬고 패닉에 빠진 제스처를 취하기도 해 플레이어의 감정을 자극하는 점이 눈에 들어온다. 이런 감정적인 반응은 더 강한 협박을 하거나, 회유를 하는 등 각 플레이어마다 서로 다른 심문을 진행하게끔 만드는 계기가 된다.

종합하자면, 현재 AI를 활용한 대화형 추리게임은 상당한 사전장치가 존재할 때 더 큰 몰입감을 제공할 수 있는 단계라 볼 수 있다. 물론 이런 장치가 준비됐더라도 사용하는 어휘가 많지 않고, 키워드만 인식해 비슷한 반응을 보여주는 등 표현에 한계는 존재한다. 예를 들어 “A에 B를 더한 이유는 뭐야?”라는 질문 후, “B에 A를 더한 이유는 뭐야?”라고 다시 한 번 질문했더니 AI는 'A에 B를 더한 이유'와 유사한 답을 내어놓았다. 존재하지 않는 가상의 반려동물이나 반려크리처를 만들어 협박했을 때는 비슷한 반응만 보이기도 했다.

▲ 독설, 비난, 인질극 등 위협적인 단어 사용을 중심으로 한 심문을 반복적으로 실시하면 패닉에 빠지는 스크립트를 도출하기도 한다 (사진: 게임메카 촬영)

최근 출시된 게임들은 이런 문제를 세계관으로 어느 정도 당위성을 확보해 위화감을 크게 줄였다. AI가 완벽한 답변을 내어놓지 못하는 상황을 게임 내에서 설득력 있게 풀어냈기에, 플레이어의 거부감을 줄였다. 아울러 AI 대화형 추리게임만의 장점도 별도로 확인할 수 있었다. 기본 제공하는 정보만 미리 번역해 놓으면, 게임 중에는 언어의 장벽을 느끼기가 어렵다는 점이다.

이는 챗GPT가 가진 특성에 기인한다. 제공하는 답변량에 차이가 있기는 해도 대부분의 언어를 인지하고 답변할 수 있기 때문이다. 질문자가 사용하는 언어가 서로 다르더라도 입력된 배경지식 키워드 덕분에 플레이어가 느끼는 반응은 대개 비슷하다. 이는 다양한 국적의 게이머들에게 유사한 경험을 제공할 수 있다는 점에서 의미가 크다.

자연어를 사용한 대화형 인공지능은 꾸준히 발전하는 추세고, 이를 게임에 도입하려는 시도 또한 꾸준히 관측된다. 할루시네이션이라는 문제 현상이 완전히 해결되지는 못했지만, 이를 보완할 수 있는 방법은 앞서 언급한 두 게임이 잘 보여줬다. 이와 같이 본질적인 단점을 극복할 수 있는 문제를 인간만의 창의성으로 보완하며 윤리적으로 사용하기만 한다면, 많은 추리게임 마니아들이 기대하던 진짜 ‘현실적인’ 추리게임을 만나볼 때가 머지 않을 수도 있겠다는 생각이 든다.

▲ 가장 중요한 것은 무엇은 쓰느냐가 아니라 어떻게 쓰느냐 아닐까 (사진: 게임메카 촬영)

이시각 주요 뉴스

많이본 뉴스