부모님 안부 묻지마라, AI로 욕설 96% 잡아낸다
2018.04.24 18:18게임메카 김헌상 기자
채팅은 온라인게임에서 빼놓을 수 없는 요소다. 유저 간 커뮤니케이션을 돕는 순기능도 있지만, 혐오표현이나 욕설 등 악용 사례도 적지 않다. 이를 방지하기 위해 게임사는 욕설 필터링이나 신고 제도 등 다양한 방지책을 도입했지만, 완벽한 욕설 근절로 이어지지는 못했던 것이 현실이다.
그렇다면 AI(인공지능)의 힘을 빌려보는 것은 어떨까? 실제로 넥슨 코리아 인텔리전스랩에서는 딥 러닝을 통한 욕설 탐지 기술을 개발하고 있다. 과연 AI는 지긋지긋한 욕설 문제의 해방구가 될 수 있을까? 이 해답이 24일 열린 넥슨 개발자 컨퍼런스(NDC)에서 제시됐다.

▲ 강연을 맡은 넥슨 코리아 인텔리전스랩 어뷰징방지팀 조용래 연구원 (사진: 게임메카 촬영)
힘들었던 욕설 탐지, 딥 러닝으로 해보면?
금칙어를 정해놓고, 해당 단어를 막는 기존의 욕설 방지책은 한계가 명확했다. 모음 ‘ㅣ’ 대신에 숫자 ‘1’을 사용한 욕설이나, 흔히 ‘어머니 안부를 묻는다’고 말하는 것처럼 욕설을 사용하지 않는 공격적인 표현은 탐지하는 것이 어려웠다. 그렇다고 금칙어 기준을 강화하자니 ‘18채널’ 같은 평범한 말도 욕설로 제재되는 현상이 발생했다. 결국 운영자가 신고가 들어온 채팅 내역을 일일이 확인해야 하기 때문에 부담이 큰 방식이었다.
이에 넥슨이 주목한 것이 바로 ‘딥 러닝’이다. 딥 러닝이란 컴퓨터에 학습 모델을 제공하고, 이에 기반해 데이터를 분류하도록 만드는 기술의 일부다. 일반적인 머신 러닝과 달리 사람이 데이터를 일일히 분류하지 않아도 된다는 점이 특징이다. 조용래 연구원은 “’딥 러닝으로 언어를 이해하고 욕설 탐지를 할 수 있지 않을까’라고 생각했다”며, “번역에서 미리 한 번 초벌 번역을 하듯이, 욕설을 1차 분류하는 욕설 탐지기를 만들었다”고 설명했다.

▲ 금칙어 방식은 효율이 낮았다 (사진: 게임메카 촬영)
욕설 탐지기를 만들기 위한 첫 번째 단계는 데이터를 수집하는 것이다. 욕설인 것이 확실한 문장, 즉 ‘라벨링 데이터’를 수집해 욕설 탐지기에 학습시켜야 하는 것. 조용래 연구원은 “가장 간단한 방법은 소위 ‘노가다’”라며, “크롤링과 함께 10여 명의 사우와 함께 온갖 창의적인 욕을 생각하며 데이터를 수집했다. 남들이 하는 욕을 보면서 나도 욕이 늘어난 것 같다”고 말했다.
이렇게 데이터를 확보했다면 실제 딥 러닝 모델을 구축해야 한다. 욕설 탐지기에 사용된 것은 이미지 분류에 자주 사용되는 CNN(Convolutional Neural Network)이다. CNN은 필터를 통해 지역적인 특성을 추출하고, 다른 이미지에 같은 특성이 존재하는지를 파악해 분류하는 것을 말한다. 예를 들어 고양이를 분류한다면 귀와 수염, 입 모양 등을 특성으로 추출하고, 수많은 이미지 중에서 같은 특성을 가지고 있는지를 파악해 고양이 사진을 골라내는 셈이다. 특히 욕설 탐지기는 단어를 자모로 나눠 동일성 여부를 체크했다.

▲ 특성을 추출해 이미지나 자연어를 분류하는 CNN (사진: 게임메카 촬영)

▲ 단어별로 욕설일 확률을 계산 (사진: 게임메카 촬영)

▲ 문맥에 따른 차이도 인식한다 (사진: 게임메카 촬영)
이렇게 구현된 욕설 탐지기 프로토타입은 변형된 욕설은 물론, 단어를 조합하는 방식이나 문맥에 따라 욕설이 되는 일반 단어까지도 구분할 수 있었다. 종래의 금칙어 기반 욕설 탐지 확률이 56%라면, 딥 러닝을 사용한 욕설 탐지 정확도는 88%까지 올라갔다. 이후로도 데이터를 빠르게 수집하도록 돕는 ‘액티브 러닝’, CNN 모델에서 정확도를 개선한 ‘VDCNN’ 도입, 여러 문장을 동시에 탐지 및 해석할 수 있는 ‘어텐션’ 등을 도입하며 욕설 탐지기를 더욱 고도화했다. 이를 통해 욕설 탐지기의 탐지율은 90%까지 상승했다.

▲ 고도화를 거친 모델의 정확도는 90% (사진: 게임메카 촬영)
딥 러닝 욕설 탐지기, 업무 효율 높인다
이렇게 완성된 욕설 탐지기는 넥슨이 서비스하는 FPS ‘서든어택’에서 테스트를 거쳤다. 기존 ‘서든어택’은 게임 내 욕설 신고가 들어오면 운영자가 수동으로 검토해 제재를 내리는 방식이었다.
욕설 탐지기는 신고가 들어온 채팅 내역을 1차적으로 분류하는 역할을 맡았다. 먼저 신고된 내용 중에서 욕설 부분을 추출하고, 제재 확률이 높은 것부터 확인할 수 있도록 정렬했다. 운영자들은 정렬된 결과를 눈으로 확인하고 제재를 내리거나, 잘못 탐지된 결과를 누락시키는 역할을 맡았다.

▲ 실제 '서든어택'에서 사용된 욕설 탐지기 (사진: 게임메카 촬영)
그 결과는 성공적이었다. 욕설 신고 제재 대상자를 보다 쉽고 빠르게 찾아낼 수 있던 것이다. 기존 방식으로는 1분당 23건의 모니터링이 가능했지만, 욕설 탐지기를 사용하면 총 35건으로, 처리 속도가 52% 가량 증가했다. 제재 대상 비율도 큰 폭으로 올랐다. 기존에는 23건 모니터링 중 41%가 제제 대상이었지만, 욕설 탐지기를 사용하자 35건 중 96%가 제제 대상이었던 것이다. 즉, 보다 빠르고 확실하게 제재 대상을 검출할 수 있었다. 욕설 탐지기 테스트는 10회 가량 진행되었고, 매번 기존 방식보다 훨씬 나은 결과를 도출해냈다.

▲ 수동으로 찾는 것보다 훨씬 효율적인 분류가 가능 (사진: 게임메카 촬영)
욕설 탐지기는 향후 더욱 발전 예정이다. 데이터가 쌓이면 새롭게 생성되는 욕설은 물론 차별적인 단어나 혐오 단어, 심지어 외국어까지 탐지할 수 있다는 것이다. 아직까지는 테스트 단계지만, 향후 실제로 게임 서비스에 도움을 줄 수 있는 셈이다.
다만, 조용래 연구원은 인공지능은 어디까지나 사람을 보조하는 역할이라고 강조했다. 정확도가 99.9%라도 한 명의 무고한 피해자가 발생하면 안된다는 이유다. 조용래 연구원은 “인공지능은 ‘아이언맨’의 인공지능 비서 ‘자비스’ 같은 존재다. 사람을 돕고 업무를 효율적으로 할 수 있도록 만든다”고 설명했다.
많이 본 뉴스
-
1
유비소프트 사내 '성범죄' 법정진술, 너무 충격적
-
2
[순정남] 무료인데도 스팀서 99% '압긍'인 게임 TOP 5
-
3
우왁굳 논란 여파, 네오위즈 '디맥' 2차 창작 게임 불허
-
4
[이구동성] 스팀 씹어먹은 K-게임들
-
5
[오늘의 스팀] 혹평 급증, 레식 시즈에 무슨 일이?
-
6
복제인간 만들어 생존, 프펑 개발사 신작 평가 ‘매긍‘
-
7
드리프트 서비스 종료, 카트라이더 '클래식' 돌아온다
-
8
스팀에 출격하는 나혼렙, 어라이즈와는 별개 게임
-
9
스텔라 블레이드 제작진 "유저 모드 적극 환영"
-
10
소니 CEO “마라톤은 콘코드처럼 실패하지 않을 것”
제비2018-04-25 12:25
신고삭제진짜로 알파고 대법관님이 생기겠네요
bboongya2018.04.24 21:33
신고삭제한국말 VS AI네요
프로게이머출신2018.04.25 10:10
신고삭제LOL보면 요즘 욕하기보다 비꼬아서 하거나 1글자씩 채팅쓰는경우가 많던데...
알파고정도의 AI가아니면 의미있나
죽은시인2018.04.25 10:23
신고삭제AI로 욕설을 거의 다 잡아낼 수 있으면 좋겠네요
sakikkun2018.04.25 10:37
신고삭제욕설 및 비속어를 걸러낸다는 것은 취지가 좋은데, 은유적으로 표현하거나 줄임말로 표현하는 그런것들까지는 잡아내지 못하지 않을런지...
하이엘프디드리트2018.04.25 12:18
신고삭제AI가 욕설을 120% 잡으면은 좋겠는데..언제나 새로운 방안이 나오겠죠..
제비2018.04.25 12:25
신고삭제진짜로 알파고 대법관님이 생기겠네요
jyn34932018.04.25 13:38
신고삭제차라리 욕을해라 패드립하지말고
엉클베리2018.04.25 13:47
신고삭제실효성이 얼마나 있을지 모르지만 말 그대로 보조적인 역할 기대하네요
Dessert2018.04.25 13:48
신고삭제느그 ㅇㅁㄴ 뭐하시노? 이게 읽히십니까? 그러면 저게 생겨도 답이 없습니다.
해빌2018.04.25 13:57
신고삭제부모님 욕 하는 사람들 대채...
4월이왔어2018.04.25 14:01
신고삭제앞으로 얼마나 더 효과가 있을지 기대돼요.
게라스2018.04.25 14:51
신고삭제욕설 잡아내는거 기대해봅니다
0H00N2018.04.25 15:38
신고삭제너무무섭다
탕수육은찍먹2018.04.25 16:13
신고삭제계획대로 잘 욕설을 걸러주면 좋겠네요
하지만
우린 새로운 욕을 찾을 것이다. 늘 그랬듯이.
darkeuro2018.04.25 16:37
신고삭제효과 별로 없을거 같은데.
샤를마뉴2018.04.25 17:30
신고삭제이래나 저래나 부모님 안부 묻는놈들 다 잡아버렸으면 좋겠다
남시키2018.04.25 17:42
신고삭제"게임을 너무 오래했더니 아오씨......팔 아퍼" 같은걸 AI가 잡을수 있을까요.
아 욕설을 하려고한건 아닙니다. 단지 그냥 궁금해서..
블루스피카2018.04.25 18:37
신고삭제채팅 금지만 빠릿빠릿하게 걸어주기만 해도 훨씬 클린해질 텐데.
미르후2018.04.25 18:53
신고삭제오 이런 기술은 환영1 돈슨이 왠일이래! 다른것은 맘에 안들지만 이것은 맘에 드네.. 좀더 효율성 높여져서 99.9% 잡아야지
양파2018.04.25 18:54
신고삭제딥 러닝 덕분에 눈 버리는 일 덜겠네요
그동안 금칙어 정해봤자 욕 사이사이에 _ / . ! 등등 끼워넣어 금칙어를 피해갔는데 이젠 이것들도 못하겠죠!
데세르비르2018.04.25 19:36
신고삭제욕설도 욕설이지만 비유법이나 비꼬는말은 ....한국말은 워낙에 말의 억양에따라서 듣는사람이 느끼는 불쾌감이 다른데 이런것은 어떻게해결할것인지
Crush2018.04.25 20:06
신고삭제저렇게 라도 해서 걸러지면 그나마 나을거같긴하네요 수동으로 할 때보다 시간절약해서 다른것도 손좀보고..
단단2018.04.25 20:21
신고삭제아다르고 어달라서 이게 실효성이 있을지...
모노블로스2018.04.25 21:07
신고삭제결국 이걸 피하는 새로운 욕이 생기겠지
랩타르2018.04.25 21:57
신고삭제발표자님이 욕을 되게 아무렇지 않게 하셔서 웃겼ㅋㅋ
HAR2018.04.25 22:30
신고삭제알파고... 당신이 옳았습니다
아이쿠루2018.04.25 23:26
신고삭제욕할 사람들이야 또 새로운 방법을 찾아내겠지만, 그래도 많이 줄어들긴 하겠네요
핏빛파란2018.09.08 15:43
신고삭제댓글 상황을 보니 일반 대중들의 딥러닝 이해도 상태를 알겠다