감정 담아 성우처럼 읽어준다, 수퍼톤 TTS 직접 해보니
2023.11.18 14:08게임메카 김미희 기자

올해 지스타에는 게임 개발에도 활용할 수 있을 만한 색다른 TTS(텍스트 음성 변환)가 출품됐다. 하이브 자회사인 수퍼톤이 개발 중인 프로젝트 스크린플레이다.
내년 베타 버전 서비스를 목표로 하고 있는 프로젝트 스크린플레이는 지스타 2023 시연 버전 기준으로 남성, 여성, 로봇 등 각기 다른 특색을 지닌 음성 12종을 지원했다. 언어는 한국어, 영어, 일본어 3종이다. 음색, 발음, 강세 등을 개별로 제어할 수 있는 수퍼톤 자체 음성합성 기술인 낸시(NANSY)로 목소리를 생성했고, AI를 통해 여러 음성 데이터를 합성시켜 진짜 사람처럼 자연스럽게 문장을 읽도록 했다.
지스타 현장에서 직접 들어본 결과, 인물 목소리의 경우 기계적인 느낌이 없이 아나운서나 전문 성우가 읽어주는 듯한 자연스러운 억양과 톤을 확인할 수 있었다. 더불어 로봇 목소리는 영화에서 등장하는 안드로이드 목소리같이 기계적인 느낌이 살아 있었다.
지스타 현장에서 직접 들어본 결과, 인물 목소리의 경우 기계적인 느낌이 없이 아나운서나 전문 성우가 읽어주는 듯한 자연스러운 억양과 톤을 확인할 수 있었다. 더불어 로봇 목소리는 영화에서 등장하는 안드로이드 목소리같이 기계적인 느낌이 살아 있었다.
아울러 같은 텍스트라도 목소리와 톤을 조정할 수 있으며, 생성한 억양이 마음에 들지 않는다면 말하는 속도, 목소리 높낮이 등을 조정할 수 있다. 따라서 동일한 문장을 같은 목소리로 변환하더라도 억양 등을 세밀하게 조절한 다수의 음성을 뽑아낼 수 있다. 사용자가 원하는 억양을 마이크로 녹음한 뒤, 이를 음성에 적용해 좀 더 정밀한 결과물을 산출하는 것도 가능하다.
활용성도 높다. 프로그램에 원하는 문장을 직접 입력하는 것은 물론, 영상에 변환한 음성을 넣거나, 대본을 불러와서 작업할 수도 있다. 특히 영상 편집은 화면 하단에 있는 타임라인을 통해 생성한 음성이 들어가는 타이밍 등을 쉽게 조절하는 것이 가능하다. 마지막으로 여러 명이 같이 작업할 때 작업 내역 등을 코멘트 등으로 남기는 등 협업 관련 기능도 제공한다.
프로젝트 스크린플레이에 대해 수퍼톤 관계자는 "가상 유튜버를 등장시키는 게임 개인방송이나 게임 개발 과정에서 NPC 대사 녹음 등에 활용할 수 있을 것으로 예상된다. 특히 기업 대상으로는 원하는 목소리를 생성해 제공하는 것도 가능하다고 본다"라며 "내년 베타 버전 서비스를 목표로 하고 있으며, 판매 방식은 사용 시간 제한을 둔 월정액 등으로 고려 중이다"라고 설명했다.








많이 본 뉴스
-
1
스팀 규정 위반, 블루 아카이브 리뷰 이벤트 급히 취소
-
2
닌텐도 스위치 2, 발매 한 달 만에 일반 판매 전환됐다
-
3
락스타게임즈, 레드 데드 리뎀션 3 개발 돌입
-
4
[이구동성] "게임, 대여한 게 아니라 구매한 것이다"
-
5
문명 6 플래티넘 에디션, 에픽서 18일부터 무료 배포
-
6
[겜ㅊㅊ] 최근 한국어 패치 나온 스팀 추천게임 10선
-
7
부정적 여론 의식했나? 몬헌 와일즈 최적화 강연 중지
-
8
[오늘의 스팀] 57만 동접이 1만으로, POE 2 침체 계속
-
9
마비노기 모바일이 특허 낸 '우연한 만남' 차별점은?
-
10
GS25와 블루 아카이브, 두 번째 컬래버 시작한다
hst1112023.11.18 17:49
신고삭제영상 편집이나 음성을 편집할때 여러모로 도움이 될 것 같네요 원하는 음원들이 있어서 좋은 프로그램이 나왔네요
은빛플룻2023.11.29 10:13
신고삭제단순 텍스트를 감정 섞인 음성으로 변환해 주는 것 자체로도 경이로운 수준인데, 연령대와 성별 구분까지 가능하고 영상에도 적용된다고 하니 다른 세상을 느끼게 해 주네요...좋은 정보 감사합니다.