KT, 감정 표현하는 다국어 AI 음성합성 서비스 출시
KT는 인간의 감정을 담은 AI(인공지능) 음성합성 콘텐츠를 제작하는 'AI 보이스 스튜디오' 서비스를 출시했다고 19일 밝혔다.
AI 보이스 스튜디오는 100개의 AI 목소리를 활용해 즐거움, 침착함, 중립, 슬픔, 화남의 5가지 감정으로 합성할 수 있는 'AI 보이스'와 이 AI 보이스를 활용해 영상 등 오디오 합성 콘텐츠를 제작할 수 있는 '스튜디오'로 구성돼 있다.
특히 KT AI 보이스 스튜디오는 국내 최초로 적용된 '감정 더빙' 기술이 탑재돼 있다. 이 기능을 활용하면 AI 보이스를 내가 낭독한 감정 그대로 더빙할 수 있다. 게다가 KT AI 보이스 스튜디오가 제공하는 모든 AI 목소리는 한국어, 영어, 중국어, 일본어 4개국어로 '다국어 합성'이 가능하다.
또 KT는 유명인들의 음성을 AI로 제공하는 '셀럽 AI 보이스'도 준비했다. 첫 번째 셀럽 AI 보이스는 가수 윤도현이다. AI 보이스 스튜디오에 담긴 AI 윤도현의 목소리는 오디오북을 제작할 수 있도록 윤도현의 낭독체와 대화체가 담겼다.
KT AI 보이스 스튜디오의 웹 버전은 월별 AI 보이스 제공량에 따라 △프리(무료, 4000자) △베이직(1만2000원, 2만4000자) △프로(4만8000원, 12만자) △프로맥스(12만원, 38만4000자) 4종의 요금제로 구성됐다.
최준기 KT AI/빅데이터 사업본부 본부장은 "이번에 출시한 AI 보이스 스튜디오는 KT만의 차별화된 AI 기술로 인간에 가까운 감정을 표현하는 등 AI 목소리의 가치를 향상시켰다"고 말했다.