본문 바로가기
일상과 이슈

네이버 클로바 더빙 첫 사용기

by 은빛숲 2020. 6. 3.
728x90
반응형

2000년대 화제작 남녀탐구생활, 여기 나레이션을 기계음으로 흉내내어 더 화제가 되었다

아주 옛날 옛적 남녀탐구생활이라는 예능이 있었는데, 그때 나레이션 하는 성우가 TTS라고도 불리는 기계음으로 더빙하는 듯이 감정도 억양도 없이 연기해서 크게 화제가 된 적이 있었다.

 

근 몇년 전만 해도 웹상이나 디지털 문서를 음성으로 읽어주는 인공지능은 억양도 없고 기계음에 단조롭다는 인식이 있었다.

 

그러나 트위치나 유튜브, 그리고 e북 단말 앱의 책 읽어주는 인공지능 프로그램들을 들어보면 그 억양이 상당히 자연스러워졌다는 것을 알 수 있다. 물론 사람이 직접 읽어주는 것보다는 못하지만, 듣기에 크게 불편함이 없는 것은 사실이다.

 

유튜브 시대 말 잘하는 사람은 더더욱 뜨지만, 나같이 나서서 이야기 하는것이 부담스럽고, 목소리와 발음 훈련이 전혀 안된 사람에게는 유튜브 나레이션은 정말 커다란 벽같이 느껴진다. 

 

이러한 인공지능 전문 나레이션 음성이 많이 필요로 해진 이때,

네이버에서 클로바 더빙이라는 인공지능 문서 읽기 프로그램을 베타 테스트 중이라 하여 한번 사용해 보았다.

 

사용법은 단순하다.

네이버 클로바더빙 사용화면

원하는 문장을 입력하고 (최대 200자까지) 위의 사람 이름 아이콘을 클릭해서 맘에 드는 목소리를 선택하면 된다. 5명의 목소리까지 지원한다는데, 각 문장마다 각기의 다른 음성파일로 저장할 수 있어서, 프로젝트만 바꾸면 현재 제공하는 모든 목소리들을 활용할 수 있을 것 같다.

이번에 주로 “민상”목소리를 선택해봤는데 전형적인 굵고 단정한 나레이션 목소리이다.

 

하루 써보고 나서 느낀 점은

나레이션은 상당히 자연스럽지만, 역시 억양이 단조로워서 긴 영상에는 청자들의 수면에 도움을 줄 것 같다.

아직까지는 사람이 직접 말하는 것이 더 좋은 것 같다.

 

그러나 영상 만들 때 영상 길이를 측정하려면 직접 녹음하는 수고를 해야 하는데,  

그것을 건너뛰고 그냥 문장을 입력해서 음성으로 변환하면 그 길이를 측정할 수 있다.

이것은 많이 편한 것 같다. 나 같은 경우는 말 속도가 워낙에 빨라서 어떤 속도가 적절한지 잘 가늠이 안되는데 적당한 말 속도를 찾을 때 꽤 유용할 것 같다.

 

쉼표를 어디에 찍느냐에 따라 말의 끊고, 이어짐을 조절할 수 있던데, 그 기능은 편리한 것 같다.

 

여러 목소리가 있으나 억양이 자연스러운 목소리는 두 세명 정도고 나머지는 기계음 같다. 아직까지는 자연스러운 억양을 구현할 빅데이터가 모이지 않았나 보다.

 

은근 인공지능 음성으로 1인 제작으로 짧은 애니메이션 단편을 만들어 더빙까지 해볼 기대를 하였으나, 지금 현재로서는 인공지능 음성으로 연기를 하게 하기는 때가 아닌 것 같다.

 

한편으로는 이런 기술들이 점점 발전하면  쓰는 사람에게는 편리하긴 하지만, 뭔가 누군가의 직업을 빼앗는 것 같기도 하다.

 

 어떤 방향이 기계와 인간의 조화롭게 살 수 있는 사회로 가는 방향일지 계속 고민을 해야 하는 문제 같다.

 

 

사용기를 요약하자면

짧은 영상에 내 목소리와 발음에 자신이 없는데 나레이션이 필요할 때

내 목소리가 엄청 민망할 때,

글로 쓴 내 문장이 음성으로 나올 때 어떤 느낌인지 확인하고 싶을 때,

 

쓰면 아주 유용할 것 같다. 올해까지는 무료라고 하니 잘 활용해 봐야겠다.



반응형

댓글