유튜브에서 자동 자막 기능을 써 본 적 있으세요? 아시다시피 음성 인식 기술이 뛰어난 기업으로 단연 구글을 빼놓을 수 없습니다. 구글 음성인식 기능을 번역에 이용하기 포스트에서도 다룬 적이 있는데요, 그런 구글이 안드로이드에서 음성을 텍스트로 바꿔주는 앱 Live Transcribe의 시험판을 내놓았습니다. 백문이 불여일견이니 짧은 영상 하나 보고 가시지요.
잘 보셨나요? 저는 영상을 보다가 좀 울컥했는데요, 영상에서 보신 것처럼 원래 청각 장애인과 난청인을 위하여 개발된 앱입니다. 현재 한국어를 포함하여 언어 70개를 지원하고 있습니다. 안드로이드 사용자는 여기에서 앱을 내려받을 수 있습니다. 한국 스토어에는 “실시간 자막”이라는 이름으로 올라와 있습니다(아쉽지만 iOS용 앱은 없습니다).
앱을 실행하면 바로 받아쓰기를 할 수 있습니다. 인터넷에 연결되어 있어야 하지만 스마트폰 앱임을 감안할 때 큰 단점은 아닙니다. 기본적으로 화면 텍스트가 시원시원해서 읽기 편한 편이지만, 글자 크기를 더 키우거나 더 작게 만들 수도 있습니다.
말소리를 인식하면 오른쪽 상단에 파란색 원이 깜빡깜빡하는데 바깥의 큰 원은 현재 소리 크기이고, 안쪽의 작은 원은 주위 잡음을 뜻한다고 하네요.
다른 옵션은 별로 건드릴 것이 없고 기본 언어만 설정하면 바로 쓰실 수 있습니다.
문장을 몇 마디 말해 보니 인식률도 뛰어나지만 무엇보다 속도가 빠릅니다. 시험삼아 라디오 방송도 틀어 보았는데 생각보다 품질이 괜찮았습니다. 구글이 시연할 때 들려준 예문은 “I am buying a new jersey in New Jersey.”로, 뉴저지 주를 대문자로 정확하게 표현했다고 하는군요.
아직 앱이 초기 버전이기도 하지만, 현재 구술된 내용을 텍스트 파일로 내보내기/복사/붙여넣기하거나 다른 앱과 연동할 수는 없습니다. 구글에서는 앱을 간단하고 쓰기 쉽게 만들기 위해서 저장 옵션을 넣지 않았다고 하지만, 추측하기에 개인정보 이슈도 있었을 것입니다. 향후에는 번역가나 통역가도 큰 도움을 받을 수 있을 것으로 기대합니다. 번역문을 입력할 때도 보탬이 되겠지만, transcription을 해야 하는 영상/음성 번역 같은 작업에 특히 조력을 받을 수 있을 것 같습니다. Live Transcribe에 대해 더 자세한 정보는 여기를 참조해 주십시오.